Yolo 비전 선전
선전
지금 참여하기
용어집

바운딩 박스

바운딩 박스가 객체 탐지, AI 및 머신러닝 시스템을 어떻게 활성화하는지 알아보세요. 컴퓨터 비전 애플리케이션에서의 역할에 대해 살펴보세요!

바운딩 박스는 좌표로 정의된 직사각형 영역으로, 이미지 또는 프레임 내의 특정 피처나 객체를 격리하는 좌표로 정의된 직사각형 영역입니다. 컴퓨터 비전의 영역에서 컴퓨터 비전 영역에서 이 어노테이션은 고유한 개체를 로컬라이즈하는 기본 단위로 사용되며, 이를 통해 인공 지능(AI) 시스템이 "아이템이 장면에 존재한다는 사실만 아는 것이 아니라 그 위치를 '파악'할 수 있게 해줍니다. 주로 활용되는 분야 오브젝트 감지 작업, 경계 상자 윤곽선 자동차, 사람, 제품 등 대상의 공간적 범위를 나타내며 일반적으로 클래스 레이블 및 모델의 확실성을 나타내는 신뢰도 점수와 연관됩니다.

좌표계 및 형식

머신 러닝(ML) 모델이 시각 데이터를 수학적으로 처리할 수 있도록 시각적 데이터를 수학적으로 처리할 수 있도록 특정 좌표계를 사용하여 경계 상자를 표현합니다. 어떤 형식의 선택은 종종 학습에 사용되는 데이터 세트 또는 탐지 아키텍처의 탐지 아키텍처의 특정 요구 사항에 따라 달라집니다.

  • XYXY(모서리 좌표): 이 형식은 왼쪽 상단 모서리($x1, y1$)과 오른쪽 하단 모서리($x2, y2$)의 절대 픽셀 값을 사용합니다. 매우 직관적이며 시각화 라이브러리에서 자주 사용됩니다. 에서 자주 사용됩니다. Matplotlib 와 같은 시각화 라이브러리에서 자주 사용됩니다.
  • XYWH(중앙 크기): 대중화된 COCO 데이터 세트에 의해 대중화된 이 표현은 객체의 중심점($x_center 개체의 중심점($x_center, y_center$)과 상자의 너비 및 높이를 지정합니다. 이 형식은 모델 학습 중 손실 함수를 계산하는 데 손실 함수를 계산하는 데 중요합니다.
  • 정규화된 좌표: 다양한 이미지 해상도에서 다양한 이미지 해상도에서의 확장성을 보장합니다, 좌표는 종종 이미지 치수를 기준으로 0과 1 사이의 범위로 정규화됩니다. 이를 통해 모델은 다음과 같은 이점을 얻을 수 있습니다. 다양한 크기의 입력을 처리할 때 더 잘 일반화할 수 있습니다.

바운딩 박스의 유형

표준 직사각형 상자는 많은 시나리오에 적합하지만 복잡한 실제 환경에서는 때때로 더 특수한 특수한 모양이 필요할 때가 있습니다.

  • 축 정렬 바운딩 상자(AABB): 가장자리가 이미지 축(세로 및 가로)과 평행한 표준 상자입니다. 이미지 축(세로 및 가로)과 평행한 표준 박스입니다. 계산 효율이 높으며 고속 모델의 기본 출력입니다. 모델의 기본 출력입니다. YOLO11.
  • 오리엔티드 바운딩 박스(OBB): 항구의 배나 문서의 텍스트와 같이 개체가 회전하거나 얇거나 서로 가깝게 밀집되어 있는 경우 항구의 배나 문서의 텍스트와 같이 물체가 회전하거나 얇거나 밀집되어 있는 경우 표준 상자에는 배경 노이즈가 너무 많이 포함될 수 있습니다. An 방향 바운딩 상자에는 추가 각도 매개변수가 포함되어 있습니다, 직사각형이 회전하여 개체에 꼭 맞도록 할 수 있습니다. 이는 다음과 같은 정밀한 작업에 필수적입니다. 위성 이미지 분석.

실제 애플리케이션

바운딩 박스는 다양한 산업 분야에서 정교한 의사 결정 시스템을 위한 기본 요소로 작동합니다.

  1. 자율주행 차량: 자율 주행 기술은 바운딩 박스에 크게 의존합니다. 공간 인식을 유지합니다. 보행자, 신호등, 다른 차량 주변에 상자를 그려서 시스템은 거리와 궤적을 추정하여 충돌을 방지합니다. 충돌을 방지합니다. 이에 대한 자세한 내용은 다음 개요에서 살펴볼 수 있습니다. 자동차 분야의 AI.
  2. 소매 및 재고 관리: 스마트 스토어는 바운딩 박스를 사용하여 진열대에 있는 제품을 track . 시스템은 품절된 상품을 식별하거나 카트에 있는 제품을 현지화하여 결제 프로세스를 자동화할 수 있습니다. 이는 효율성을 개선하고 최신 소매업 솔루션의 리테일 솔루션의 핵심 요소입니다.

바운딩 박스 대 세분화

바운딩 박스는 이미지 분할과 이미지 분할과 구별하는 것이 중요합니다. 세분화 수준을 해결하기 때문에 구분하는 것이 중요합니다.

  • 바운딩 박스: 대략적인 위치 정보를 제공합니다. 객체를 상자로 둘러싸서 대략적인 위치를 알려줍니다. 대략적인 위치를 알려줍니다. 주석 달기가 더 빠르고 계산 비용이 저렴합니다. 실시간 추론.
  • 인스턴스 세분화: 개체의 정확한 모양을 윤곽을 그리는 픽셀 단위의 완벽한 마스크를 만듭니다. 더 정확하지만 세분화는 계산 집약적입니다. 다음과 같은 애플리케이션에 적합합니다. 정확한 종양 경계가 중요한 의료 이미지 분석 의료 이미지 분석과 같은 애플리케이션의 경우, 단순한 경계 상자보다 세분화가 선호되는 경우가 많습니다.

Python 사용한 실제 예제

다음 스니펫은 다음을 사용하는 방법을 보여줍니다. ultralytics 라이브러리를 사용하여 바운딩 박스를 생성합니다. 미리 학습된 사전 학습된 YOLO11 모델링하고 감지된 객체의 좌표 데이터를 좌표 데이터를 인쇄합니다.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")

# Access the bounding box coordinates (xyxy format) for the first detection
box = results[0].boxes[0]
print(f"Object Class: {box.cls}")
print(f"Coordinates: {box.xyxy}")

이러한 예측의 정확도는 일반적으로 다음과 같은 메트릭을 사용하여 평가됩니다. 교차점 오버 유니온(IoU)이라는 메트릭을 사용하여 평가합니다. 예측된 상자와 사람이 라벨러에게 제공한 중첩을 측정하는 지표로 평가합니다. 높은 IoU 점수가 높으면 모델이 개체를 올바르게 로컬라이즈했음을 나타냅니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기