용어집

바운딩 박스

컴퓨터 비전에서 바운딩 박스가 객체 위치를 정의하는 방식을 알아보세요. 좌표 형식, 실제 적용 사례, 그리고 Ultralytics 사용법을 탐구해 보세요.

바운딩 박스는 이미지 또는 비디오 프레임 내에서 특정 객체를 둘러싸는 좌표 집합으로 정의된 직사각형 영역입니다. 컴퓨터 비전(CV) 분야에서 이러한 박스는 인공지능(AI) 시스템이 개별 항목을 찾아 인식하는 방법을 가르치는 기본 주석 역할을 합니다. 단순히 전체 이미지를 "자동차가 포함된" 것으로 분류하는 대신, 바운딩 박스는 모델이 자동차의 정확한 위치와 공간적 범위를 특정하여 배경 및 다른 개체들과 분리할 수 있게 합니다. 이러한 위치 지정 능력은 높은 정밀도로 여러 개체를 동시에 식별하는 것을 목표로 하는 객체 탐지 작업에 필수적입니다.

핵심 개념과 좌표계

시각적 데이터를 효과적으로 처리하기 위해 머신 러닝(ML) 모델은 경계 상자를 수학적으로 표현하기 위한 특정 좌표계에 의존합니다. 선택된 형식은 종종 모델 훈련을 위한 데이터 준비 방식과 모델이 예측 결과를 출력하는 방식을 결정합니다.

XYXY 좌표: 이 형식은 상단 좌측 모서리와 하단 우측 모서리의 절대 픽셀 값을 사용하여 상자를 정의합니다. 이는 OpenCV 이나 Matplotlib 이미지에 직접 사각형을 그릴 때 직관적입니다.
XYWH 형식: 다음과 같은 데이터 세트에서 흔히 사용됨 COCO와 같은 데이터셋에서 흔히 사용되는 이 방법은 객체의 중심점을 먼저 명시한 후 상자의 너비와 높이를 순서대로 기록합니다. 이 표현 방식은 학습 과정 중 손실 함수를 계산하는 데 매우 중요합니다.
정규화된 좌표: 서로 다른 해상도의 이미지 간 확장성을 보장하기 위해 좌표는 종종 0과 1 사이의 범위로 스케일링됩니다. 이는 모델이 다양한 차원의 입력을 분석할 때 더 잘 일반화하는 데 도움이 됩니다.

실제 애플리케이션

바운딩 박스는 다양한 산업 분야의 수많은 AI 솔루션의 핵심 구성 요소입니다. 정밀한 위치 파악을 가능하게 함으로써 시스템이 물리적 세계와 지능적으로 상호작용할 수 있도록 합니다.

자율주행 차량: 자율주행 차량은 바운딩 박스를 활용해 track , 다른 차량, 교통 표지판, 장애물을 실시간으로 detect track . 이러한 공간 인식 능력은 내비게이션 및 안전 시스템이 순간적인 결정을 내리는 데 필수적입니다.
소매 분석: 스마트 매장에서는 바운딩 박스를 활용해 진열대 재고를 모니터링하고 track 제품 상호작용을 track . 이 데이터는 수동 계수 없이도 재고 보충을 자동화하고 쇼핑객 행동에 대한 통찰력을 제공합니다.