용어집

바운딩 박스

바운딩 박스가 물체 감지, AI 및 머신 러닝 시스템을 어떻게 지원하는지 알아보세요. 컴퓨터 비전 애플리케이션에서 바운딩 박스의 역할을 살펴보세요!

바운딩 박스는 컴퓨터 비전에서 이미지 또는 비디오 프레임 내에서 객체의 위치를 표시하는 데 사용되는 직사각형 주석입니다. 객체 감지의 기본 구성 요소로, 객체의 위치와 크기를 정의하는 간단하면서도 효과적인 방법을 제공합니다. 머신 러닝에서 모델은 레이블이 지정된 경계 상자가 있는 대규모 이미지 데이터 세트를 학습하여 스스로 물체를 식별하고 위치를 파악하는 방법을 학습합니다. 이러한 모델의 출력에는 상자의 좌표, 클래스 레이블(예: '자동차', '사람'), 모델의 예측 정확도를 나타내는 신뢰도 점수가 포함됩니다.

바운딩 박스 작동 방식

바운딩 박스는 일반적으로 위치와 크기를 지정하는 좌표 집합으로 정의됩니다. 가장 일반적인 표현은 다음과 같습니다:

  • 너비 및 높이가 포함된 왼쪽 상단 좌표(x, y, w, h): 이 형식은 상자의 너비 및 높이와 함께 왼쪽 상단 모서리의 x 및 y 좌표를 지정합니다.
  • 모서리 점(x_min, y_min, x_max, y_max): 이 형식은 직사각형의 왼쪽 상단과 오른쪽 하단 모서리의 좌표를 정의합니다.

이러한 좌표는 보이지 않는 새로운 이미지에 대해 이러한 값을 예측하는 방법을 학습하는 딥 러닝 모델을 훈련하는 데 사용됩니다. 예측된 경계 상자의 정확도는 종종 예측된 상자와 기준값 상자 사이의 중첩을 측정하는 IoU(Intersection over Union)라는 메트릭을 사용하여 평가됩니다. 최신 객체 감지 모델인 Ultralytics YOLO11은 실시간으로 정확한 바운딩 박스를 생성하도록 고도로 최적화되어 있습니다.

바운딩 박스 유형

바운딩 박스에는 크게 두 가지 유형이 있습니다:

  1. 축 정렬 바운딩 상자: 가장 일반적인 유형으로, 직사각형의 측면이 이미지의 가로 및 세로 축에 정렬됩니다. 표현과 처리가 간단하지만 상자에 상당한 배경 영역이 포함될 수 있으므로 회전하거나 모양이 불규칙한 객체에는 비효율적일 수 있습니다.
  2. 오리엔티드 바운딩 박스(OBB): 이 유형의 상자에는 회전을 위한 추가 매개변수가 포함되어 있어 기울어진 물체 주위에 더 잘 맞출 수 있습니다. OBB는 위성 이미지 분석이나 드론의 항공 이미지와 같이 물체를 다양한 각도에서 보는 경우가 많은 특수한 애플리케이션에서 특히 유용합니다. YOLO11과 같은 모델은 이러한 시나리오를 보다 효과적으로 처리하기 위해 방향성 물체 감지를 지원합니다.

다른 개념과의 관계

바운딩 박스는 다른 컴퓨터 비전 작업과 밀접한 관련이 있지만 뚜렷한 목적을 가지고 있습니다.

  • 객체 감지 대 이미지 분할: 객체 감지는 경계 상자를 사용하여 객체의 위치를 찾는 반면, 이미지 분할은 객체의 모양을 더 자세히 파악할 수 있습니다. 예를 들어 인스턴스 분할은 객체 주위에 직사각형을 그리는 것이 아니라 각 개별 객체의 정확한 픽셀 수준 경계를 윤곽선으로 그려서 한 단계 더 나아갑니다. 이는 정확한 모양 정보가 필요한 애플리케이션에 유용합니다. 자세한 내용은 인스턴스 세분화에 대한가이드에서 확인할 수 있습니다.
  • 바운딩 박스와 앵커 박스 비교: 앵커 기반 감지기로 알려진 일부 객체 감지 모델에서는 '앵커 박스'라고 하는 사전 정의된 상자를 참조로 사용하여 모델이 최종 경계 상자를 예측하는 데 도움을 줍니다. 반면, 앵커 프리 감지기는 이러한 사전 설정 없이 바운딩 박스를 직접 예측하므로 모델 아키텍처가 단순화되는 경우가 많습니다.

실제 시나리오에서의 애플리케이션

바운딩 박스는 수많은 실용적인 AI 애플리케이션에 필수적인 요소입니다:

  1. 자율주행 차량: 자율 주행 자동차는 바운딩 박스를 사용하여 보행자, 다른 차량, 신호등을 식별하고 위치를 파악하기 위해 물체 감지에 크게 의존합니다. 딥러닝 모델을 통해 구현되는 이러한 공간 인식은 안전한 주행을 위해 매우 중요합니다. Waymo와 같은 회사는 이 기술을 광범위하게 선보이고 있습니다. 울트라 애널리틱스는 자율 주행 차량의 AI에 대한 인사이트를 제공합니다.
  2. 리테일 분석: 소매업에서 바운딩 박스는 진열대에 있는 제품을 감지하고, 재고 수준을 모니터링하며, 유동 인구 패턴(객체 카운팅)을 통해 고객 행동을 분석하여 AI 기반 재고 관리에 도움을 줍니다.
  3. 보안 및 감시: 바운딩 박스를 사용하면 자동화된 모니터링 시스템이 개인이나 사물을 실시간으로 감지하고 추적하여 의심스러운 활동에 대한 경고를 트리거할 수 있습니다. 이는 보안 경보 시스템과 같은 애플리케이션을 구축하는 데 있어 기본이 됩니다.
  4. 의료 이미지 분석: 의료 분야에서 바운딩 박스는 스캔에서 종양과 같은 잠재적인 이상 징후를 강조 표시하여 임상의의 빠른 진단을 돕습니다. 그 예는 방사선과에서 확인할 수 있습니다: 인공 지능 연구와 의료 이미지 분석 페이지에서 그 예를 확인할 수 있습니다.
  5. 농업: 바운딩 박스는 정밀 농업에서 수확할 과일 식별, 작물 건강 모니터링, 해충 탐지 등의 작업에 사용됩니다( 농업에서의 컴퓨터 비전 블로그에 자세히 설명되어 있습니다).

울트라 애널리틱스 커뮤니티 가입

AI의 미래와 함께하세요. 글로벌 혁신가들과 연결, 협업, 성장하기

지금 가입하기
링크가 클립보드에 복사됨