YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

바운딩 박스

바운딩 박스가 객체 탐지, AI 및 머신러닝 시스템을 어떻게 활성화하는지 알아보세요. 컴퓨터 비전 애플리케이션에서의 역할에 대해 살펴보세요!

바운딩 박스는 컴퓨터 비전에서 이미지 또는 비디오 프레임 내 객체의 위치를 나타내는 데 사용되는 직사각형 주석입니다. 이는 객체 탐지의 기본 구성 요소 역할을 하며 객체의 위치와 크기를 정의하는 간단하면서도 효과적인 방법을 제공합니다. 머신러닝에서 모델은 객체를 스스로 식별하고 지역화하는 방법을 학습하기 위해 레이블이 지정된 바운딩 박스가 있는 대규모 데이터 세트에서 훈련됩니다. 이러한 모델의 출력에는 상자의 좌표, 클래스 레이블(예: "자동차", "사람") 및 모델의 예측에 대한 확신도를 나타내는 신뢰도 점수가 포함됩니다.

바운딩 박스 작동 방식

바운딩 박스는 일반적으로 위치와 크기를 지정하는 좌표 집합으로 정의됩니다. 가장 일반적인 표현은 다음과 같습니다.

  • 좌상단 좌표와 너비 및 높이 (x, y, w, h): 이 형식은 좌상단 모서리의 x 및 y 좌표와 상자의 너비 및 높이를 지정합니다.
  • 코너 포인트 (x_min, y_min, x_max, y_max): 이 형식은 사각형의 왼쪽 상단과 오른쪽 하단 모서리의 좌표를 정의합니다.

이러한 좌표는 새로운 미지의 이미지에 대해 이러한 값을 예측하는 방법을 학습하는 딥 러닝 모델을 훈련하는 데 사용됩니다. 예측된 바운딩 박스의 정확도는 예측된 박스와 실제 박스 간의 겹침을 측정하는 IoU(Intersection over Union)라는 메트릭을 사용하여 평가되는 경우가 많습니다. Ultralytics YOLO11과 같은 최신 객체 감지 모델은 실시간으로 정확한 바운딩 박스를 생성하도록 고도로 최적화되어 있습니다.

바운딩 박스의 유형

바운딩 박스에는 두 가지 주요 유형이 있습니다.

  1. 축 정렬 경계 상자: 이것은 가장 일반적인 유형으로, 직사각형의 변이 이미지의 가로 및 세로 축에 정렬됩니다. 표현하고 처리하기는 간단하지만 회전하거나 불규칙한 모양의 객체에는 비효율적일 수 있습니다. 상자에 상당한 배경 영역이 포함될 수 있기 때문입니다.
  2. Oriented Bounding Box (OBB): 이 유형의 박스에는 회전을 위한 추가 파라미터가 포함되어 있어 기울어진 객체에 더 잘 맞도록 합니다. OBB는 객체가 다양한 각도에서 보이는 경우가 많은 위성 이미지 분석 또는 드론의 항공 이미지와 같은 특수 애플리케이션에서 특히 유용합니다. YOLO11과 같은 모델은 이러한 시나리오를 보다 효과적으로 처리하기 위해 방향 객체 감지를 지원합니다.

다른 개념과의 관계

바운딩 박스는 다른 컴퓨터 비전 작업과 밀접하게 관련되어 있지만, 뚜렷한 목적을 수행합니다.

  • 객체 감지 vs. 이미지 분할: 객체 감지는 경계 상자를 사용하여 객체의 위치를 ​​찾는 반면, 이미지 분할은 객체의 모양에 대한 더 자세한 이해를 제공합니다. 예를 들어 인스턴스 분할은 객체 주위에 사각형을 그리는 대신 각 개별 객체의 정확한 픽셀 수준 경계를 윤곽선으로 표시하여 한 단계 더 나아갑니다. 이는 정확한 모양 정보가 필요한 애플리케이션에 유용합니다. 자세한 내용은 인스턴스 분할 가이드에서 확인할 수 있습니다.
  • 바운딩 박스 vs. 앵커 박스(Bounding Box vs. Anchor Box): 일부 객체 탐지 모델(앵커 기반 탐지기라고 함)에서는 모델이 최종 바운딩 박스를 예측하는 데 도움을 주기 위해 "앵커 박스"라는 미리 정의된 박스를 참조로 사용합니다. 반면, 앵커 프리 탐지기는 이러한 사전 설정 없이 바운딩 박스를 직접 예측하므로 모델 아키텍처가 단순화되는 경우가 많습니다.

실제 시나리오에서의 응용

바운딩 박스는 수많은 실용적인 AI 애플리케이션에 필수적입니다.

  1. 자율 주행 차량: 자율 주행 자동차는 경계 상자를 사용하여 보행자, 다른 차량 및 신호등을 식별하고 찾기 위해 객체 탐지에 크게 의존합니다. 딥러닝 모델을 통해 종종 달성되는 이러한 공간 인식은 안전한 탐색에 매우 중요합니다. Waymo와 같은 회사는 이 기술을 광범위하게 선보입니다. Ultralytics는 자율 주행 자동차의 AI에 대한 통찰력을 제공합니다.
  2. 소매 분석: 소매업에서 경계 상자는 선반의 제품을 감지하고, 재고 수준을 모니터링하고, 보행자 통행 패턴(객체 수)을 통해 고객 행동을 분석하여 AI 기반 재고 관리에 도움이 됩니다.
  3. 보안 및 감시: 경계 상자를 통해 자동화된 모니터링 시스템은 실시간으로 개인 또는 객체를 감지하고 추적하여 의심스러운 활동에 대한 경고를 트리거할 수 있습니다. 이는 보안 경보 시스템과 같은 애플리케이션을 구축하는 데 기본이 됩니다.
  4. 의료 영상 분석: 헬스케어 분야에서 경계 상자는 스캔에서 종양과 같은 잠재적 이상 징후를 강조 표시하여 임상의를 지원하여 더 빠른 진단을 돕습니다. 방사선학: 인공 지능 연구 및 당사의 의료 영상 분석 페이지에서 이에 대한 예시를 볼 수 있습니다.
  5. 농업: 바운딩 박스는 정밀 농업에서 수확할 과일 식별, 작물 상태 모니터링 또는 해충 감지와 같은 작업에 사용되며, 이에 대한 자세한 내용은 농업 분야의 컴퓨터 비전에 대한 블로그에서 확인할 수 있습니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.