Yolo 비전 선전
선전
지금 참여하기
용어집

바운딩 박스

바운딩 박스가 객체 탐지, AI 및 머신러닝 시스템을 어떻게 활성화하는지 알아보세요. 컴퓨터 비전 애플리케이션에서의 역할에 대해 살펴보세요!

바운딩 박스는 이미지 또는 비디오 프레임 내에서 특정 객체를 둘러싸는 좌표 집합으로 정의된 직사각형 영역입니다. 컴퓨터 비전(CV) 분야에서 이러한 박스는 인공지능(AI) 시스템이 개별 항목을 찾아 인식하는 방법을 가르치는 기본 주석 역할을 합니다. 단순히 전체 이미지를 "자동차가 포함된" 것으로 분류하는 대신, 바운딩 박스는 모델이 자동차의 정확한 위치와 공간적 범위를 특정하여 배경 및 다른 개체들과 분리할 수 있게 합니다. 이러한 위치 지정 능력은 높은 정밀도로 여러 개체를 동시에 식별하는 것을 목표로 하는 객체 탐지 작업에 필수적입니다.

핵심 개념과 좌표계

시각적 데이터를 효과적으로 처리하기 위해 머신 러닝(ML) 모델은 경계 상자를 수학적으로 표현하기 위한 특정 좌표계에 의존합니다. 선택된 형식은 종종 모델 훈련을 위한 데이터 준비 방식과 모델이 예측 결과를 출력하는 방식을 결정합니다.

  • XYXY 좌표: 이 형식은 상단 좌측 모서리와 하단 우측 모서리의 절대 픽셀 값을 사용하여 상자를 정의합니다. 이는 OpenCV 이나 Matplotlib 이미지에 직접 사각형을 그릴 때 직관적입니다.
  • XYWH 형식: 다음과 같은 데이터 세트에서 흔히 사용됨 COCO와 같은 데이터셋에서 흔히 사용되는 이 방법은 객체의 중심점을 먼저 명시한 후 상자의 너비와 높이를 순서대로 기록합니다. 이 표현 방식은 학습 과정 중 손실 함수를 계산하는 데 매우 중요합니다.
  • 정규화된 좌표: 서로 다른 해상도의 이미지 간 확장성을 보장하기 위해 좌표는 종종 0과 1 사이의 범위로 스케일링됩니다. 이는 모델이 다양한 차원의 입력을 분석할 때 더 잘 일반화하는 데 도움이 됩니다.

실제 애플리케이션

바운딩 박스는 다양한 산업 분야의 수많은 AI 솔루션의 핵심 구성 요소입니다. 정밀한 위치 파악을 가능하게 함으로써 시스템이 물리적 세계와 지능적으로 상호작용할 수 있도록 합니다.

  • 자율주행 차량: 자율주행 차량은 바운딩 박스를 활용해 track , 다른 차량, 교통 표지판, 장애물을 실시간으로 detect track . 이러한 공간 인식 능력은 내비게이션 및 안전 시스템이 순간적인 결정을 내리는 데 필수적입니다.
  • 소매 분석: 스마트 매장에서는 바운딩 박스를 활용해 진열대 재고를 모니터링하고 track 제품 상호작용을 track . 이 데이터는 수동 계수 없이도 재고 보충을 자동화하고 쇼핑객 행동에 대한 통찰력을 제공합니다.

바운딩 박스의 실제 적용

현대적인 아키텍처(예: YOLO26모델은 바운딩 박스와 함께 클래스 라벨 및 신뢰 점수다음 예제는 이미지를 대상으로 추론을 실행하고 경계 상자 좌표를 활용하는 방법을 보여줍니다. ultralytics 패키지입니다.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Access bounding box coordinates (xyxy format) for the first detected object
boxes = results[0].boxes
print(boxes.xyxy[0])  # Output: tensor([x1, y1, x2, y2, ...])

관련 용어 및 차별화

바운딩 박스는 일반적인 탐지에 표준으로 사용되지만, 더 세분화된 작업에 사용되는 다른 주석 유형과는 구별됩니다.

  • 인스턴스 분할: 사각형 경계 상자와 달리, 분할은 객체의 정확한 윤곽을 따라가는 픽셀 단위의 완벽한 마스크를 생성합니다. 이는 일반적인 위치보다 정확한 형태가 더 중요할 때 유용합니다.
  • 방향성 경계 상자(OBB): 표준 경계 상자는 축에 정렬된(수직 직사각형) 형태입니다. OBB는 위성 이미지의 선박이나 컨베이어 벨트 위의 소포처럼 각진 물체에 맞춰 회전할 수 있어 더 밀착된 경계 처리가 가능하며 배경 잡음을 줄여줍니다.
  • 주요 관점: 객체를 둘러싸는 대신, 주요 관점은 자세 추정을 위한 인체의 관절과 같은 특정 지점을 식별합니다.

주석 및 관리 도구

고품질 바운딩 박스 어노테이션 생성은 머신러닝 파이프라인의 핵심 단계입니다. Ultralytics 데이터 어노테이션 및 데이터셋 관리 도구를 제공하여 이 과정을 간소화합니다. 적절한 어노테이션은 모델이 객체를 정확히 구분하도록 학습시켜 과적합이나 배경 혼동과 같은 오류를 최소화합니다. 추론 단계에서는 비최대 억제(NMS) 와 같은 고급 기법을 활용하여 중복되는 박스를 제거함으로써 예측을 정제합니다. 이를 통해 각 객체에 대해 가장 정확한 탐지 결과만 남겨집니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기