Anchor Boxes

앵커 박스(Anchor Boxes)가 객체 탐지를 위한 참조 템플릿 역할을 하는 방식을 배워 보십시오. 이들이 어떻게 정확도를 향상하는지, 그리고 Ultralytics YOLO26과 같은 모델이 어떻게 앵커 프리 설계를 사용하는지 알아보십시오.

Anchor boxes는 객체 탐지 모델이 객체의 위치를 찾고 분류하는 것을 돕기 위해 이미지 전반에 배치되는, 특정 종횡비와 크기를 가진 미리 정의된 참조 사각형입니다. 신경망이 객체의 크기와 위치를 처음부터 예측하도록 하는 대신(객체 모양의 다양성 때문에 불안정할 수 있음), 모델은 이 고정된 템플릿을 시작점으로 사용합니다. 초기 박스를 ground truth에 맞게 얼마나 조정하거나 "회귀(regress)"할지 학습함으로써, 시스템은 더 빠른 수렴과 더 높은 정확도를 달성할 수 있습니다. 이 기술은 computer vision (CV)의 복잡한 위치 추정 작업을 더 다루기 쉬운 최적화 문제로 단순화함으로써 이 분야를 근본적으로 변화시켰습니다.

Link to this sectionAnchor Boxes의 메커니즘#

기존의 anchor-based detectors에서는 입력 이미지가 셀 그리드로 나뉩니다. 각 셀 위치에서 네트워크는 서로 다른 기하학적 구조를 가진 여러 anchor box를 생성합니다. 예를 들어, 키가 큰 보행자와 폭이 넓은 차량을 동시에 탐지하기 위해 모델은 동일한 중심점에 키가 크고 좁은 박스와 키가 작고 넓은 박스를 제안할 수 있습니다.

model training 중에 이 anchor들은 Intersection over Union (IoU)라는 지표를 사용하여 실제 객체와 매칭됩니다. 라벨링된 객체와 유의미하게 겹치는 anchor는 "양성(positive)" 샘플로 지정됩니다. 그런 다음 네트워크는 두 가지 병렬 작업을 학습합니다.

분류(Classification): anchor에 특정 클래스(예: "개" 또는 "자전거")가 포함될 가능성을 나타내는 확률 점수를 할당합니다. 이는 cross-entropy loss와 같은 표준 supervised learning 목표를 사용합니다.
박스 회귀(Box Regression): 범용 anchor를 정밀하게 맞는 bounding box로 변환하는 데 필요한 정확한 오프셋 값(좌표 이동 및 스케일링 계수)을 계산합니다.

이 접근 방식은 각 객체가 자신의 모양과 가장 잘 일치하는 anchor에 할당될 수 있기 때문에 모델이 서로 가까이 위치한 서로 다른 크기의 여러 객체를 처리할 수 있도록 합니다.

Link to this section실제 애플리케이션 사례#

더 새로운 아키텍처들은 anchor-free 설계로 이동하고 있지만, anchor boxes는 객체 특성이 예측 가능한 많은 기존 프로덕션 시스템에서 여전히 중요합니다.

소매 및 재고 관리: AI-driven retail solutions에서 카메라는 선반 재고를 모니터링합니다. 시리얼 박스나 탄산음료 캔과 같은 제품은 표준화된 치수를 가지므로, anchor boxes를 이러한 특정 종횡비에 맞게 조정할 수 있습니다. 이러한 사전 지식은 복잡한 환경에서도 모델이 높은 recall을 유지하도록 돕습니다.
자율 주행: autonomous vehicles의 인식 스택은 보행자, 차량 및 교통 표지판을 탐지하는 데 의존합니다. 멀리서 보이는 차량은 도로에 비해 상대적으로 일관된 모양 프로필을 가지므로, 이러한 모양에 맞춰 조정된 anchor를 사용하면 강력한 object tracking과 거리 추정이 가능합니다.

Link to this sectionAnchor-Based vs. Anchor-Free#

전통적인 anchor-based 방식과 현대의 anchor-free detectors를 구별하는 것이 중요합니다.

Anchor-Based: 오리지널 Faster R-CNN이나 초기 YOLO 버전(예: YOLOv5)과 같은 모델들은 이러한 미리 정의된 템플릿을 사용합니다. 이들은 강력하지만 종종 새로운 데이터셋에 적응하기 위해 하이퍼파라미터(anchor 크기/비율)를 수동으로 튜닝하거나 k-means clustering과 같은 클러스터링 알고리즘이 필요합니다.
Anchor-Free: YOLO26을 포함한 고급 모델들은 종종 anchor-free 또는 end-to-end 접근 방식을 사용합니다. 이러한 네트워크는 객체 중심이나 키포인트를 직접 예측하여 수동 anchor 구성의 필요성을 제거합니다. 이는 아키텍처를 단순화하고 수천 개의 빈 배경 anchor를 처리하는 데 필요한 계산을 없애 inference 속도를 높입니다.

Link to this section예시: Anchor 정보 액세스하기#

Ultralytics Platform과 같은 현대의 고수준 API는 학습 중에 이러한 세부 사항을 추상화하지만, 이전 모델 아키텍처로 작업하거나 모델 구성 파일을 분석할 때는 anchor를 이해하는 것이 유용합니다. 다음 코드 스니펫은 모델을 로드하고 해당 구성(존재하는 경우 anchor 설정이 정의되는 곳)을 검사하는 방법을 보여줍니다.

from ultralytics import YOLO

# Load a pre-trained YOLO model (YOLO26 is anchor-free, but legacy configs act similarly)
model = YOLO("yolo26n.pt")

# Inspect the model's stride, which relates to grid cell sizing in detection
print(f"Model strides: {model.model.stride}")

# For older anchor-based models, anchors might be stored in the model's attributes
# Modern anchor-free models calculate targets dynamically without fixed boxes
if hasattr(model.model, "anchors"):
    print(f"Anchors: {model.model.anchors}")
else:
    print("This model architecture is anchor-free.")

Link to this section과제 및 고려 사항#

효과적이기는 하지만, anchor boxes는 복잡성을 초래합니다. 생성되는 방대한 수의 anchor(이미지당 수만 개)는 대부분의 anchor가 배경만 포함하기 때문에 클래스 불균형 문제를 야기합니다. Focal Loss와 같은 기술은 쉬운 배경 예제의 가중치를 낮춤으로써 이를 완화하는 데 사용됩니다. 또한, 최종 출력은 일반적으로 중복되는 박스를 필터링하여 각 객체에 대해 가장 신뢰도가 높은 탐지 결과만 남도록 Non-Maximum Suppression (NMS)가 필요합니다.

Explore solutions

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

Anchor Boxes

Link to this sectionAnchor Boxes의 메커니즘#

Link to this section실제 애플리케이션 사례#

Link to this sectionAnchor-Based vs. Anchor-Free#

Link to this section예시: Anchor 정보 액세스하기#

Link to this section과제 및 고려 사항#

Explore solutions

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

미래의 AI를 함께 구축합시다!