앵커 기반 검출기가 정확한 위치 파악, 스케일 적응성 및 실제 응용을 통해 객체 검출에 어떻게 혁명을 일으키는지 알아보세요.
앵커 기반 검출기는 객체 감지 모델의 기본 클래스로, 컴퓨터 비전에서 널리 사용됩니다. 이러한 모델은 앵커 박스라고 하는 미리 정의된 박스 세트를 사용하여 이미지 내의 객체를 식별하고 위치를 파악합니다. 앵커 박스는 다양한 크기와 종횡비를 가진 템플릿 그리드로서, 이미지 전체에 타일 형태로 배열됩니다. 모델은 이러한 앵커를 이동 및 스케일링하여 객체의 실제 바운딩 박스에 맞추는 방법을 예측하고, 객체의 존재 여부를 나타내는 신뢰도 점수를 함께 예측합니다. 이 접근 방식은 고정된 앵커를 기준으로 회귀 및 분류 작업으로 전환함으로써 객체 찾기 문제를 단순화합니다.
앵커 기반 아키텍처의 주요 예로는 Faster R-CNN과 같은 R-CNN 제품군과 SSD(Single Shot MultiBox Detector)와 같은 초기 단일 단계 감지기 및 매우 성공적인 Ultralytics YOLOv5를 포함한 많은 YOLO 모델이 있습니다.
앵커 기반 감지의 핵심 아이디어는 미리 정의된 참조 상자 세트를 시작점으로 사용하는 것입니다. 모델 훈련 프로세스 동안 감지기는 각 앵커 상자에 대해 두 가지 주요 작업을 수행하는 방법을 학습합니다.
이러한 예측은 백본에 의해 추출된 이미지 특징을 처리한 후 모델의 감지 헤드에 의해 이루어집니다. 단일 객체가 여러 앵커 박스에 의해 감지될 수 있으므로 Non-Maximum Suppression (NMS)라는 후처리 단계를 사용하여 중복 감지를 필터링하고 가장 적합한 박스만 유지합니다. 이러한 모델의 성능은 종종 mean Average Precision (mAP) 및 Intersection over Union (IoU)와 같은 지표를 사용하여 평가됩니다.
최근 몇 년 동안 앵커 프리 검출기가 인기 있는 대안으로 떠올랐습니다. 앵커 기반 모델과 달리 앵커 프리 접근 방식은 객체 위치와 크기를 직접 예측하며, 종종 객체 중심이나 모서리와 같은 주요 지점을 식별하거나 점에서 객체 경계까지의 거리를 예측하여 미리 정의된 앵커 모양이 필요하지 않습니다.
주요 차이점은 다음과 같습니다.
YOLOv4와 같은 앵커 기반 감지기가 매우 성공적이었지만, Ultralytics YOLO11을 포함한 많은 최신 아키텍처는 단순성과 효율성 측면에서 이점을 활용하기 위해 앵커 프리 설계를 채택했습니다. YOLO11에서 앵커 프리 감지의 장점을 살펴보고 다양한 YOLO 모델 간의 비교를 확인할 수 있습니다.
앵커 기반 검출기는 객체의 모양과 크기가 비교적 표준적인 다양한 애플리케이션에서 널리 사용됩니다.
앵커 기반 또는 앵커 프리 객체 감지 모델을 개발하고 배포하는 데에는 PyTorch 또는 TensorFlow와 같은 프레임워크와 OpenCV와 같은 라이브러리를 사용하는 것이 포함됩니다. Ultralytics HUB와 같은 플랫폼은 다양한 모델 아키텍처를 지원하면서 사용자 정의 모델 학습, 데이터 세트 관리 및 솔루션 배포를 위한 간소화된 워크플로를 제공합니다. 추가 학습을 위해 Papers With Code와 같은 리소스는 최첨단 모델을 나열하고 DeepLearning.AI와 같은 플랫폼의 과정은 기본 개념을 다룹니다.