앵커 기반 감지기가 정밀한 위치 파악, 확장 적응성 및 실제 애플리케이션을 통해 물체 감지를 혁신하는 방법을 알아보세요.
앵커 기반 감지기는 컴퓨터 비전에서 객체 감지 모델의 기본 클래스입니다. 이 모델은 앵커 박스라고 하는 사전 정의된 상자 집합을 사용하여 이미지 내의 객체를 식별하고 위치를 파악하는 방식으로 작동합니다. 앵커 박스는 기본적으로 이미지 전체에 타일처럼 배열된 다양한 크기와 화면 비율의 템플릿 그리드입니다. 이 모델은 물체의 존재 여부를 나타내는 신뢰도 점수와 함께 물체의 실측 경계 상자와 일치하도록 이러한 앵커를 이동하고 크기를 조정하는 방법을 예측합니다. 이 접근 방식은 이러한 고정 앵커를 기준으로 회귀 및 분류 작업으로 전환하여 물체를 찾는 문제를 단순화합니다.
앵커 기반 아키텍처의 대표적인 예로는 Faster R-CNN과 같은 R-CNN 제품군과 SSD(싱글 샷 멀티박스 검출기)와 같은 초기 단일 단계 검출기, 그리고 매우 성공적인 Ultralytics YOLOv5를 비롯한 많은 YOLO 모델이 있습니다.
앵커 기반 탐지의 핵심 아이디어는 미리 정의된 기준 상자 세트를 시작점으로 사용하는 것입니다. 모델 훈련 과정에서 탐지기는 각 앵커 박스에 대해 두 가지 주요 작업을 수행하는 방법을 학습합니다:
이러한 예측은 백본에서 추출한 이미지 특징을 처리한 후 모델의 감지 헤드에서 이루어집니다. 하나의 객체가 여러 개의 앵커 박스에 의해 감지될 수 있으므로, 중복 감지를 필터링하고 가장 잘 맞는 박스만 유지하기 위해 비최대 억제(NMS) 라는 후처리 단계가 사용됩니다. 이러한 모델의 성능은 평균 평균 정밀도(mAP) 및 교집합(IoU) 같은 메트릭을 사용하여 평가하는 경우가 많습니다.
최근에는 앵커가 필요 없는 감지기가 인기 있는 대안으로 떠오르고 있습니다. 앵커 기반 모델과 달리 앵커 프리 접근 방식은 물체의 중심이나 모서리와 같은 주요 지점을 식별하거나 한 지점에서 물체의 경계까지의 거리를 예측하여 미리 정의된 앵커 모양이 필요 없는 방식으로 물체의 위치와 크기를 직접 예측합니다.
주요 차이점은 다음과 같습니다:
YOLOv4와 같은 앵커 기반 탐지기는 매우 성공적이었지만, Ultralytics YOLO11을 비롯한 많은 최신 아키텍처는 단순성과 효율성에서 이점을 활용하기 위해 앵커 프리 설계를 채택했습니다. YOLO11에서 앵커 프리 감지의 장점을 살펴보고 다양한 YOLO 모델 간의 비교를 확인할 수 있습니다.
앵커 기반 감지기는 물체의 모양과 크기가 비교적 표준적인 다양한 애플리케이션에서 널리 사용됩니다.
앵커 기반이든 앵커가 없든 객체 감지 모델을 개발하고 배포하려면 PyTorch 또는 TensorFlow와 같은 프레임워크와 OpenCV와 같은 라이브러리를 사용해야 합니다. Ultralytics HUB와 같은 플랫폼은 다양한 모델 아키텍처를 지원하면서 사용자 지정 모델을 훈련하고, 데이터 세트를 관리하고, 솔루션을 배포하기 위한 간소화된 워크플로를 제공합니다. 추가 학습을 위해 Papers With Code와 같은 리소스에는 최신 모델이 나열되어 있으며, DeepLearning.AI와 같은 플랫폼의 강좌에서는 기본 개념을 다룹니다.