Ultralytics YOLO11이 앵커 프리 탐지기라는 점의 이점
Ultralytics YOLO11이 어떻게 앵커 프리(anchor-free) 객체 탐지를 지원하는지, 그리고 이 모델 아키텍처가 다양한 애플리케이션에 어떤 이점을 가져오는지 이해해 보십시오.

Vision AI 모델의 역사를 되돌아보면, 이미지나 비디오 내 객체를 식별하고 위치를 파악하는 핵심 컴퓨터 비전 작업인 객체 탐지의 개념은 1960년대부터 존재해 왔습니다. 그러나 오늘날 최첨단 혁신에서 객체 탐지가 중요한 핵심 이유는 그 이후로 객체 탐지 기술과 모델 아키텍처가 빠르게 발전하고 개선되어 왔기 때문입니다.
이전 기사에서는 객체 탐지의 진화와 Ultralytics YOLO 모델에 이르게 된 과정을 논의했습니다. 오늘은 이 여정에서 더 구체적인 이정표인 앵커 기반 탐지기에서 앵커 프리 탐지기로의 전환에 초점을 맞춰 살펴보고자 합니다.
앵커 기반 탐지기는 '앵커(anchors)'라고 불리는 미리 정의된 박스에 의존하여 이미지 내 객체의 위치를 예측합니다. 반면 앵커 프리 탐지기는 이러한 미리 정의된 박스를 건너뛰고 대신 객체 위치를 직접 예측합니다.
이러한 전환은 간단하고 논리적인 변화처럼 보일 수 있지만, 실제로는 객체 탐지 정확도와 효율성에서 큰 개선을 가져왔습니다. 본 기사에서는 Ultralytics YOLO11과 같은 발전을 통해 앵커 프리 탐지기가 어떻게 컴퓨터 비전을 재구성했는지 알아보겠습니다.
Link to this section앵커 기반 탐지기란 무엇입니까?#
앵커 기반 탐지기는 앵커라고 알려진 미리 정의된 박스를 사용하여 이미지 내 객체 위치를 찾는 데 도움을 줍니다. 이러한 앵커를 이미지 위에 배치된 다양한 크기와 모양의 박스 그리드라고 생각하면 됩니다. 모델은 이후 탐지하는 객체에 맞게 이 박스들을 조정합니다. 예를 들어 모델이 자동차를 식별하면, 자동차의 위치와 크기에 더 정확하게 맞도록 앵커 박스를 수정합니다.
각 앵커는 이미지 내의 잠재적 객체와 연관되며, 학습 과정 중에 모델은 객체의 위치, 크기, 종횡비에 더 잘 맞도록 앵커 박스를 조정하는 방법을 배웁니다. 이를 통해 모델은 다양한 스케일과 방향에서 객체를 탐지할 수 있습니다. 그러나 올바른 앵커 박스 세트를 선택하는 것은 시간이 많이 걸릴 수 있으며, 이를 미세 조정하는 과정은 오류가 발생하기 쉽습니다.

그림 1. 앵커 박스란 무엇인가?
YOLOv4와 같은 앵커 기반 탐지기는 많은 응용 분야에서 잘 작동했지만, 몇 가지 단점이 있습니다. 예를 들어 앵커 박스가 다양한 모양이나 크기의 객체와 항상 잘 정렬되는 것은 아니므로 모델이 작거나 불규칙한 모양의 객체를 탐지하기가 더 어렵습니다. 앵커 박스 크기를 선택하고 미세 조정하는 과정 또한 시간이 많이 소요되며 많은 수동 작업이 필요합니다. 이 외에도 앵커 기반 모델은 미리 정의된 박스가 복잡한 시나리오에 잘 적응하지 못할 수 있어 가려지거나 겹치는 객체를 탐지하는 데 종종 어려움을 겪습니다.
Link to this section앵커 프리 객체 탐지로의 전환#
앵커 프리 탐지기는 2018년 CornerNet 및 CenterNet과 같은 모델들이 등장하면서 주목받기 시작했습니다. 이 모델들은 미리 정의된 앵커 박스의 필요성을 제거함으로써 객체 탐지에 대한 새로운 접근 방식을 취했습니다. 객체 위치를 예측하기 위해 다양한 크기와 모양의 앵커 박스에 의존하는 기존 모델들과 달리, 앵커 프리 모델은 객체 위치를 직접 예측합니다. 이들은 중심과 같은 객체의 주요 지점이나 특징에 집중하며, 이는 탐지 과정을 단순화하고 더 빠르고 정확하게 만듭니다.
앵커 프리 모델은 일반적으로 다음과 같이 작동합니다:
- 키포인트 탐지: 일부 모델은 미리 정의된 박스를 사용하는 대신 중심이나 특정 모서리와 같이 객체의 중요한 지점을 식별합니다. 이러한 키포인트는 모델이 객체의 위치와 크기를 파악하는 데 도움을 줍니다.
- 중심 예측: 일부 모델은 객체의 중심을 예측하는 데 집중합니다. 중심이 위치하면 모델은 그 지점으로부터 전체 객체의 크기와 위치를 예측할 수 있습니다.
- 히트맵 회귀: 많은 앵커 프리 모델은 각 픽셀이 객체의 잠재적 위치를 나타내는 히트맵을 사용합니다. 더 강한 히트맵 값은 해당 지점에 객체가 존재할 확률이 더 높다는 자신감을 나타냅니다.

그림 2. 앵커 기반 탐지 vs 앵커 프리 탐지.
앵커 프리 모델은 앵커 박스에 의존하지 않기 때문에 설계가 더 단순합니다. 이는 계산적으로 더 효율적임을 의미합니다. 여러 앵커 박스를 처리할 필요가 없으므로 객체를 더 빠르게 탐지할 수 있으며, 이는 자율 주행 및 비디오 감시와 같은 실시간 응용 분야에서 중요한 장점입니다.
또한 앵커 프리 모델은 작거나 불규칙하거나 가려진 객체를 처리하는 데 훨씬 뛰어납니다. 앵커 박스를 맞추려 하기보다 키포인트 탐지에 집중하기 때문에 훨씬 더 유연합니다. 이를 통해 앵커 기반 모델이 실패할 수 있는 복잡하거나 혼잡한 환경에서도 객체를 정확하게 탐지할 수 있습니다.
Link to this sectionUltralytics YOLO11: 앵커 프리 탐지기#
속도와 효율성을 위해 처음 설계된 YOLO 모델들은 점차 앵커 기반 방식에서 앵커 프리 탐지로 전환해 왔으며, 이로 인해 YOLO11과 같은 모델들은 더 빠르고 유연해졌으며 다양한 실시간 응용 분야에 더 적합하게 되었습니다.
서로 다른 YOLO 버전 전반에서 앵커 프리 설계가 어떻게 발전했는지 간략히 살펴보겠습니다:
- Ultralytics YOLOv5u: 앵커 프리 Ultralytics 분할 헤드를 도입하여 미리 정의된 앵커 박스의 필요성을 제거했습니다. 대신 모델이 이미지 내 객체의 위치를 직접 예측함으로써 프로세스를 단순화하고 유연성과 속도를 향상했습니다.
- YOLOv6: 앵커를 학습 중에만 사용하는 앵커 지원 학습(Anchor-Aided Training, AAT)이라는 새로운 방식이 사용되었습니다. 이를 통해 모델은 학습 과정에서 앵커 기반 방식의 구조로부터 이점을 얻는 동시에, 런타임에는 더 나은 속도와 적응성을 위해 앵커 프리 탐지를 사용할 수 있게 되었습니다.
- Ultralytics YOLOv8: 앵커 프리 Ultralytics 분할 헤드를 사용하여 앵커 프리 탐지로 완전히 전환되었습니다. 이로 인해 모델은 특히 앵커 박스와 잘 맞지 않는 작거나 이상한 모양의 객체에 대해 더 빠르고 정확해졌습니다.
- Ultralytics YOLO11: YOLOv8의 앵커 프리 접근 방식을 기반으로 구축되었으며, 앵커 박스를 완전히 제거하여 탐지를 더욱 최적화했습니다. 그 결과 동물 행동 모니터링 및 리테일 분석과 같은 실시간 응용 분야에서 더 빠르고 정확한 탐지가 가능해졌습니다.

그림 3. Ultralytics YOLOv8과 Ultralytics YOLO11 비교.
Link to this sectionYOLO11의 실제 응용 분야#
YOLO11을 사용한 앵커 프리 탐지의 이점에 대한 훌륭한 예는 자율 주행 차량입니다. 자율 주행 자동차에서 보행자, 다른 차량, 장애물을 빠르고 정확하게 탐지하는 것은 안전을 위해 매우 중요합니다. YOLO11의 앵커 프리 접근 방식은 미리 정의된 앵커 박스에 의존하는 대신 보행자의 중심이나 다른 차량의 경계와 같은 객체의 키포인트를 직접 예측하여 탐지 과정을 단순화합니다.

그림 4. YOLO11에서 앵커 프리 탐지의 이점 (작성자 이미지).
YOLO11은 계산적으로 비싸고 느릴 수 있는 앵커 그리드를 각 객체에 조정하거나 맞출 필요가 없습니다. 대신 주요 특징에 집중하여 더 빠르고 효율적입니다. 예를 들어 보행자가 차량의 경로로 들어올 때, YOLO11은 사람이 부분적으로 가려져 있거나 움직이고 있더라도 키포인트를 정확히 찾아내어 위치를 신속하게 식별할 수 있습니다. 앵커 박스 없이 다양한 모양과 크기에 적응하는 능력 덕분에 YOLO11은 객체를 더 안정적이고 빠른 속도로 탐지할 수 있으며, 이는 자율 주행 시스템의 실시간 의사 결정에 매우 중요합니다.
YOLO11의 앵커 프리 능력이 특히 돋보이는 다른 응용 분야는 다음과 같습니다:
- 리테일 및 재고 관리: YOLO11은 상품이 쌓여 있거나 부분적으로 가려져 있을 때도 선반 위의 상품을 더 쉽게 모니터링할 수 있게 합니다. 이는 더 빠르고 정확한 재고 추적을 돕고 오류를 줄입니다.
- 의료 영상: YOLO11은 의료 분야에서도 효과적이며 의료 스캔에서 종양이나 기타 이상 징후를 탐지할 수 있습니다. 불규칙한 모양의 객체를 처리하는 능력은 복잡한 질환을 진단하는 정확도를 높이는 데 도움을 줍니다.
- 야생 동물 모니터링: 야생 동물 연구에서 YOLO11은 울창한 숲이나 거친 지형에서 동물을 추적하여 연구원들이 행동을 모니터링하거나 멸종 위기 종을 보호하도록 도울 수 있습니다.
- 스포츠 분석: YOLO11은 스포츠 경기 중 선수, 공의 움직임 또는 기타 요소를 실시간으로 추적하여 팀, 코치 및 방송사에 귀중한 통찰력을 제공하는 데 사용될 수 있습니다.
Link to this section앵커 프리 모델로 작업할 때 고려해야 할 사항#
YOLO11과 같은 앵커 프리 모델은 많은 장점을 제공하지만, 몇 가지 한계도 존재합니다. 실무에서 고려해야 할 주요 사항 중 하나는 앵커 프리 모델조차도 가려짐이나 매우 겹치는 객체에 대해서는 어려움을 겪을 수 있다는 점입니다. 그 근거는 컴퓨터 비전이 인간의 시각을 재현하는 것을 목표로 하며, 인간이 가려진 객체를 식별하는 데 가끔 어려움을 겪는 것처럼 AI 모델도 유사한 도전에 직면할 수 있다는 점입니다.
또 다른 흥미로운 요소는 모델 예측 처리와 관련이 있습니다. 앵커 프리 모델의 아키텍처가 앵커 기반보다 단순하지만, 특정 경우에는 추가적인 개선 작업이 필요합니다. 예를 들어 비최대 억제(NMS)와 같은 후처리 기술이 겹치는 예측을 정리하거나 혼잡한 장면에서 정확도를 개선하는 데 필요할 수 있습니다.
Link to this sectionYOLO11과 함께 AI의 미래를 정착시키다#
앵커 기반에서 앵커 프리 탐지로의 전환은 객체 탐지 분야에서 중요한 발전이었습니다. YOLO11과 같은 앵커 프리 모델을 통해 프로세스가 단순화되었고, 이는 정확도와 속도 모두의 향상으로 이어졌습니다.
YOLO11을 통해 우리는 앵커 프리 객체 탐지가 빠르고 정밀한 탐지가 필수적인 자율 주행 자동차, 비디오 감시, 의료 영상과 같은 실시간 응용 분야에서 어떻게 탁월한 성능을 보이는지 확인했습니다. 이러한 접근 방식은 YOLO11이 다양한 객체 크기와 복잡한 장면에 더 쉽게 적응하게 하여 다양한 환경에서 더 나은 성능을 제공합니다.
컴퓨터 비전이 계속 진화함에 따라 객체 탐지는 더욱 빠르고 유연하며 효율적으로 변화할 것입니다.
저희 GitHub 리포지토리를 둘러보고 저희 커뮤니티에 참여하여 AI에 관한 모든 최신 소식을 확인하세요. Vision AI가 제조업 및 농업과 같은 분야에 미치는 영향을 확인해 보십시오.






