Yolo 비전 선전
선전
지금 참여하기
용어집

앵커 프리 검출기

앵커 프리 검출기의 강력한 기능, 즉 향상된 정확도, 효율성 및 실제 응용 분야에 대한 적응성을 갖춘 간소화된 객체 검출을 알아보세요.

앵커 프리 탐지기는 사전 정의된 참조 박스에 의존하지 않고 이미지 내 대상물을 식별 및 위치 파악하는 현대적인 객체 탐지 아키텍처입니다. 크기 추정을 위해 사전 설정된 앵커 그리드에 의존하는 기존 접근법과 달리, 이 모델들은 이미지의 특징으로부터 경계 박스를 직접 예측합니다. 이러한 패러다임 전환은 모델 설계를 단순화하고 수동 하이퍼파라미터 조정의 필요성을 줄이며, 종종 실시간 추론에 적합한 더 빠르고 효율적인 아키텍처를 구현합니다. Ultralytics 포함한 최첨단 프레임워크들은 다양한 데이터셋에 걸쳐 우수한 일반화 성능을 달성하기 위해 이 방법론을 채택했습니다.

앵커 프리 탐지 메커니즘

앵커 프리 탐지기의 주요 혁신은 위치 추정 문제를 어떻게 공식화하는지에 있습니다. 수천 개의 앵커 박스 후보를 분류하고 정제하는 대신, 이 모델들은 일반적으로 탐지를 점 예측 또는 회귀 작업으로 처리합니다. 백본 네트워크가 생성한 특징 맵을 분석함으로써, 모델은 특정 픽셀이 객체에 해당할 확률을 결정합니다.

이 영역에는 두 가지 주요 전략이 존재합니다:

  • 중심 기반 접근법: 선구적인 FCOS(Fully Convolutional One-Stage Object Detection) 와 같은 모델은 객체의 중심점을 찾습니다. 그런 다음 네트워크는 이 중심 픽셀에서 바운딩 박스의 네 경계(왼쪽, 위, 오른쪽, 아래)까지의 거리를 회귀합니다.
  • 키포인트 기반 접근법: 자세 추정 기법에서 영감을 받아, 이러한 탐지기는 물체의 왼쪽 상단 및 오른쪽 하단 모서리와 같은 특정 키포인트를 식별합니다. 이후 모델은 이러한 점들을 그룹화하여 완전한 탐지 결과를 형성하며, CornerNet과 같은 아키텍처에서 활용되는 방법입니다.

앵커 기반 방법과의 비교

앵커 프리 기술의 중요성을 이해하려면 앵커 기반 탐지기와 구별하는 것이 필수적이다. 기존 YOLOv5 이나 원본 Faster R-CNN과 같은 앵커 기반모델의 성능은 앵커 박스(고정된 크기와 종횡비를 가진 특정 박스 템플릿)의 설계에 크게 의존합니다.

차이점은 다음과 같습니다:

  • 하이퍼파라미터 튜닝: 앵커 기반 방법은 데이터셋에 맞추기 위해 앵커 크기를 신중하게 조정해야 하며, 종종 k-평균 클러스터링과 같은 알고리즘을 사용합니다. 앵커 프리 방법은 이 단계를 완전히 생략합니다.
  • 일반화: 앵커 프리 모델은 높은 건물이나 가느다란 식기처럼 극단적인 종횡비를 가진 물체를 탐지하는 데 탁월합니다. 이러한 물체는 Microsoft COCO에 포함된 표준 앵커 템플릿에 맞지 않을 수 있는 극단적인 종횡비의
  • 계산: 훈련 과정에서 수천 개의 앵커와 실제 박스 간의 합집합 상 교차(IoU) 관련 계산을 제거함으로써, 앵커 프리 기법은 손실 함수를 간소화하고 계산 오버헤드를 줄입니다.

실제 애플리케이션

앵커 프리 검출기의 유연성은 물체 형태가 예측 불가능하게 변화하는 복잡한 환경에 이상적입니다.

  • 자율 주행: 자동차 산업에서 차량은 다양한 거리에서 보행자, 자전거 이용자 및 장애물을 detect 합니다. 앵커 프리 모델은 자율 주행 차량이 고정된 앵커 스케일에 제약받지 않고 매우 작게(먼 거리) 또는 매우 크게(가까운 거리) 보이는 물체의 바운딩 박스를 정확하게 회귀 분석할 수 있게 합니다.
  • 항공 영상 분석: 위성 영상 분석에서 물체는 종종 임의의 방향과 규모로 나타난다. 앵커 프리 탐지기는 인프라 식별이나 환경 변화 모니터링을 위해 드론 및 무인항공기에서 자주 사용되는데, 이는 고정된 앵커 그리드보다 다양한 시야각에 더 잘 적응할 수 있기 때문이다.

Ultralytics 구현

앵커 프리 아키텍처로의 전환은 최근 YOLO , 특히 Ultralytics 핵심 특징입니다. 이러한 설계 선택은 에지 AI 장치에서 효율적으로 실행되는 능력에 크게 기여합니다. 사용자는 Ultralytics 사용하여 맞춤형 데이터로 이러한 모델을 훈련할 수 있으며, 이는 데이터셋 관리와 클라우드 훈련을 간소화합니다.

다음 예제는 앵커 프리 YOLO26 모델을 로드하고 추론을 실행하는 방법을 보여줍니다. ultralytics Python 패키지.

from ultralytics import YOLO

# Load the anchor-free YOLO26n model (nano version)
model = YOLO("yolo26n.pt")

# Run inference on an image to detect objects
# The model directly predicts boxes without anchor matching
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the detection results
results[0].show()

향후 방향

앵커 프리 탐지의 성공은 완전한 엔드투엔드 탐지 파이프라인의 길을 열었습니다. 향후 발전 방향은 더 진보된 어텐션 메커니즘을 통합하고 컴파일러를 활용해 더 낮은 지연 시간을 최적화함으로써 이 접근법을 더욱 정교화하는 데 있습니다. TensorRT를 활용하여 지연 시간을 더욱 낮추는 방향으로 최적화하는 방식으로 이 접근법을 더욱 정교화

고정된 기하학적 선입견으로부터 예측을 분리함으로써, 앵커 프리 탐지기는 컴퓨터 비전을 보다 접근 가능하고 견고하게 만들었습니다. 의료 영상 분석이든 산업 자동화이든, 이러한 모델들은 현대 AI 솔루션에 필요한 적응성을 제공합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기