앵커 기반 검출기가 정확한 위치 파악, 스케일 적응성 및 실제 응용을 통해 객체 검출에 어떻게 혁명을 일으키는지 알아보세요.
앵커 기반 감지기는 컴퓨터 비전(CV)에서 사용되는 기본 모델 클래스입니다. 컴퓨터 비전(CV)에서 사용되는 기본 모델 클래스입니다. 물체 감지. 이러한 시스템은 사전 정의된 경계 상자 세트에 의존합니다. 앵커 박스로 알려진 사전 정의된 경계 상자 세트에 의존합니다. 역할을 합니다. 네트워크는 물체의 위치를 처음부터 예측하는 대신, 이러한 고정된 앵커 박스를 얼마나 많이 고정된 앵커를 장면의 오브젝트에 꼭 맞도록 이동하고 크기를 조정합니다. 이 접근 방식은 본질적으로 복잡한 로컬라이제이션 작업을 구조화된 회귀 문제로 변환하여 딥 러닝(DL) 모델이 공간 학습을 위한 딥 러닝(DL) 모델 계층 구조를 학습할 수 있습니다.
앵커 기반 디텍터의 워크플로에는 입력 이미지 위에 조밀한 앵커 그리드를 생성하는 작업이 포함됩니다. 다양한 크기와 모양의 물체를 캡처하기 위해 다양한 배율과 종횡비를 가진 조밀한 앵커 그리드를 생성합니다. 이미지가 모델의 백본을 통과할 때 모델의 백본을 통과하면 특징 맵이 추출되고 분석됩니다. 모든 앵커 위치에 대해 감지 헤드는 두 가지 동시 예측을 수행합니다:
모델 학습 중에 알고리즘은 다음과 같은 메트릭을 사용합니다. IoU(Intersection over Union) 라는 메트릭을 사용하여 라는 지표를 사용하여 어떤 앵커가 알려진 객체와 충분히 겹치는지 결정합니다. 가장 높은 IoU 가진 앵커만 양성 샘플로 처리됩니다. 이 프로세스는 수천 개의 후보 상자를 생성하기 때문에 다음과 같은 후처리 단계가 필요합니다. 비 최대 억제(NMS) 라는 후처리 단계가 라는 후처리 단계를 적용하여 중복되는 항목을 제거하고 가장 정확한 탐지 항목만 유지합니다.
이러한 모델을 현대 세대의 앵커리스 감지기와 구별하는 것이 중요합니다. 앵커 프리 디텍터와 구별하는 것이 중요합니다. 앵커 기반 시스템과 같은 기존 Faster R-CNN 및 Ultralytics YOLOv5 와 같은 앵커 기반 시스템은 앵커 치수의 수동 조정에 의존하지만 치수의 수동 조정에 의존하는 반면, 앵커 프리 모델은 오브젝트 중심 또는 키포인트를 직접 예측합니다.
새로운 방법의 등장에도 불구하고, 앵커 기반 감지기는 물체 모양이 일관되고 예측 가능한 많은 기존 파이프라인에서 모양이 일관되고 예측 가능한 많은 기존 파이프라인에서 여전히 널리 사용되고 있습니다.
객체 감지를 쉽게 실험할 수 있습니다. ultralytics 패키지. 최신 모델
은 앵커가 없지만 이 프레임워크는 다양한 아키텍처를 지원합니다. 다음 예는 미리 학습된 모델을 사용하여 이미지에서
추론을 실행하는 방법을 보여줍니다:
from ultralytics import YOLO
# Load a pre-trained object detection model
# Note: YOLOv5 is a classic example of an anchor-based architecture
model = YOLO("yolov5su.pt")
# Perform inference on a local image
results = model("path/to/image.jpg")
# Display the resulting bounding boxes and class labels
results[0].show()
앵커 기반 감지기의 메커니즘을 이해하면 컴퓨터 비전의 진화와 컴퓨터 비전과 그 이면의 설계 선택 다음과 같은 고급 알고리즘의 YOLO11 와 같은 고급 알고리즘과 YOLO26.