객체 감지에서 detection head가 갖는 중요한 역할을 알아보고, detection head가 어떻게 특징 맵을 개선하여 객체 위치와 클래스를 정확하게 찾아내는지 알아보세요.
감지 헤드는 객체 감지 모델의 마지막이자 가장 중요한 구성 요소로, 인코딩된 이미지 특징을 실행 가능한 예측으로 변환하는 인코딩된 이미지 특징을 실행 가능한 예측으로 변환하는 의사 결정 계층입니다. 딥러닝 신경망의 맨 끝에 위치하며 딥러닝 신경망, 특히 백본과 목 뒤에 위치한 감지 헤드는 높은 수준의 피처 맵을 처리하여 최종 결과물을 생성합니다. 물체의 클래스와 이미지 내 정확한 위치입니다. 네트워크의 초기 계층은 특징 추출에 중점을 두지만 추출에 초점을 맞추는 반면, 감지 헤드는 이 데이터를 해석하여 다음과 같은 질문에 답합니다. "그것이 무엇인가?", "어디에 있는가?"라는 질문에 답합니다.
탐지 헤드의 주된 책임은 분류와 회귀라는 두 가지 별개의 작업을 동시에 수행하는 것입니다. 회귀. 최신 객체 감지 아키텍처에서는 이러한 작업은 종종 헤드 내에서 별도의 분기에 의해 처리되는데, 이는 모델이 예측의 여러 측면에 대해 예측의 다양한 측면을 전문화할 수 있습니다.
탐지 헤드의 출력은 일반적으로 밀집된 후보 탐지 집합입니다. 결과를 확정하려면 다음과 같은 후처리 단계 비최대 억제(NMS) 와 같은 후처리 단계가 와 같은 후처리 단계를 적용하여 겹치는 상자를 필터링하고 가장 확실한 예측만 유지합니다.
감지 헤드의 설계에 따라 모델이 객체를 로컬라이즈하는 문제에 접근하는 방식이 결정됩니다.
탐지 헤드의 효율성과 정확성은 복잡한 환경에서 인공 지능(AI)을 배포하려면 배포하는 데 필수적입니다.
탐지 헤드를 다른 주요 구성 요소와 구별하는 것이 도움이 됩니다. 컨볼루션 신경망(CNN):
다음 Python 코드 스니펫은 다음을 사용하여 사전 학습된 YOLO11 모델의 탐지 헤드를 검사하는 방법을 보여줍니다.
를 사용하여 ultralytics 패키지를 추가합니다. 이는 사용자가 추론을 담당하는 최종 계층의 구조를 이해하는 데 도움이 됩니다.
추론.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Inspect the final detection head layer
# This typically reveals the number of classes (nc) and anchors/outputs
print(model.model.model[-1])
# Run inference to see the head's output in action
results = model("https://ultralytics.com/images/bus.jpg")
탐지 헤드에 대한 이해는 모델 성능을 최적화하거나 모델 성능을 최적화하거나 고급 작업을 수행하려면 새로운 맞춤형 데이터 세트에 대한 모델 학습을 위해 헤드를 자주 교체하는 전이 학습과 같은 사용자 지정 데이터 세트. 연구원들은 다음과 같은 메트릭을 개선하기 위해 다음과 같은 지표를 개선하기 위해 새로운 헤드 디자인을 평균 평균 정밀도(mAP)와 같은 지표를 개선하기 위해 지속적으로 실험하고 있습니다. 컴퓨터 비전이 달성할 수 있는 한계를 넓히고 있습니다.