Detection Head
탐지 헤드(detection head)가 실시간 객체 탐지를 어떻게 가능하게 하는지 배우십시오. 높은 정확도로 BBox와 라벨을 예측하기 위한 Ultralytics YOLO26에서의 역할을 탐구하십시오.
Detection head는 객체 탐지 신경망 아키텍처에서 최종 의사결정 계층 역할을 합니다. 모델의 초기 계층은 이미지 내의 형태, 질감, 특징을 파악하는 역할을 하지만, detection head는 이 정보를 해석하여 어떤 객체가 존재하고 어디에 위치하는지를 정확하게 예측하는 특정 구성 요소입니다. 이 구성 요소는 특징 추출기(feature extractor)가 생성한 추상적이고 높은 수준의 데이터를 실행 가능한 결과물로 변환하며, 일반적으로 식별된 객체를 둘러싼 bounding boxes와 이에 해당하는 클래스 라벨 및 confidence scores를 출력합니다.
Link to this sectionBackbone 및 Neck과 Head 구분하기#
detection head의 기능을 완전히 파악하려면, 현대의 탐지기들이 computer vision (CV) 파이프라인에서 각각 고유한 목적을 수행하는 세 가지 주요 단계로 구성되어 있다고 시각화하는 것이 도움이 됩니다.
- Backbone: 이는 네트워크의 초기 부분으로, ResNet이나 CSPNet과 같은 Convolutional Neural Network (CNN)인 경우가 많습니다. 원본 입력 이미지를 처리하여 시각적 패턴을 나타내는 feature maps를 생성합니다.
- Neck: Backbone과 Head 사이에 위치하는 Neck은 다양한 스케일의 특징들을 정제하고 결합합니다. Feature Pyramid Network (FPN)과 같은 아키텍처는 컨텍스트를 통합함으로써 모델이 다양한 크기의 객체를 탐지할 수 있도록 보장합니다.
- Head: Neck에서 정제된 특징을 받아 처리하는 최종 구성 요소입니다. 분류(무엇인가?)와 회귀(어디에 있는가?)라는 실제 작업을 수행합니다.
Link to this section발전 과정: Anchor-Based와 Anchor-Free#
detection head의 설계는 특히 전통적인 방법에서 현대의 real-time inference 모델로 전환되면서 속도와 정확도를 향상하기 위해 크게 발전했습니다.
- Anchor-Based Heads: 전통적인 one-stage object detectors는 미리 정의된 anchor boxes, 즉 다양한 크기의 고정된 참조 형태에 의존했습니다. Head는 이러한 앵커를 얼마나 늘리거나 이동하여 객체에 맞출지를 예측합니다. 이 접근 방식은 Faster R-CNN에 대한 기초 연구에 자세히 설명되어 있습니다.
- Anchor-Free Heads: 최신 YOLO26을 포함한 최첨단 모델들은 anchor-free detectors를 활용합니다. 이 Head들은 feature map의 픽셀로부터 객체의 중심과 크기를 직접 예측하므로 수동 앵커 튜닝이 필요하지 않습니다. 이는 아키텍처를 단순화하고 새로운 객체 형태에 대한 모델의 일반화 능력을 향상하며, 이러한 기술은 종종 Fully Convolutional One-Stage Object Detection (FCOS)와 관련이 있습니다.
Link to this section실제 애플리케이션 사례#
detection head의 정밀도는 안전이 중요한 산업 환경에 artificial intelligence (AI)를 배포할 때 필수적입니다. 사용자는 Ultralytics Platform을 사용하여 데이터를 쉽게 주석 처리하고 이러한 특수 Head를 훈련할 수 있습니다.
- 자율 주행: AI for automotive 분야에서 detection head는 실시간으로 보행자, 신호등, 기타 차량을 구별하는 역할을 합니다. 고도로 최적화된 Head는 inference latency가 차량이 즉각적으로 반응할 수 있을 만큼 낮게 유지되도록 보장합니다.
- 의료 진단: medical image analysis 분야에서 detection head는 MRI 스캔에서 종양과 같은 이상 징후를 찾도록 미세 조정됩니다. 회귀 분기는 병변의 정확한 경계를 구분하기 위해 극도로 정확해야 하며, 이를 통해 의사의 healthcare solutions를 지원합니다.
Link to this section코드 예제#
다음 예시는 YOLO26 모델을 로드하고 detection head의 출력을 검사하는 방법을 보여줍니다. 추론(inference)이 실행될 때, Head는 이미지를 처리하고 좌표와 클래스 ID를 포함하는 최종 boxes를 반환합니다.
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")
# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
# Print the bounding box coordinates and the predicted class
print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")이 상호작용은 detection head가 복잡한 신경망 활성화를 개발자가 object tracking이나 카운팅과 같은 후속 작업에 사용할 수 있는 읽기 쉬운 데이터로 어떻게 변환하는지 잘 보여줍니다.






