용어집

탐지 헤드

물체 탐지에서 감지 헤드의 중요한 역할을 알아보고, 피처 맵을 개선하여 물체의 위치와 클래스를 정확하게 찾아내세요.

감지 헤드는 이미지 또는 비디오에서 객체의 존재, 위치, 클래스에 대한 최종 예측을 담당하는 객체 감지 아키텍처의 핵심 구성 요소입니다. 신경망의 끝에 위치하며, 모델의 백본과 넥에서 생성된 처리된 특징 맵을 가져와 가시적인 출력으로 변환합니다. 구체적으로 감지 헤드는 두 가지 주요 작업을 수행합니다. 잠재적인 객체를 미리 정의된 범주(예: '자동차', '사람', '개')로 분류하고 회귀를 수행하여 감지된 각 객체를 둘러싸는 경계 상자의 정확한 좌표를 예측하는 것입니다.

탐지 헤드의 작동 방식

객체 감지에 사용되는 일반적인 컨볼루션 신경망(CNN) 에서는 입력 이미지가 일련의 레이어를 통과합니다. 초기 레이어(백본)는 가장자리와 텍스처와 같은 낮은 수준의 특징을 추출하고, 더 깊은 레이어는 더 복잡한 패턴을 포착합니다. 감지 헤드는 이러한 높은 수준의 특징을 합성하여 원하는 결과물을 생성하는 최종 단계입니다.

감지 헤드의 디자인은 다양한 물체 감지 모델 간의 핵심적인 차별화 요소입니다. 일부 헤드는 속도를 고려하여 설계되어 엣지 디바이스에서 실시간 추론에 적합한 반면, 다른 헤드들은 정확도를 극대화하도록 최적화되어 있습니다. 탐지 모델의 성능은 종종 평균 정밀도(mAP)와 같은 메트릭으로 측정되며, 탐지 헤드의 효율성에 따라 크게 영향을 받습니다. 모델 비교를 통해 다양한 아키텍처의 성능을 살펴볼 수 있습니다.

최신 아키텍처의 탐지 헤드

최신 딥러닝은 감지 헤드 설계에서 상당한 진화를 이루었습니다. 앵커 기반 탐지기와 앵커가 없는 탐지기를 구분하는 것이 특히 중요합니다.

  • 앵커 기반 헤드: 이러한 기존 헤드는 다양한 크기와 화면 비율의 사전 정의된 상자(앵커) 세트를 사용합니다. 헤드는 이미지의 실사 오브젝트와 일치하도록 이러한 앵커를 이동하고 크기를 조정하는 방법을 예측합니다.
  • 앵커 프리 헤드: Ultralytics YOLO11을 포함한 최신 모델에서는 앵커 프리 헤드를 사용하는 경우가 많습니다. 이러한 헤드는 예를 들어 물체의 중심과 같은 키포인트를 식별하여 물체의 위치를 직접 예측합니다. 이 접근 방식은 모델 설계를 간소화하고 비정상적인 모양의 객체에 대한 유연성을 향상시킬 수 있으며, 이 블로그에서 앵커가 없는 YOLO11의 이점에 대해 자세히 설명합니다.

이러한 구성 요소의 개발은 사용자 지정 모델을 구축하고 훈련할 수 있는 도구를 제공하는 PyTorchTensorFlow와 같은 강력한 프레임워크에 의존합니다. Ultralytics HUB와 같은 플랫폼은 이 프로세스를 더욱 간소화합니다.

실제 애플리케이션

감지 헤드의 효율성은 객체 감지를 기반으로 구축된 수많은 AI 애플리케이션의 성능에 직접적인 영향을 미칩니다.

  1. 자율주행 차량: 자율주행차에서 감지 헤드는 보행자, 다른 차량, 교통 표지판을 실시간으로 식별하고 위치를 파악하는 데 필수적입니다. 이러한 예측의 속도와 정확성은 안전한 내비게이션에 매우 중요하며, 웨이모와 같은 회사에서 많이 활용하는 기술입니다. 이를 위해서는 다양하고 역동적인 환경을 처리할 수 있는 강력한 감지 헤드가 필요합니다.
  2. 보안 및 감시: 탐지 헤드는 비디오 피드에서 권한이 없는 사람, 버려진 물체 또는 특정 이벤트를 식별하여 자동 모니터링 시스템을 강화합니다. 이 기능은 Ultralytics 보안 경보 시스템 가이드와 같은 애플리케이션의 기본 기능입니다.
  3. 의료 이미지 분석: 감지 헤드는 의료 스캔에서 종양이나 골절과 같은 이상 징후를 정확하게 찾아내어 더 빠르고 정확한 진단에 기여함으로써 방사선과 의사를 도와줍니다. 이 애플리케이션에 대한 자세한 내용은 종양 감지를 위한 YOLO11 사용에 대해 읽어보세요.
  4. 제조: 공장에서 감지 헤드는 조립 라인에서 제품의 결함을 발견하여 제조 과정에서 자동화된 품질 관리를 가능하게 합니다.
  5. 리테일 분석: 이러한 구성 요소는 재고 관리 및 고객 유동 패턴 분석과 같은 애플리케이션에 사용됩니다.

YOLOv8과 같은 모델의 정교한 탐지 헤드는 다양한 작업과 시나리오에서 높은 성능을 보장하기 위해 COCO와 같은 대규모 벤치마크 데이터 세트에 대해 훈련됩니다. 최종 출력은 중복 탐지를 걸러내기 위해 비최대 억제(NMS) 와 같은 기술을 사용하여 개선되기도 합니다. 보다 심층적인 지식이 필요한 경우 CourseraDeepLearning.AI와 같은 제공업체의 온라인 강좌에서 포괄적인 학습 경로를 제공합니다.

울트라 애널리틱스 커뮤니티 가입

AI의 미래와 함께하세요. 글로벌 혁신가들과 연결, 협업, 성장하기

지금 가입하기
링크가 클립보드에 복사됨