용어집

1단계 물체 감지기

로봇 공학 및 감시와 같은 실시간 애플리케이션에 이상적인 YOLO와 같은 1단계 물체 감지기의 속도와 효율성을 알아보세요.

1단계 객체 감지기는 컴퓨터 비전의 속도와 효율성을 위해 설계된 딥러닝 모델의 한 종류입니다. 이 모델은 신경망의 단일 통합 패스에서 객체 위치 파악과 분류를 수행합니다. 이는 작업을 두 단계로 나누는 더 복잡한 2단계 물체 감지기와는 대조적입니다. 1단계 모델은 물체 감지를 간단한 회귀 문제로 처리함으로써 이미지 특징에서 직접 경계 상자와 클래스 확률을 예측하므로 매우 빠르고 실시간 추론이 필요한 애플리케이션에 적합합니다.

1단계 감지기의 작동 방식

1단계 디텍터는 단일 컨볼루션 신경망(CNN)을 통해 전체 이미지를 한 번에 처리합니다. 네트워크의 아키텍처는 여러 작업을 동시에 수행하도록 설계되었습니다. 먼저 네트워크의 백본이 특징 추출을 수행하여 다양한 스케일로 입력 이미지의 풍부한 표현을 생성합니다. 그런 다음 이러한 특징은 특수 감지 헤드에 공급됩니다.

이 헤드는 일련의 경계 상자, 물체의 존재를 나타내는 각 상자에 대한 신뢰 점수, 각 물체가 특정 클래스에 속할 확률을 예측하는 역할을 담당합니다. 이 모든 과정은 단 한 번의 전진 패스로 이루어지며, 이것이 빠른 속도의 핵심입니다. 그런 다음 비최대 억제(NMS) 와 같은 기술을 사용하여 중복 및 중복 탐지를 필터링하여 최종 결과물을 생성합니다. 모델은 지역화 손실(바운딩 박스의 정확도)과 분류 손실(클래스 예측의 정확도)을 결합한 특수 손실 함수를 사용하여 학습됩니다.

2단계 물체 감지기와 비교

가장 큰 차이점은 방법론에 있습니다. 1단계 탐지기는 속도와 단순성을 위해 설계된 반면, 2단계 탐지기는 정확성을 우선시하지만 최신 모델에서는 이러한 구분이 점점 더 뚜렷해지고 있습니다.

  • 원스텝 감지기: YOLO(You Only Look Once) 제품군과 같은 이러한 모델은 한 단계로 감지를 수행합니다. 일반적으로 더 빠르고 아키텍처가 더 단순하여 에지 디바이스 및 실시간 애플리케이션에 이상적입니다. 앵커가 필요 없는 감지 기의 개발로 성능과 단순성이 더욱 향상되었습니다.
  • 2단계 물체 감지기: R-CNN 시리즈와 그보다 빠른 변형과 같은 모델은 먼저 객체가 위치할 수 있는 희박한 영역 제안 세트를 생성합니다. 두 번째 단계에서는 별도의 네트워크가 이러한 제안을 분류하고 경계 상자 좌표를 구체화합니다. 이 2단계 프로세스는 일반적으로 특히 작은 물체의 경우 더 높은 정확도를 제공하지만 추론 속도가 상당히 느려지는 단점이 있습니다. 이 접근 방식을 인스턴스 세분화로 확장한 잘 알려진 예가 마스크 R-CNN입니다.

주요 아키텍처 및 모델

여러 가지 영향력 있는 1단계 아키텍처가 개발되었으며, 각 아키텍처는 고유한 기여를 하고 있습니다:

  • YOLO(You Only Look Once): 2015년의 획기적인 논문에서 소개된 YOLO는 객체 감지를 단일 회귀 문제로 구성했습니다. YOLOv8과 최첨단 Ultralytics YOLO11을 포함한 후속 버전은 속도와 정확도 사이의 균형을 지속적으로 개선해 왔습니다.
  • 싱글 샷 멀티박스 디텍터(SSD): SSD 아키텍처는 멀티 스케일 피처 맵을 사용하여 다양한 크기의 물체를 감지하는 또 다른 선구적인 1단계 모델로, 기존 YOLO보다 정확도를 향상시켰습니다.
  • 레티나넷: 이 모델은 고밀도 감지기의 훈련 중에 발생하는 극심한 클래스 불균형을 해결하기 위해 설계된 새로운 손실 함수인 초점 손실(Focal Loss)을 도입하여 당시 많은 2단계 감지기의 정확도를 능가할 수 있었습니다.
  • EfficientDet: 복합 확장 방법과 새로운 BiFPN 기능 네트워크를 사용하여 확장성과 효율성에 초점을 맞춘 Google Research에서 개발한 모델 제품군입니다. YOLO11과 EfficientDet과 같은 다른 모델과 어떻게 비교되는지 확인할 수 있습니다.

실제 애플리케이션

1단계 감지기의 속도와 효율성은 수많은 AI 기반 애플리케이션에서 없어서는 안 될 필수 요소로 자리 잡았습니다:

  1. 자율주행 차량: 자율주행차용 AI에서 1단계 감지기는 실시간으로 주변 환경을 인식하는 데 매우 중요합니다. 보행자, 자전거, 다른 차량, 교통 표지판을 즉시 식별하고 추적하여 차량의 내비게이션 시스템이 순식간에 중요한 결정을 내릴 수 있게 해줍니다. Tesla와 같은 회사에서는 오토파일럿 시스템에 유사한 원리를 활용합니다.
  2. 스마트 보안 및 감시: 1단계 모델은 비디오 피드를 분석하여 무단 침입이나 의심스러운 활동과 같은 위협을 감지함으로써 최신 보안 시스템을 강화합니다. 예를 들어, 대기열 관리를 위해 대기열에 있는 사람의 수를 세거나 공항에서 버려진 수하물을 실시간으로 식별하도록 시스템을 학습시킬 수 있습니다.

장점과 한계

1단계 감지기의 가장 큰 장점은 놀라운 속도로 NVIDIA Jetson 또는 Raspberry Pi와 같은 저전력 엣지 AI 장치를 비롯한 다양한 하드웨어에서 실시간 객체 감지가 가능하다는 점입니다. 또한 더 간단한 엔드투엔드 아키텍처 덕분에 PyTorch나 TensorFlow와 같은 프레임워크를 사용하여 더 쉽게 훈련하고 배포할 수 있습니다.

역사적으로 가장 큰 한계는 특히 매우 작거나 심하게 가려진 물체를 처리할 때 2단계 디텍터에 비해 정확도가 낮다는 점이었습니다. 하지만 최근 모델 아키텍처와 훈련 기법의 발전으로 YOLO11과 같은 모델에서 볼 수 있듯이 이러한 성능 격차가 크게 좁혀져 다양한 컴퓨터 비전 작업에 속도와 높은 정확도의 강력한 조합을 제공합니다. Ultralytics HUB와 같은 플랫폼은 특정 요구 사항에 맞는 맞춤형 모델을 훈련하는 프로세스를 더욱 간소화합니다.

울트라 애널리틱스 커뮤니티 가입

AI의 미래와 함께하세요. 글로벌 혁신가들과 연결, 협업, 성장하기

지금 가입하기
링크가 클립보드에 복사됨