YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

One-Stage 객체 감지기

로봇 공학 및 감시와 같은 실시간 응용 분야에 이상적인 YOLO와 같은 단일 단계 객체 감지기의 속도와 효율성을 경험해 보세요.

원-스테이지 객체 검출기는 컴퓨터 비전에서 속도와 효율성을 위해 설계된 딥러닝 모델의 한 종류입니다. 이 모델은 신경망의 단일 통합 패스를 통해 객체 위치 파악 및 분류를 수행합니다. 이는 작업을 두 개의 개별 단계로 나누는 더 복잡한 상대 모델인 투-스테이지 객체 검출기와 대조됩니다. 객체 검출을 직접적인 회귀 문제로 취급함으로써 원-스테이지 모델은 이미지 특징에서 경계 상자와 클래스 확률을 직접 예측하므로 매우 빠르며 실시간 추론이 필요한 애플리케이션에 적합합니다.

원-스테이지 검출기 작동 방식

단일 단계 감지기는 단일 CNN(Convolutional Neural Network)를 통해 전체 이미지를 한 번에 처리합니다. 네트워크 아키텍처는 여러 작업을 동시에 수행하도록 설계되었습니다. 먼저 네트워크의 백본특징 추출을 수행하여 다양한 스케일에서 입력 이미지의 풍부한 표현을 생성합니다. 그런 다음 이러한 특징은 특수 감지 헤드로 전달됩니다.

이 헤드는 바운딩 박스 세트, 객체의 존재를 나타내는 각 상자에 대한 신뢰도 점수, 각 객체가 특정 클래스에 속할 확률을 예측하는 역할을 합니다. 이 전체 프로세스는 단일 순방향 패스에서 발생하며, 이는 높은 속도의 핵심입니다. 그런 다음 Non-Maximum Suppression(NMS)와 같은 기술을 사용하여 중복되고 겹치는 탐지를 필터링하여 최종 출력을 생성합니다. 모델은 위치 손실(바운딩 박스가 얼마나 정확한지)과 분류 손실(클래스 예측이 얼마나 정확한지)을 결합한 특수 손실 함수를 사용하여 학습됩니다.

2단계 객체 감지기와의 비교

주요 차이점은 방법론에 있습니다. 원-스테이지(One-stage) 검출기는 속도와 단순성을 위해 구축되었으며, 투-스테이지(Two-stage) 검출기는 정확도를 우선시하지만, 최신 모델에서는 이러한 구분이 점점 덜 두드러지고 있습니다.

  • 원-스테이지 감지기: YOLO(You Only Look Once) 제품군과 같은 이러한 모델은 단일 단계로 감지를 수행합니다. 일반적으로 더 빠르고 아키텍처가 더 간단하여 에지 장치 및 실시간 애플리케이션에 적합합니다. 앵커-프리 감지기의 개발로 성능과 단순성이 더욱 향상되었습니다.
  • Two-Stage 객체 검출기: R-CNN 시리즈 및 더 빠른 변형 모델과 같이 객체가 있을 수 있는 영역 제안의 희소 집합을 먼저 생성합니다. 두 번째 단계에서는 별도의 네트워크가 이러한 제안을 분류하고 경계 상자 좌표를 개선합니다. 이 2단계 프로세스는 일반적으로 특히 작은 객체의 경우 더 높은 정확도를 제공하지만 추론 속도가 상당히 느려지는 단점이 있습니다. Mask R-CNN은 이 접근 방식을 인스턴스 분할로 확장하는 잘 알려진 예입니다.

주요 아키텍처 및 모델

몇 가지 영향력 있는 원-스테이지 아키텍처가 개발되었으며, 각 아키텍처는 고유한 기여를 했습니다.

  • YOLO(You Only Look Once): 획기적인 2015년 논문에서 소개된 YOLO는 객체 탐지를 단일 회귀 문제로 구성했습니다. YOLOv8 및 최첨단 Ultralytics YOLO11을 포함한 후속 버전은 속도와 정확성 간의 균형을 지속적으로 개선했습니다.
  • Single Shot MultiBox Detector (SSD): SSD 아키텍처는 다양한 크기의 객체를 감지하기 위해 다중 스케일 특징 맵을 사용하는 또 다른 선구적인 원-스테이지 모델로, 원래 YOLO보다 정확도를 향상시켰습니다.
  • RetinaNet: 이 모델은 조밀한 탐지기의 학습 중에 발생하는 극심한 클래스 불균형 문제를 해결하기 위해 고안된 새로운 손실 함수인 Focal Loss를 도입하여 당시 많은 2단계 탐지기의 정확도를 능가할 수 있었습니다.
  • EfficientDet: Google Research에서 개발한 모델 제품군으로, 복합 스케일링 방법과 새로운 BiFPN 특징 네트워크를 사용하여 확장성과 효율성에 중점을 둡니다. YOLO11과 EfficientDet과 같은 다른 모델과 어떻게 비교되는지 확인할 수 있습니다.

실제 애플리케이션

원-스테이지 감지기의 속도와 효율성은 수많은 AI 기반 애플리케이션에서 없어서는 안 될 존재가 되었습니다.

  1. 자율 주행 차량: 자율 주행 자동차용 AI에서 단일 단계 감지기는 실시간으로 환경을 인식하는 데 매우 중요합니다. 보행자, 자전거 타는 사람, 다른 차량 및 교통 표지판을 즉시 식별하고 추적하여 차량의 내비게이션 시스템이 순식간에 중요한 결정을 내릴 수 있도록 합니다. Tesla와 같은 회사는 Autopilot 시스템에 유사한 원칙을 활용합니다.
  2. 스마트 보안 및 감시: 단일 단계 모델은 비디오 피드를 분석하여 무단 침입 또는 의심스러운 활동과 같은 위협을 감지함으로써 현대적인 보안 시스템을 강화합니다. 예를 들어, 시스템은 대기열 관리를 위해 대기열에 있는 사람 수를 세거나 공항에서 버려진 수하물을 식별하도록 학습할 수 있으며, 이 모든 것이 실시간으로 이루어집니다.

장점 및 제한 사항

단단계 검출기의 주요 장점은 놀라운 속도로, 실시간 객체 탐지를 저전력 에지 AI 장치(예: NVIDIA Jetson 또는 Raspberry Pi)를 포함한 다양한 하드웨어에서 사용할 수 있습니다. 또한 더 간단한 엔드 투 엔드 아키텍처를 통해 PyTorch 또는 TensorFlow와 같은 프레임워크를 사용하여 더 쉽게 훈련하고 배포할 수 있습니다.

역사적으로 주요 제한 사항은 특히 매우 작거나 심하게 가려진 객체를 처리할 때 2단계 검출기에 비해 낮은 정확도였습니다. 그러나 YOLO11과 같은 모델에서 볼 수 있듯이 모델 아키텍처 및 훈련 기술의 최근 발전으로 인해 이러한 성능 격차가 크게 좁혀져 광범위한 컴퓨터 비전 작업에 대해 속도와 높은 정확도의 강력한 조합을 제공합니다. Ultralytics HUB와 같은 플랫폼은 특정 요구 사항에 맞게 맞춤형 모델 훈련 프로세스를 더욱 간소화합니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.