YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

2단계 객체 탐지기

복잡한 컴퓨터 비전 작업에서 정확한 객체 탐지를 위한 정확도 중심 솔루션인 2단계 객체 탐지기의 강력한 성능을 경험해 보세요.

Two-stage 객체 감지기는 순차적인 2단계 프로세스를 통해 이미지 또는 비디오에서 객체를 식별하고 위치를 파악하는 컴퓨터 비전 모델의 한 종류입니다. 이 방법론은 특히 객체를 정확하게 지역화하는 데 있어 높은 정확도로 알려져 있지만, 더 높은 추론 지연 시간이 발생할 수 있습니다. 기본적인 아이디어는 먼저 잠재적인 관심 영역을 식별한 다음, 유망한 영역에 대해서만 자세한 분류 및 지역화를 수행하는 것입니다.

2단계 프로세스

2단계 검출기의 작동은 뚜렷하고 순차적인 단계로 나뉩니다.

  1. 영역 제안 생성: 첫 번째 단계에서 모델은 이미지를 스캔하여 객체를 포함할 가능성이 있는 "관심 영역(RoI)" 또는 제안으로 알려진 후보 영역 집합을 생성합니다. 이는 일반적으로 Faster R-CNN 아키텍처에서 유명하게 소개된 RPN(Region Proposal Network)이라는 하위 모듈에 의해 수행됩니다. 이 단계의 목표는 객체를 분류하는 것이 아니라 두 번째 단계에서 분석해야 하는 위치 수를 줄이는 것입니다.

  2. 객체 분류 및 경계 상자 개선: 두 번째 단계에서는 제안된 각 영역이 분류 헤드와 회귀 헤드로 전달됩니다. 분류 헤드는 RoI 내 객체의 클래스("사람", "차", "개" 등)를 결정하거나 배경으로 지정합니다. 동시에 회귀 헤드는 객체에 더 정확하게 맞도록 경계 상자의 좌표를 개선합니다. 미리 선택된 영역에 대한 이러한 집중 분석을 통해 모델은 높은 지역화 정확도를 달성할 수 있습니다.

Two-Stage 감지기 vs. One-Stage 감지기

주요 차이점은 작동 파이프라인에 있습니다. 투-스테이지 검출기는 위치 파악 및 분류 작업을 분리하는 반면, 원-스테이지 객체 검출기는 단일 패스에서 두 작업을 동시에 수행합니다.

  • Two-Stage 검출기(예: R-CNN 제품군): 정확성을 우선시합니다. 2단계 프로세스를 통해 각 잠재적 객체에 대해 더 자세한 특징 추출 및 개선이 가능하므로 작거나 겹치는 객체가 많은 복잡한 장면에서 더 나은 성능을 얻을 수 있습니다. 그러나 복잡성으로 인해 계산 집약적이고 속도가 느립니다.
  • 원-스테이지 감지기(예: Ultralytics YOLO, SSD): 속도와 효율성을 우선시합니다. 객체 탐지를 단일 회귀 문제로 취급하여 실시간 추론 속도를 달성하므로 에지 AI 장치에서 애플리케이션에 적합합니다. YOLO11과 같은 최신 원-스테이지 모델은 정확도 격차를 크게 좁혔지만 가능한 한 높은 정밀도를 요구하는 작업에는 투-스테이지 감지기가 여전히 선호될 수 있습니다.

주요 아키텍처

2단계 검출기의 진화는 여러 영향력 있는 모델에 의해 특징지어집니다.

  • R-CNN (Region-based Convolutional Neural Network, 영역 기반 컨볼루션 신경망): 컨볼루션 신경망(CNN)과 함께 영역 제안을 사용하는 것을 처음으로 제안한 선구적인 모델입니다. Selective Search라는 외부 알고리즘을 사용하여 제안을 생성했습니다.
  • Fast R-CNN: CNN을 통해 전체 이미지를 한 번에 처리하여 연산을 공유하고 프로세스 속도를 크게 향상시킨 개선된 모델입니다.
  • Faster R-CNN: 영역 제안 메커니즘을 신경망 자체에 통합하여 엔드 투 엔드 딥러닝 솔루션을 제공하는 RPN(Region Proposal Network)을 도입했습니다.
  • Mask R-CNN: 각 객체에 대한 픽셀 수준 마스크를 출력하는 세 번째 분기를 추가하여 Faster R-CNN을 확장하여 인스턴스 Segmentation을 가능하게 합니다.

실제 애플리케이션

2단계 탐지기의 높은 정확도는 정밀도가 가장 중요한 시나리오에서 유용합니다.

  • 의료 영상 분석: 의료 스캔(CT, MRI)에서 작은 종양, 병변 또는 폴립과 같은 미묘한 이상 징후를 감지하려면 진단을 돕기 위해 높은 정확도가 필요합니다. 정확한 위치 파악은 치료 계획에 매우 중요합니다. 헬스케어 AIRadiology: Artificial Intelligence와 같은 저널의 연구에 대해 자세히 알아보세요. 관련 작업에 대해서는 뇌종양 데이터 세트와 같은 데이터 세트를 탐색해 볼 수 있습니다.
  • 자율 주행: 보행자, 자전거 타는 사람, 다른 차량 및 교통 표지판, 특히 작거나 부분적으로 가려진 표지판을 정확하게 감지하고 현지화하는 것은 자율 주행 자동차의 안전 시스템에 매우 중요합니다. Waymo와 같은 회사는 강력한 인식 시스템에 크게 의존합니다.
  • 상세한 장면 이해: 객체 상호 작용에 대한 세분화된 이해 또는 정확한 계산이 필요한 애플리케이션은 더 높은 정확도의 이점을 얻습니다.
  • 제조 분야의 품질 관리: 복잡한 어셈블리에서 작은 결함을 식별하거나 구성 요소 배치를 확인하려면 종종 높은 정밀도가 필요합니다. 제조 분야의 AI에 대해 자세히 알아보세요.

이러한 모델을 학습하려면 일반적으로 COCO 데이터 세트와 같은 대규모 레이블이 지정된 데이터 세트와 세심한 조정이 필요합니다. Ultralytics는 모델 학습성능 지표 이해를 위한 리소스를 제공합니다. Ultralytics는 Ultralytics YOLO와 같은 효율적인 1단계 모델에 중점을 두고 있지만, 2단계 탐지기를 이해하면 더 넓은 객체 탐지 분야 내에서 유용한 컨텍스트를 얻을 수 있습니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.