2단계 물체 감지기
복잡한 컴퓨터 비전 작업에서 정확한 물체 감지를 위한 정확도 중심 솔루션인 2단계 물체 감지기의 강력한 성능을 알아보세요.
2단계 객체 감지기는 순차적인 2단계 프로세스를 통해 이미지 또는 동영상에서 객체를 식별하고 위치를 파악하는 컴퓨터 비전 모델의 한 종류입니다. 이 방법론은 특히 물체를 정확하게 찾아내는 데 있어 정확도가 높은 것으로 알려져 있지만, 추론 대기 시간이 길어지는 단점이 있습니다. 기본 아이디어는 먼저 잠재적인 관심 영역을 식별한 다음 유망한 영역에 대해서만 세부 분류 및 로컬라이제이션을 수행하는 것입니다.
2단계 프로세스
2단계 감지기의 작동은 뚜렷하고 순차적인 단계로 나뉩니다:
영역 제안 생성: 첫 번째 단계에서는 모델이 이미지를 스캔하여 물체를 포함할 가능성이 있는 '관심 영역(RoI)' 또는 제안이라고 하는 후보 영역 세트를 생성합니다. 이 작업은 일반적으로 Faster R-CNN 아키텍처에서 잘 알려진 것처럼 RPN(영역 제안 네트워크)이라는 하위 모듈에 의해 수행됩니다. 이 단계의 목표는 객체를 분류하는 것이 아니라 단순히 두 번째 단계에서 분석해야 하는 위치의 수를 줄이는 것입니다.
객체 분류 및 경계 상자 세분화: 두 번째 단계에서는 제안된 각 영역이 분류 헤드와 회귀 헤드로 전달됩니다. 분류 헤드는 RoI 내의 객체의 클래스(예: '사람', '자동차', '개')를 결정하거나 배경으로 지정합니다. 동시에 회귀 헤드는 객체에 더 정확하게 맞도록 경계 상자의 좌표를 세분화합니다. 이렇게 미리 선택된 영역을 집중적으로 분석함으로써 모델은 높은 위치 정확도를 달성할 수 있습니다.
2단계와 1단계 감지기 비교
가장 큰 차이점은 운영 파이프라인에 있습니다. 2단계 감지기는 로컬라이제이션과 분류 작업을 분리하는 반면, 1단계 객체 감지기는 두 작업을 한 번에 동시에 수행합니다.
- 2단계 감지기(예: R-CNN 제품군): 정확도를 우선시합니다. 2단계 프로세스를 사용하면 각 잠재적 객체에 대해 보다 상세한 특징 추출 및 세분화가 가능하므로 작거나 겹치는 객체가 많은 복잡한 장면에서 더 나은 성능을 얻을 수 있습니다. 그러나 복잡성이 높기 때문에 계산 집약적이고 속도가 느립니다.
- 1단계 탐지기(예: Ultralytics YOLO, SSD): 속도와 효율성을 우선시합니다. 객체 감지를 단일 회귀 문제로 처리함으로써 엣지 AI 디바이스의 애플리케이션에 적합한 실시간 추론 속도를 달성합니다. YOLO11과 같은 최신 1단계 모델이 정확도 격차를 크게 줄였지만, 가능한 최고의 정밀도를 요구하는 작업에는 여전히 2단계 탐지기가 선호될 수 있습니다.
눈에 띄는 아키텍처
2단계 감지기의 진화는 몇 가지 영향력 있는 모델에 의해 이루어졌습니다:
- R-CNN(지역 기반 컨볼루션 신경망): 컨볼루션 신경망(CNN)을 사용한 지역 제안을 최초로 제안한 선구적인 모델입니다. 이 모델은 선택적 검색이라는 외부 알고리즘을 사용하여 제안을 생성합니다.
- 빠른 R-CNN: 전체 이미지를 CNN을 통해 한 번만 처리하여 연산을 공유하고 처리 속도를 크게 높인 개선 사항입니다.
- 더 빨라진 R-CNN: 엔드투엔드 딥 러닝 솔루션을 위해 영역 제안 메커니즘을 신경망 자체에 통합하는 영역 제안 네트워크(RPN)를 도입했습니다.
- 마스크 R-CNN: 각 오브젝트에 대해 픽셀 수준 마스크를 출력하는 세 번째 분기를 추가하여 인스턴스 분할을 가능하게 함으로써 더 빠른 R-CNN을 확장합니다.
실제 애플리케이션
2단계 감지기의 높은 정확도는 정밀도가 가장 중요한 시나리오에서 유용합니다:
- 의료 이미지 분석: 의료 스캔(CT, MRI)에서 작은 종양, 병변 또는 용종과 같은 미묘한 이상을 감지하려면 진단을 돕기 위해 높은 정확도가 필요합니다. 정확한 위치 파악은 치료 계획에 매우 중요합니다. 의료 분야의 AI와 Radiology와 같은 저널의 연구에 대해 자세히 알아보세요 : 인공 지능. 관련 작업을 위해 뇌종양 데이터 세트와 같은 데이터 세트를 살펴볼 수 있습니다.
- 자율 주행: 보행자, 자전거, 다른 차량, 교통 표지판, 특히 작거나 부분적으로 가려진 표지판을 정확하게 감지하고 위치를 파악하는 것은 자율 주행 차량의 안전 시스템에 매우 중요합니다. 웨이모와 같은 기업은 강력한 인식 시스템에 크게 의존합니다.
- 세부적인 장면 이해: 물체 상호 작용을 세밀하게 이해하거나 정밀한 계산이 필요한 애플리케이션은 정확도를 높일 수 있습니다.
- 제조 분야의 품질 관리: 작은 결함을 식별하거나 복잡한 어셈블리의 구성 요소 배치를 확인하려면 높은 정밀도가 필요한 경우가 많습니다. 제조 분야의 AI에 대해 자세히 알아보세요.
이러한 모델을 훈련하려면 일반적으로 COCO 데이터 집합과 같은 대규모 레이블이 지정된 데이터 집합과 신중한 튜닝이 필요합니다. Ultralytics는 모델 훈련과 성능 메트릭 이해를 위한 리소스를 제공합니다. Ultralytics는 Ultralytics YOLO와 같은 효율적인 1단계 모델에 중점을 두지만, 2단계 탐지기를 이해하면 더 광범위한 객체 탐지 분야에서 중요한 컨텍스트를 얻을 수 있습니다.