Two-Stage Object Detectors
영역 제안과 분류에 중점을 둔 2단계 객체 감지기의 메커니즘을 살펴보세요. 왜 Ultralytics YOLO26과 같은 현대 모델이 현재 앞서 나가는지 배우세요.
2단계 객체 탐지기는 컴퓨터 비전에서 이미지 내의 항목을 식별하고 위치를 파악하는 데 사용되는 정교한 딥러닝(DL) 아키텍처의 한 유형입니다. 단일 단계로 탐지를 수행하는 기존 방식과 달리, 이 모델들은 작업을 영역 제안(region proposal)과 객체 분류(object classification)라는 두 가지 별도의 단계로 나눕니다. 이러한 이분법적 접근 방식은 높은 위치 정확도를 우선시하기 위해 개척되었으며, 인공지능(AI)의 발전 과정에서 역사적으로 중요한 의미를 갖습니다. "어디에"와 "무엇을"을 분리함으로써, 2단계 탐지기는 일반적으로 더 많은 컴퓨팅 리소스와 느린 추론 지연 시간(inference latency)이라는 비용이 발생하지만, 특히 작거나 가려진 객체에 대해 더 뛰어난 정밀도를 달성하는 경우가 많습니다.
Link to this section2단계 프로세스#
2단계 탐지기의 아키텍처는 사람이 장면을 면밀히 관찰하는 방식을 모방한 순차적 워크플로에 의존합니다.
-
영역 제안(Region Proposal): 첫 번째 단계에서 모델은 입력 이미지를 스캔하여 객체가 존재할 가능성이 있는 영역을 식별합니다. 영역 제안 네트워크(RPN)라고 알려진 구성 요소는 관심 영역(RoI)이라고도 불리는 후보 박스의 희소 집합을 생성합니다. 이 단계는 배경의 대부분을 걸러내어 네트워크가 관련 영역에 처리 능력을 집중할 수 있게 합니다.
-
분류 및 세분화(Classification and Refinement): 두 번째 단계에서 모델은 합성곱 신경망(CNN)을 사용하여 이러한 후보 영역에서 특징을 추출합니다. 그런 다음 각 영역에 특정 클래스 레이블(예: "사람", "차량")을 할당하고, 바운딩 박스의 좌표를 세밀하게 조정하여 객체를 정확히 감싸도록 합니다.
이 아키텍처의 대표적인 예로는 R-CNN 제품군, 특히 수년간 학술적 벤치마크의 표준을 세운 Faster R-CNN과 Mask R-CNN이 있습니다.
Link to this section1단계 탐지기와의 비교#
2단계 모델을 Single Shot MultiBox Detector(SSD) 및 Ultralytics YOLO 시리즈와 같은 1단계 객체 탐지기와 구분하는 것이 도움이 됩니다. 2단계 모델은 영역을 개별적으로 처리하여 정확도를 우선시하는 반면, 1단계 모델은 탐지를 단일 회귀 문제로 구성하여 이미지 픽셀을 바운딩 박스 좌표 및 클래스 확률로 직접 매핑합니다.
역사적으로 이는 상충 관계를 만들었습니다. 즉, 2단계 모델은 더 정확하지만 느렸고, 1단계 모델은 더 빠르지만 정밀도가 낮았습니다. 그러나 현대의 기술 발전으로 이 경계는 모호해졌습니다. YOLO26과 같은 최신 모델은 이제 실시간 추론에 필요한 속도를 유지하면서도 2단계 탐지기의 정확도와 견줄 만한 엔드 투 엔드 아키텍처를 활용합니다.
Link to this section실제 애플리케이션 사례#
정밀도(precision)와 재현율(recall)에 대한 강조 때문에, 2단계 탐지기는 원시 처리 속도보다 안전성과 세부 사항이 더 중요한 시나리오에서 자주 선호됩니다.
- 의료 진단 영상: AI 헬스케어 분야에서는 진단을 놓치는 것이 치명적일 수 있습니다. 2단계 아키텍처는 X-레이나 MRI 스캔에서 종양과 같은 이상 징후를 탐지하기 위한 의료 영상 분석에 자주 사용됩니다. 다단계 프로세스는 복잡한 조직 배경 속에서도 작은 병변을 놓치지 않도록 도와주며, 영상 의학 전문의에게 높은 신뢰도의 자동화된 지원을 제공합니다.
- 고정밀 산업 검사: 스마트 제조 분야에서 자동화된 시각 검사 시스템은 이 모델들을 사용하여 조립 라인의 미세한 결함을 식별합니다. 예를 들어, 터빈 블레이드의 미세 균열을 탐지하려면 2단계 탐지기가 제공하는 높은 IoU(Intersection over Union) 정확도가 필요하며, 이를 통해 결함 없는 부품만이 다음 생산 단계로 진행되도록 보장합니다.
Link to this section최신 탐지 기술 구현#
2단계 탐지기가 고정밀 비전의 기반을 마련했지만, 현대의 개발자들은 비교 가능한 성능을 제공하면서도 훨씬 간편한 배포 워크플로를 갖춘 최신 1단계 모델을 자주 활용합니다. Ultralytics Platform은 이러한 모델의 학습과 배포를 간소화하여 데이터셋과 컴퓨팅 리소스를 효율적으로 관리합니다.
다음 Python 예제는 ultralytics를 사용하여 최신 객체 탐지 워크플로를 로드하고 추론을 실행하는 방법을 보여줍니다. 이는 기존의 2단계 방식과 유사한 고정밀 결과를 달성하면서도 더 높은 효율성을 제공합니다:
from ultralytics import YOLO
# Load the YOLO26 model, a modern high-accuracy detector
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Process results (bounding boxes, classes, and confidence scores)
for result in results:
result.show() # Display the detection outcomes
print(result.boxes.conf) # Print confidence scores





