Yolo 비전 선전
선전
지금 참여하기
용어집

2단계 객체 탐지기

복잡한 컴퓨터 비전 작업에서 정확한 객체 탐지를 위한 정확도 중심 솔루션인 2단계 객체 탐지기의 강력한 성능을 경험해 보세요.

2단계 물체 감지기는 정교한 딥러닝 모델 중 하나로 딥러닝 모델의 한 종류로, 이미지 내에서 물체를 식별하고 이미지 내에서 높은 정밀도로 물체를 식별하고 위치를 파악하도록 설계된 정교한 딥러닝 모델입니다. 더 빠른 아키텍처와 달리 이 아키텍처는 물체 감지 작업을 객체 감지 작업을 두 단계로 나눕니다: 물체가 존재할 수 있는 잠재적 영역을 식별한 다음, 해당 영역을 분류하면서 그 물체의 좌표. 이러한 분할 프로세스 접근 방식은 역사적으로 2단계 감지기가 정확도가 가장 중요한 작업의 표준으로 자리 잡았습니다. 정확도가 가장 중요하지만 속도와 컴퓨팅 리소스를 계산 리소스.

2단계 워크플로

2단계 탐지기의 아키텍처는 깔때기처럼 작동하여 광범위한 이미지에서 특정 물체로 데이터를 좁혀줍니다, 분류된 객체로 좁혀줍니다. 이 프로세스에는 일반적으로 특징 추출을 위한 ResNet과 같은 백본 네트워크를 통해 피처를 추출합니다, 그 다음 두 가지 중요한 단계가 이어집니다:

  1. 지역 제안: 첫 번째 단계에서는 흔히 지역 제안 네트워크(RPN)라고 하는 구성 요소를 사용합니다. 이 네트워크는 백본에서 생성된 피처 맵을 스캔하여 백본에서 생성된 피처 맵을 스캔하여 "관심 영역"(RoI)을 식별합니다. 이 시점에서 모델은 개체를 분류하지 않습니다. 개체를 분류하는 것이 아니라 기본적으로 백그라운드 필터 역할을 하며, 무언가가 포함될 가능성이 있는 영역과 비어 있는 영역을 비어 있는 영역에 플래그를 지정하는 백그라운드 필터 역할을 합니다. 이 개념은 중요한 Faster R-CNN 연구 논문에서 구체화되었습니다.
  2. 분류 및 세분화: 두 번째 단계에서는 제안된 영역이 고정된 크기로 풀링되어 크기로 풀링하여 특정 탐지 헤드에 공급합니다. 이 헤드는 두 가지 작업을 동시에 수행합니다. 특정 클래스 레이블(예: "사람", "차량" "차량")을 객체에 할당하고 바운딩 박스 회귀를 사용하여 좌표를 조정합니다, 상자가 객체에 꼭 맞는지 확인합니다.

Two-Stage 감지기 vs. One-Stage 감지기

2단계와 1단계 물체 감지기의 차이점을 이해하는 것은 1단계 물체 감지기의 차이를 이해하는 것은 애플리케이션에 적합한 모델을 선택하기 위한 기본입니다.

  • 2단계 검출기(예: 더 빠른 R-CNN, 마스크 R-CNN): 이 모델은 정밀도를 우선시합니다. 제안과 분류를 제안과 분류를 분리하여 물체가 겹치거나 작은 디테일이 있는 복잡한 장면을 매우 잘 처리합니다. 하지만 이 이중 확인 메커니즘은 추론 지연 시간이 길어져 추론 지연 시간이 길어지므로 즉각적인 응답이 필요한 환경에 배포하기 어렵습니다.
  • 1단계 감지기(예: YOLO, SSD): 다음과 같은 아키텍처 Ultralytics YOLO 시리즈와 같은 아키텍처는 탐지를 단일 회귀 문제로 처리합니다. 이미지 픽셀을 바운딩 박스 좌표와 클래스 확률에 직접 매핑하여 한 번에 처리합니다. 역사적으로 는 역사적으로 2단계 모델보다 정확도가 떨어졌지만, 최신 반복 방식인 YOLO11 와 같은 최신 반복은 정확도 격차를 효과적으로 좁히면서 실시간 추론 속도를 유지하면서 정확도 격차를 효과적으로 줄였습니다.

역사 속 주요 아키텍처

여러 아키텍처가 2단계 탐지의 진화를 정의했습니다:

실제 애플리케이션

2단계 감지기는 작은 물체를 찾아내고 오탐지를 최소화하는 데 탁월하기 때문에 오탐지를 최소화하는 데 탁월하기 때문에 특정 산업 분야에서 여전히 필수적입니다.

  • 의료 이미지 분석: 방사선과에서 CT 스캔에서 작은 결절이나 종양을 식별하려면 가능한 최고의 감도가 필요합니다. 2단계 모델은 중요한 진단을 놓칠 위험을 최소화하기 위해 종종 사용됩니다. 의료 연구에서의 AI.
  • 자동화된 품질 검사: 제조 분야에서 회로 기판이나 가공된 부품의 미세한 결함을 식별하려면 고해상도 분석이 필요합니다. 2단계 디텍터의 정밀한 위치 파악 기능은 놓칠 수 있는 결함을 더 빠르고 세분화된 모델에서 놓칠 수 있는 결함을 더 빠르고 덜 세분화된 모델로 탐지할 수 있습니다.

고정밀 탐지 구현하기

Ultralytics 최첨단 1단계 모델에 특화되어 있지만, YOLO11 같은 최신 버전은 일반적으로 2단계 탐지기와 관련된 높은 높은 정확도를 제공하지만, 2단계 탐지기에 비해 훨씬 빠른 모델 학습 및 추론이 훨씬 빠릅니다.

다음은 사전 학습된 YOLO11 모델을 사용하여 구현하는 방법입니다. ultralytics 패키지를 통해 고정밀 탐지 결과를 얻을 수 있습니다:

from ultralytics import YOLO

# Load a high-accuracy pre-trained YOLO11 model (Large variant)
# 'yolo11l.pt' offers a balance of high accuracy comparable to older two-stage models
model = YOLO("yolo11l.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Display the results with bounding boxes
results[0].show()

관련 개념

  • 앵커 상자: 사전 정의된 상자 모양 많은 2단계 감지기가 제안 단계에서 객체 크기와 종횡비를 추정하는 데 사용합니다.
  • 비 최대 억제(NMS): 1단계 및 2단계 탐지기에 모두 사용되는 후처리 기술로 중복되는 상자를 제거합니다, 가장 확실한 탐지만 남도록 보장합니다.
  • 유니온에 대한 교차(IoU): 예측된 박스와 기준값 사이의 중첩을 측정하는 데 사용되는 메트릭으로, RPN 및 정제 헤드를 훈련하는 데 필수적인 지표입니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기