고속 실시간 AI를 위한 단일 단계 객체 탐지기를 살펴보세요. Ultralytics 엣지 AI 및 배포 환경에서 어떻게 탁월한 정확도와 효율성을 제공하는지 알아보세요.
원스테이지 객체 탐지기는 탁월한 속도와 효율성으로 객체 탐지 작업을 수행하도록 설계된 강력한 딥러닝 아키텍처 계열입니다. 탐지 과정을 영역 제안과 후속 분류로 분리하는 기존의 투스테이지 객체 탐지기와 달리, 원스테이지 모델은 단일 패스로 전체 이미지를 분석합니다. 검출을 직접 회귀 문제로 정의함으로써, 이 네트워크는 입력 픽셀로부터 경계 상자 좌표와 클래스 확률을 동시에 예측합니다. 이러한 간소화된 접근 방식은 계산 오버헤드를 크게 줄여, 리소스 제약이 있는 에지 AI 장치에서 실시간 추론 및 배포가 필요한 애플리케이션에 원스테이지 탐지기를 선호하는 선택으로 만듭니다.
1단계 탐지기의 아키텍처는 일반적으로 특징 추출의 백본 역할을 하는 컨볼루션 신경망(CNN)을 중심으로 구성됩니다. 이미지가 네트워크를 통과할 때, 모델은 공간적 및 의미적 정보를 인코딩하는 특징 맵 그리드를 생성합니다.
초기 구현 방식(예: 단일 샷 멀티박스 검출기(SSD))은 다양한 크기의 사전 정의된 앵커 박스에 의존하여 객체를 국소화했습니다. 그러나 현대적인 발전(예: Ultralytics YOLO11 과 최첨단 YOLO26과 같은 현대적 발전은 앵커 프리 설계로 크게 전환되었습니다. 이러한 새로운 아키텍처는 객체 중심과 크기를 직접 예측하여 앵커와 관련된 복잡한 하이퍼파라미터 튜닝의 필요성을 제거합니다. 최종 출력은 로컬라이제이션을 위한 좌표 벡터와 탐지된 객체에 대한 모델의 확신을 나타내는 신뢰도 점수로 구성됩니다.
이 두 가지 주요 범주를 구분하는 것은 특정 작업에 적합한 도구를 선택하는 데 도움이 됩니다:
1단계 검출기의 효율성은 즉각적인 대응이 중요한 다양한 산업 분야에서 그 광범위한 채택을 주도해 왔습니다:
현대적인 고수준 API를 사용하면 단일 단계 탐지기를 구현하는 것은 간단합니다. 정확한 결과를 보장하기 위해 모델은 종종 여러 잠재적 박스를 예측하며, 이후 교차합계(IoU)임계값을 기반으로 한 비최대 억제(NMS) 같은 기법을 사용하여 필터링합니다. 다만 YOLO26 같은 최신 종단간 모델은 이를 기본적으로 처리합니다.
다음 Python 최신 YOLO26 모델을 로드하고 이미지에 대해 추론을 수행하는 방법을 보여줍니다:
from ultralytics import YOLO
# Load the YOLO26 model, the latest natively end-to-end one-stage detector
model = YOLO("yolo26n.pt")
# Run inference on an image URL to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the first result with bounding boxes and labels
results[0].show()
단일 단계 탐지기의 진화는 "정확도 대 속도"의 상충 관계를 극복하는 데 주력해왔다. 훈련 중 클래스 불균형classify 해결하기 위해 초점 손실(Focal Loss )과 같은 기법이 도입되어, 모델이 풍부한 배경보다classify 어려운classify 집중하도록 보장한다. 또한 피처 피라미드 네트워크(FPN) 의 통합으로 이러한 모델들은 다양한 크기의 detect 효과적으로 detect 수 있게 되었다.
오늘날 연구자와 개발자는 데이터 주석 작업부터 모델 배포까지 워크플로를 간소화하는 Ultralytics 같은 도구를 활용해 맞춤형 데이터셋으로 이러한 고급 아키텍처를 손쉽게 훈련할 수 있습니다. 농업이든 의료 분야든, 원스테이지 탐지기의 접근성 향상은 강력한 컴퓨터 비전 기술의 민주화를 이끌고 있습니다.