컴퓨터 비전에서 다중 객체 추적(MOT)을 탐구하세요. 자율 주행, 소매업 등 다양한 분야에서 Ultralytics 활용해 track detect track 방법을 배워보세요.
다중 객체 추적(MOT)은 컴퓨터 비전(CV) 분야의 동적 작업으로, 동영상 스트림 내에서 여러 개의 서로 다른 개체를 탐지하고 시간 경과에 따라 그 정체성을 유지하는 것을 포함합니다. 모든 프레임을 독립적인 스냅샷으로 취급하는 표준 객체 탐지와 달리, MOT는 인공지능(AI)에 시간적 차원을 도입합니다. 군중 속 특정 보행자나 고속도로 위 차량과 같이 탐지된 각 인스턴스에 고유 식별 번호(ID)를 할당함으로써 MOT 알고리즘은 시스템이 궤적을 추적하고, 행동을 분석하며, 상호작용을 이해할 수 있게 합니다. 이 기능은 현대적 영상 이해의 근간이 되며, 변화하는 환경 속 연속성을 기계가 인지할 수 있도록 합니다.
대부분의 현대적 추적 시스템은 "탐지를 통한 추적" 패러다임으로 작동한다. 이 접근법은 프레임 내 존재물을 식별하는 과정과, 그 결과를 과거 기록의 알려진 객체와 연결하는 과정으로 두 단계로 분리한다.
용어는 유사하지만, 다중 객체 추적(MOT) 은 단일 객체 추적(SOT)과 크게 다릅니다. SOT는 첫 번째 프레임에서 초기화된 하나의 특정 표적을 추적하는 데 집중하며, 다른 모든 개체는 종종 무시합니다. 반면 MOT는 언제든지 장면에 진입하거나 이탈할 수 있는 알려지지 않고 변동하는 수의 표적을 처리해야 합니다. 이는 track , 종료 및 여러 움직이는 물체 간의 복잡한 상호작용을 처리하기 위한 강력한 논리를 요구하므로 MOT가 계산적으로 더 까다롭습니다.
track 개체를 동시에 track 수 있는 능력은 여러 주요 산업 전반에 걸쳐 혁신을 주도합니다.
Ultralytics 최신 모델을 활용한 추적 구현을 간편하게 Ultralytics .
track() 이 방법은 탐지 및 추적 로직을 원활하게 통합하여 다음과 같은 알고리즘을 지원합니다:
ByteTrack 및
BoT-SORT아래 예시는 권장되는 방법을 사용하여
비디오 내 차량을 추적하는 방법을 보여줍니다.
YOLO26 모델.
from ultralytics import YOLO
# Load the official YOLO26 small model
model = YOLO("yolo26s.pt")
# Track objects in a video file (or use '0' for webcam)
# The 'persist=True' argument keeps track IDs consistent between frames
results = model.track(source="traffic_analysis.mp4", show=True, persist=True)
# Print the IDs of objects tracked in the first frame
if results[0].boxes.id is not None:
print(f"Tracked IDs: {results[0].boxes.id.int().tolist()}")
기술 발전에도 불구하고 MOT는 여전히 도전적인 분야입니다. 주요 난제는 가림 현상인데, 물체가 경로를 가로지르거나 장애물 뒤에 숨을 때 동일체 유지가 복잡해집니다. 혼잡한 장면(예: 마라톤 대회나 새 떼)은 데이터 연관 알고리즘의 한계를 시험합니다. 또한 고해상도 영상 스트림 처리 시 실시간 추론 속도를 유지하려면 효율적인 모델 아키텍처와 NVIDIA 장치 같은 특수 하드웨어가 종종 필요합니다.
이러한 과제를 해결하기 위해 연구자들은 탐지 및 추적을 단일 네트워크로 통합하는 종단간 딥러닝 접근법을 탐구하고 있으며, 동시에 Ultralytics 활용하여 까다로운 데이터셋에 주석을 달고 견고한 맞춤형 모델을 훈련시키고 있습니다.