다중 객체 추적(MOT) 살펴보기: YOLO11, 칼만 필터, 외관 일치 및 최신 데이터 연관을 통해 비디오 프레임 전반에서 객체를 track 재식별합니다.
다중 객체 추적(MOT)은 컴퓨터 비전(CV) 분야의 정교한 기능이다. 컴퓨터 비전(CV) 분야의 정교한 기술로, 으로, 시스템이 일련의 비디오 프레임에 걸쳐 여러 고유 개체를 detect, 식별 및 추적할 수 있게 합니다. 표준 물체 탐지와는 달리 객체 탐지, 모든 이미지 프레임을 독립된 사건으로 취급하는 표준 객체 탐지와 달리, MOT는 인공 지능(AI). 교통 흐름 속 특정 차량이나 스포츠 경기장의 선수 등 탐지된 각 인스턴스에 지속적 식별 번호(ID)를 할당함으로써, MOT는 물체가 이동하고 상호작용하며 심지어 장애물 뒤로 일시적으로 사라지는 동안에도 객체의 정체성을 유지할 수 있게 합니다. 이러한 연속성은 현대 영상 이해 및 행동 분석의 기반이 됩니다.
최첨단 기술로 구동되는 시스템을 포함한 대부분의 현대적 MOT 시스템은 YOLO26를 기반으로 하는 시스템을 포함하여, "탐지를 통한 추적" 패러다임으로 작동합니다. 이 워크플로는 높은 정확도를 보장하기 위해 탐지와 연관의 순환에 의존합니다. 정확도 과 최소화된 ID 전환을 보장합니다.
MOT와 유사한 기계 학습(ML) 간의 차이점 이해 머신 러닝(ML) 용어 간의 차이를 이해하는 것은 적절한 도구 선택에 매우 중요합니다.
비디오 피드를 구조화된 데이터로 변환하는 능력은 산업 전반에 걸쳐 혁신을 주도하며, 이를 통해 예측 모델링 및 자동화된 의사결정을 가능하게 합니다.
그리고 ultralytics 패키지는 MOT를 위한 원활한 인터페이스를 제공하며, 다음과 같은 강력한 알고리즘을 통합합니다:
BoT-SORT 및
ByteTrack다음 예제는 모델을 로드하고 비디오 스트림에서 track 방법을 보여줍니다.
from ultralytics import YOLO
# Load a pre-trained YOLO model (YOLO11n is used here, YOLO26n is also supported)
model = YOLO("yolo11n.pt")
# Perform tracking on a video source
# 'persist=True' ensures tracks are maintained between frames
results = model.track(source="https://youtu.be/LNwODJXcvt4", persist=True, tracker="bytetrack.yaml")
# Visualize the first frame's results with IDs drawn
results[0].show()
이 간단한 워크플로는 탐지, 연관성 분석 및 ID 할당을 자동으로 처리하여 개발자가 지역 계수 같은 상위 수준의 로직에 집중할 수 있도록 합니다. 영역 계수 또는 행동 기반 트리거와 같은 고수준 로직에 집중할 수 있게 합니다. 구성에 대한 자세한 내용은 추적 모드 문서를 참조하십시오.
