Yolo 비전 선전
선전
지금 참여하기
용어집

다중 객체 추적(MOT)

다중 객체 추적(MOT) 살펴보기: YOLO11, 칼만 필터, 외관 일치 및 최신 데이터 연관을 통해 비디오 프레임 전반에서 객체를 track 재식별합니다.

다중 객체 추적(MOT)은 컴퓨터 비전(CV) 분야의 정교한 기능이다. 컴퓨터 비전(CV) 분야의 정교한 기술로, 으로, 시스템이 일련의 비디오 프레임에 걸쳐 여러 고유 개체를 detect, 식별 및 추적할 수 있게 합니다. 표준 물체 탐지와는 달리 객체 탐지, 모든 이미지 프레임을 독립된 사건으로 취급하는 표준 객체 탐지와 달리, MOT는 인공 지능(AI). 교통 흐름 속 특정 차량이나 스포츠 경기장의 선수 등 탐지된 각 인스턴스에 지속적 식별 번호(ID)를 할당함으로써, MOT는 물체가 이동하고 상호작용하며 심지어 장애물 뒤로 일시적으로 사라지는 동안에도 객체의 정체성을 유지할 수 있게 합니다. 이러한 연속성은 현대 영상 이해 및 행동 분석의 기반이 됩니다.

추적 시스템의 메커니즘

최첨단 기술로 구동되는 시스템을 포함한 대부분의 현대적 MOT 시스템은 YOLO26를 기반으로 하는 시스템을 포함하여, "탐지를 통한 추적" 패러다임으로 작동합니다. 이 워크플로는 높은 정확도를 보장하기 위해 탐지와 연관의 순환에 의존합니다. 정확도 과 최소화된 ID 전환을 보장합니다.

  1. 탐지: 모든 프레임에서 YOLO26이나 이전 세대 모델과 같은 고속 모델 YOLO11 가 장면을 스캔하여 객체를 찾아내고, 경계 상자를 생성합니다. 경계 상자 과 클래스 확률
  2. 운동 예측: 물체가 다음에 어디로 움직일지 예측하기 위해 알고리즘은 칼만 필터와 같은 수학적 추정기를 활용합니다. 칼만 필터과 같은 수학적 추정기를 활용합니다. 이를 통해 속도와 궤적에 기반한 상태 추정 을 생성하여 후속 프레임에 대한 탐색 영역을 좁힙니다.
  3. 데이터 연관: 시스템은 새로운 탐지 결과를 기존 추적 정보와 매칭합니다. 최적화 방법으로는 헝가리 알고리즘 헝가리안 알고리즘 이 할당 문제를 해결하며, 종종 교집합이 합집합을 넘어서기(Intersection over Union, IoU)를 사용하여 매칭의 "비용"을 최소화합니다. 공간적 중첩을 측정하기 위해 Intersection over Union(IoU) 를 사용하여 공간적 중첩을 측정합니다.
  4. 재식별(ReID): 시각적 장애물( 폐색)이 발생할 경우, 고급 추적기는 시각적 임베딩을 활용합니다. 임베딩을 활용하여 을 활용하여 객체가 재등장할 때 이를 인식하고, 새로운 개체로 취급하기보다는 원래의 ID를 유지합니다.

MOT 대 관련 개념

MOT와 유사한 기계 학습(ML) 간의 차이점 이해 머신 러닝(ML) 용어 간의 차이를 이해하는 것은 적절한 도구 선택에 매우 중요합니다.

  • 대형물체탐지(Object Detection): 정적 이미지에서 탐지는 "무엇이 어디에 있는가"에 답합니다. 프레임 1과 프레임 2에 사람이 나타난다면, 탐지기는 두 명의 별개 인물을 인식합니다. 동일인물추적(MOT)은 이들을 연결하여 시간이 지나며 이동하는 동일 인물임을 이해합니다.
  • vs. 단일 객체 추적(SOT): SOT는 주로 사용자가 수동으로 초기화하는 특정 목표물을 추적하는 데 집중하며, 다른 방해 요소와 무관하게 이를 추적합니다. 다중 객체 추적(MOT)은 장면에 진입하거나 이탈하는 알려지지 track 변동 수의 track 자율적으로 detect track 하므로 더 복잡하며, 강력한 메모리 관리 논리가 필요합니다.

실제 애플리케이션

비디오 피드를 구조화된 데이터로 변환하는 능력은 산업 전반에 걸쳐 혁신을 주도하며, 이를 통해 예측 모델링 및 자동화된 의사결정을 가능하게 합니다.

  • 지능형 교통 시스템: 자동차 분야의 자동차 AI 분야에서 분야에서 MOT는 자율주행차와 스마트 시티 인프라에 필수적입니다. 이는 속도 추정을 가능하게 합니다. 속도 추정 시간 경과에 따른 차량 이동 거리를 분석하여 속도 추정 기능을 제공하며, 보행자 및 자전거 이용자의 궤적을 예측함으로써 사고 예방에 기여합니다.
  • 소매 분석: 오프라인 매장은 소매업에서 인공지능(AI)을 활용하여 를 통해 쇼핑객 행동을 분석합니다. MOT를 적용하여 물체 계수을 통해 소매업체는 유동인구가 많은 통로의 히트맵을 생성하고 체류 시간을 모니터링하며 대기열 관리를 통해 을 통해 계산대 대기 시간을 단축할 수 있습니다.

Python 추적 구현하기

그리고 ultralytics 패키지는 MOT를 위한 원활한 인터페이스를 제공하며, 다음과 같은 강력한 알고리즘을 통합합니다: BoT-SORTByteTrack다음 예제는 모델을 로드하고 비디오 스트림에서 track 방법을 보여줍니다.

from ultralytics import YOLO

# Load a pre-trained YOLO model (YOLO11n is used here, YOLO26n is also supported)
model = YOLO("yolo11n.pt")

# Perform tracking on a video source
# 'persist=True' ensures tracks are maintained between frames
results = model.track(source="https://youtu.be/LNwODJXcvt4", persist=True, tracker="bytetrack.yaml")

# Visualize the first frame's results with IDs drawn
results[0].show()

이 간단한 워크플로는 탐지, 연관성 분석 및 ID 할당을 자동으로 처리하여 개발자가 지역 계수 같은 상위 수준의 로직에 집중할 수 있도록 합니다. 영역 계수 또는 행동 기반 트리거와 같은 고수준 로직에 집중할 수 있게 합니다. 구성에 대한 자세한 내용은 추적 모드 문서를 참조하십시오.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기