용어집

다중 객체 추적(MOT)

컴퓨터 비전에서 다중 객체 추적(MOT)을 탐구하세요. 자율 주행, 소매업 등 다양한 분야에서 Ultralytics 활용해 track detect track 방법을 배워보세요.

다중 객체 추적(MOT)은 컴퓨터 비전(CV) 분야의 동적 작업으로, 동영상 스트림 내에서 여러 개의 서로 다른 개체를 탐지하고 시간 경과에 따라 그 정체성을 유지하는 것을 포함합니다. 모든 프레임을 독립적인 스냅샷으로 취급하는 표준 객체 탐지와 달리, MOT는 인공지능(AI)에 시간적 차원을 도입합니다. 군중 속 특정 보행자나 고속도로 위 차량과 같이 탐지된 각 인스턴스에 고유 식별 번호(ID)를 할당함으로써 MOT 알고리즘은 시스템이 궤적을 추적하고, 행동을 분석하며, 상호작용을 이해할 수 있게 합니다. 이 기능은 현대적 영상 이해의 근간이 되며, 변화하는 환경 속 연속성을 기계가 인지할 수 있도록 합니다.

MOT의 작동 방식

대부분의 현대적 추적 시스템은 "탐지를 통한 추적" 패러다임으로 작동한다. 이 접근법은 프레임 내 존재물을 식별하는 과정과, 그 결과를 과거 기록의 알려진 객체와 연결하는 과정으로 두 단계로 분리한다.

탐지: 각 프레임에서 YOLO26과 같은 고성능 모델이 이미지를 스캔하여 물체를 찾아내고, 경계 상자와 클래스 확률을 생성합니다.
모션 예측: 물체가 다음에 어디로 움직일지 예측하기 위해 알고리즘은 종종 칼만 필터를 사용합니다. 이 수학적 도구는 속도나 위치와 같은 동적 시스템의 상태를 추정하여 후속 프레임에서 탐색 영역을 좁히는 데 도움을 줍니다.
데이터 연관성: 시스템은 새로 탐지된 객체를 기존 추적 기록과 매칭합니다. 헝가리안 알고리즘과 같은 최적화 기법은 매칭 비용을 최소화하여 이 할당 문제를 해결하며, 공간적 중첩을 측정하기 위해 종종 교집합 대비 합집합(IoU) 에 의존합니다.
재식별(ReID): 시각적 장애물(폐색)이 발생할 경우, 고급 추적기는 시각 임베딩을 활용해 대상물이 재등장할 때 이를 인식합니다. 이는 "ID 전환"을 방지하여 터널에서 나오는 차량이 진입한 차량과 동일함을 시스템이 인지하도록 보장합니다.

MOT와 단일 객체 추적의 구분

용어는 유사하지만, 다중 객체 추적(MOT) 은 단일 객체 추적(SOT)과 크게 다릅니다. SOT는 첫 번째 프레임에서 초기화된 하나의 특정 표적을 추적하는 데 집중하며, 다른 모든 개체는 종종 무시합니다. 반면 MOT는 언제든지 장면에 진입하거나 이탈할 수 있는 알려지지 않고 변동하는 수의 표적을 처리해야 합니다. 이는 track , 종료 및 여러 움직이는 물체 간의 복잡한 상호작용을 처리하기 위한 강력한 논리를 요구하므로 MOT가 계산적으로 더 까다롭습니다.

실제 애플리케이션

track 개체를 동시에 track 수 있는 능력은 여러 주요 산업 전반에 걸쳐 혁신을 주도합니다.

자율 주행: 자율주행차는 안전한 주행을 위해 MOT(Motion Object Tracking)에 크게 의존합니다. 보행자, 자전거 이용자 및 다른 차량을 추적함으로써 자율 시스템은 충돌을 피하기 위해 미래 위치를 예측할 수 있습니다. 이는 최대의 신뢰성을 위해 카메라와 라이다 센서의 데이터를 융합하는 과정을 수반하는 경우가 많습니다.
소매 분석: 오프라인 매장에서 소매업체는 소매 AI를 활용해 고객 여정을 분석합니다. MOT 알고리즘은 발걸음 흐름의 히트맵을 생성하여 관리자가 매장 레이아웃을 최적화하고 피크 시간대 대기열 관리를 개선하는 데 도움을 줍니다.
스포츠 분석: 프로팀들은 MOT를 활용해 선수 움직임과 팀 포메이션을 분석합니다. 경기장 내 모든 선수를 추적함으로써 코치진은 자세 추정 기술을 통해 속도, 이동 거리, 전술적 포지셔닝에 대한 상세한 지표를 도출할 수 있습니다.

파이 Python으로 MOT 구현하기

Ultralytics 최신 모델을 활용한 추적 구현을 간편하게 Ultralytics . track() 이 방법은 탐지 및 추적 로직을 원활하게 통합하여 다음과 같은 알고리즘을 지원합니다: ByteTrack 및 BoT-SORT아래 예시는 권장되는 방법을 사용하여 비디오 내 차량을 추적하는 방법을 보여줍니다. YOLO26 모델.

from ultralytics import YOLO

# Load the official YOLO26 small model
model = YOLO("yolo26s.pt")

# Track objects in a video file (or use '0' for webcam)
# The 'persist=True' argument keeps track IDs consistent between frames
results = model.track(source="traffic_analysis.mp4", show=True, persist=True)

# Print the IDs of objects tracked in the first frame
if results[0].boxes.id is not None:
    print(f"Tracked IDs: {results[0].boxes.id.int().tolist()}")

다중 객체 추적의 과제

기술 발전에도 불구하고 MOT는 여전히 도전적인 분야입니다. 주요 난제는 가림 현상인데, 물체가 경로를 가로지르거나 장애물 뒤에 숨을 때 동일체 유지가 복잡해집니다. 혼잡한 장면(예: 마라톤 대회나 새 떼)은 데이터 연관 알고리즘의 한계를 시험합니다. 또한 고해상도 영상 스트림 처리 시 실시간 추론 속도를 유지하려면 효율적인 모델 아키텍처와 NVIDIA 장치 같은 특수 하드웨어가 종종 필요합니다.

이러한 과제를 해결하기 위해 연구자들은 탐지 및 추적을 단일 네트워크로 통합하는 종단간 딥러닝 접근법을 탐구하고 있으며, 동시에 Ultralytics 활용하여 까다로운 데이터셋에 주석을 달고 견고한 맞춤형 모델을 훈련시키고 있습니다.

다중 객체 추적(MOT)

산업 전반의 워크플로우를 간소화하기 위한 Ultralytics YOLO 모델 교육

혁신을 강화하는 유연한 엔터프라이즈 라이선스 솔루션

Ultralytics YOLO 몇 초 만에 AI 모델 훈련하기

MOT의 작동 방식

MOT와 단일 객체 추적의 구분

실제 애플리케이션

파이 Python으로 MOT 구현하기

다중 객체 추적의 과제

이 카테고리에서 더 읽어보기

컴퓨터 비전으로 구현된 12가지 항공 이미지 활용 사례

단안 깊이 추정이란 무엇인가? 개요

Ultralytics YOLO 활용한 AI 위협 탐지 기술 분석

Ultralytics 커뮤니티 가입