Yolo 비전 선전
선전
지금 참여하기
용어집

다중 객체 추적(MOT)

컴퓨터 비전에서 다중 객체 추적(MOT)을 탐구하세요. 자율 주행, 소매업 등 다양한 분야에서 Ultralytics 활용해 track detect track 방법을 배워보세요.

다중 객체 추적(MOT)은 컴퓨터 비전(CV) 분야의 동적 작업으로, 동영상 스트림 내에서 여러 개의 서로 다른 개체를 탐지하고 시간 경과에 따라 그 정체성을 유지하는 것을 포함합니다. 모든 프레임을 독립적인 스냅샷으로 취급하는 표준 객체 탐지와 달리, MOT는 인공지능(AI)에 시간적 차원을 도입합니다. 군중 속 특정 보행자나 고속도로 위 차량과 같이 탐지된 각 인스턴스에 고유 식별 번호(ID)를 할당함으로써 MOT 알고리즘은 시스템이 궤적을 추적하고, 행동을 분석하며, 상호작용을 이해할 수 있게 합니다. 이 기능은 현대적 영상 이해의 근간이 되며, 변화하는 환경 속 연속성을 기계가 인지할 수 있도록 합니다.

MOT의 작동 방식

대부분의 현대적 추적 시스템은 "탐지를 통한 추적" 패러다임으로 작동한다. 이 접근법은 프레임 내 존재물을 식별하는 과정과, 그 결과를 과거 기록의 알려진 객체와 연결하는 과정으로 두 단계로 분리한다.

  1. 탐지: 각 프레임에서 YOLO26과 같은 고성능 모델이 이미지를 스캔하여 물체를 찾아내고, 경계 상자와 클래스 확률을 생성합니다.
  2. 모션 예측: 물체가 다음에 어디로 움직일지 예측하기 위해 알고리즘은 종종 칼만 필터를 사용합니다. 이 수학적 도구는 속도나 위치와 같은 동적 시스템의 상태를 추정하여 후속 프레임에서 탐색 영역을 좁히는 데 도움을 줍니다.
  3. 데이터 연관성: 시스템은 새로 탐지된 객체를 기존 추적 기록과 매칭합니다. 헝가리안 알고리즘과 같은 최적화 기법은 매칭 비용을 최소화하여 이 할당 문제를 해결하며, 공간적 중첩을 측정하기 위해 종종 교집합 대비 합집합(IoU) 에 의존합니다.
  4. 재식별(ReID): 시각적 장애물(폐색)이 발생할 경우, 고급 추적기는 시각 임베딩을 활용해 대상물이 재등장할 때 이를 인식합니다. 이는 "ID 전환"을 방지하여 터널에서 나오는 차량이 진입한 차량과 동일함을 시스템이 인지하도록 보장합니다.

MOT와 단일 객체 추적의 구분

용어는 유사하지만, 다중 객체 추적(MOT)단일 객체 추적(SOT)과 크게 다릅니다. SOT는 첫 번째 프레임에서 초기화된 하나의 특정 표적을 추적하는 데 집중하며, 다른 모든 개체는 종종 무시합니다. 반면 MOT는 언제든지 장면에 진입하거나 이탈할 수 있는 알려지지 않고 변동하는 수의 표적을 처리해야 합니다. 이는 track , 종료 및 여러 움직이는 물체 간의 복잡한 상호작용을 처리하기 위한 강력한 논리를 요구하므로 MOT가 계산적으로 더 까다롭습니다.

실제 애플리케이션

track 개체를 동시에 track 수 있는 능력은 여러 주요 산업 전반에 걸쳐 혁신을 주도합니다.

  • 자율 주행: 자율주행차는 안전한 주행을 위해 MOT(Motion Object Tracking)에 크게 의존합니다. 보행자, 자전거 이용자 및 다른 차량을 추적함으로써 자율 시스템은 충돌을 피하기 위해 미래 위치를 예측할 수 있습니다. 이는 최대의 신뢰성을 위해 카메라와 라이다 센서의 데이터를 융합하는 과정을 수반하는 경우가 많습니다.
  • 소매 분석: 오프라인 매장에서 소매업체는 소매 AI를 활용해 고객 여정을 분석합니다. MOT 알고리즘은 발걸음 흐름의 히트맵을 생성하여 관리자가 매장 레이아웃을 최적화하고 피크 시간대 대기열 관리를 개선하는 데 도움을 줍니다.
  • 스포츠 분석: 프로팀들은 MOT를 활용해 선수 움직임과 팀 포메이션을 분석합니다. 경기장 내 모든 선수를 추적함으로써 코치진은 자세 추정 기술을 통해 속도, 이동 거리, 전술적 포지셔닝에 대한 상세한 지표를 도출할 수 있습니다.

파이 Python으로 MOT 구현하기

Ultralytics 최신 모델을 활용한 추적 구현을 간편하게 Ultralytics . track() 이 방법은 탐지 및 추적 로직을 원활하게 통합하여 다음과 같은 알고리즘을 지원합니다: ByteTrackBoT-SORT아래 예시는 권장되는 방법을 사용하여 비디오 내 차량을 추적하는 방법을 보여줍니다. YOLO26 모델.

from ultralytics import YOLO

# Load the official YOLO26 small model
model = YOLO("yolo26s.pt")

# Track objects in a video file (or use '0' for webcam)
# The 'persist=True' argument keeps track IDs consistent between frames
results = model.track(source="traffic_analysis.mp4", show=True, persist=True)

# Print the IDs of objects tracked in the first frame
if results[0].boxes.id is not None:
    print(f"Tracked IDs: {results[0].boxes.id.int().tolist()}")

다중 객체 추적의 과제

기술 발전에도 불구하고 MOT는 여전히 도전적인 분야입니다. 주요 난제는 가림 현상인데, 물체가 경로를 가로지르거나 장애물 뒤에 숨을 때 동일체 유지가 복잡해집니다. 혼잡한 장면(예: 마라톤 대회나 새 떼)은 데이터 연관 알고리즘의 한계를 시험합니다. 또한 고해상도 영상 스트림 처리 시 실시간 추론 속도를 유지하려면 효율적인 모델 아키텍처와 NVIDIA 장치 같은 특수 하드웨어가 종종 필요합니다.

이러한 과제를 해결하기 위해 연구자들은 탐지 및 추적을 단일 네트워크로 통합하는 종단간 딥러닝 접근법을 탐구하고 있으며, 동시에 Ultralytics 활용하여 까다로운 데이터셋에 주석을 달고 견고한 맞춤형 모델을 훈련시키고 있습니다.

함께 AI의 미래를 만들어 갑시다!

미래의 머신러닝 여정을 시작하세요