Yolo 비전 선전
선전
지금 참여하기
용어집

다중 객체 추적(MOT)

다중 객체 추적(MOT) 살펴보기: YOLO11, 칼만 필터, 외관 일치 및 최신 데이터 연관을 통해 비디오 프레임 전반에서 객체를 track 재식별합니다.

다중 객체 추적(MOT)은 컴퓨터 비전에서 중요한 작업으로 컴퓨터 비전에서 중요한 작업으로, 비디오 스트림 내에서 여러 개의 여러 개체를 감지하고 연속된 프레임에서 각 개체의 고유한 정체성을 유지하는 작업입니다. 반면 표준 객체 감지는 단일 정적 이미지에 무엇이 있는지 식별하는 반면, MOT는 시간적 차원을 도입하여 특정 객체가 시간에 따라 움직이는 개체가 시간 경과에 따라 어디로 이동하는지에 대한 질문에 답합니다. MOT는 감지된 각 인스턴스에 영구 식별 번호(ID)를 할당함으로써 다음과 같은 기능을 제공합니다. 궤적을 분석하고, 상호 작용을 이해하고, 고유한 항목을 계산할 수 있어 최신 비디오 이해 애플리케이션의 최신 비디오 이해 애플리케이션의 기본 구성 요소입니다.

추적 시스템의 메커니즘

다음에 의해 구동되는 시스템을 포함한 대부분의 최첨단 MOT 시스템은 다음과 같습니다. YOLO11을 포함한 대부분의 최신 MOT 시스템은 "추적에 의한 감지" 패러다임으로 작동합니다. 이 워크플로는 프로세스를 비디오의 모든 프레임에 대해 반복되는 별개의 단계로 분리하여 높은 정확성과 연속성을 보장합니다.

  1. 탐지: 탐지: 시스템은 먼저 고성능 모델을 활용하여 관심 있는 객체를 찾습니다, 경계 상자를 생성하고 신뢰도 점수를 생성합니다.
  2. 모션 예측: 여러 프레임에서 감지된 동작을 연결하기 위해 다음과 같은 알고리즘을 사용합니다. 칼만 필터와 같은 알고리즘은 물체의 과거 속도와 위치를 기반으로 객체의 미래 위치를 추정합니다. 이렇게 하면 상태 추정을 생성하여 다음 프레임에 대한 다음 프레임.
  3. 데이터 연결: 시스템이 새로운 탐지를 기존 트랙과 매칭합니다. 최적화 기술 헝가리 알고리즘과 같은 최적화 기법은 이 매칭 비용을 최소화하여 이 할당 문제를 해결하며, 종종 다음을 계산합니다. 예측된 트랙과 새로운 탐지 사이의 교차점(IoU) 교차점을 계산합니다.
  4. 재식별(ReID): 객체가 경로를 가로지르거나 일시적으로 숨겨져 있는 시나리오에서, 즉 오클루전으로 알려진 고급 트래커는 시각적 임베딩을 사용하여 오브젝트가 다시 나타나면 를 인식하여 ID 전환을 방지합니다.

MOT와 관련 컴퓨터 비전 용어

특정 사용 사례에 적합한 기술을 선택하려면 MOT를 유사한 개념과 구별하는 것이 중요합니다.

  • 대 객체 감지: 감지는 모든 프레임을 독립적인 이벤트로 처리합니다. 차량이 두 프레임 연속으로 두 프레임 연속으로 나타나면 감지기는 "자동차"의 두 가지 개별 인스턴스를 인식합니다. 반대로 객체 추적은 이러한 인스턴스를 연결합니다, 시간을 통해 이동하는 동일한 차량으로 인식합니다.
  • 단일 개체 추적(SOT): SOT는 사용자가 초기화한 하나의 특정 대상을 추적하는 데 중점을 둡니다. 다른 모든 활동을 무시하는 경우가 많습니다. MOT는 자율적으로 detect, track, 관리해야 하므로 더 복잡합니다. 장면에 들어오고 나가는 알 수 없고 변동하는 객체의 수를 자율적으로 감지하고 추적 및 관리해야 하므로 강력한 메모리 관리 로직이 필요합니다.

실제 애플리케이션

여러 개체를 동시에 track 수 있는 기능은 다양한 산업 분야에서 혁신을 주도하고 있으며, 원시 비디오 데이터를 실행 가능한 예측 모델링 인사이트로 전환할 수 있습니다.

  • 지능형 교통: 다음과 같은 분야에서 자동차 분야의 AI, MOT는 자율 주행 및 교통 모니터링에 자율 주행 및 교통 모니터링에 매우 중요합니다. 이를 통해 시스템은 다음을 수행할 수 있습니다. 차량의 이동 거리를 계산하여 속도 추정 차량이 시간 경과에 따라 이동하는 거리를 계산하여 속도를 예측하고, 보행자나 자전거 운전자
  • 리테일 분석: 오프라인 매장에서는 고객 행동을 이해하기 위해 소매업에서 AI를 활용합니다. 다음을 통해 정확한 객체 카운팅을 위해 MOT를 적용합니다, 소매업체는 유동인구를 측정하고, 특정 통로에서의 체류 시간을 분석하고, 대기열 관리를 최적화하여 대기열 관리를 최적화하여 쇼핑 경험을 개선할 수 있습니다.
  • 스포츠 분석: 코치와 분석가들은 경기 중 선수와 공을 track 위해 MOT를 사용합니다. 이 데이터는 고급 포즈 추정 분석을 용이하게 하여 포메이션, 선수의 피로도, 경기 역학 관계를 파악하는 데 도움이 됩니다. 실시간 추론 시나리오.

Python 추적 구현하기

그리고 ultralytics 패키지는 다음과 같은 강력한 트래커를 통합하여 MOT의 복잡성을 간소화합니다. BoT-SORTByteTrack 예측 파이프라인으로 직접 파이프라인으로 직접 전달합니다. 이러한 트래커는 인수를 통해 쉽게 교체할 수 있습니다.

다음 예는 사전 학습된 YOLO11 모델을 로드하고 동영상 파일에 추적을 적용하는 방법을 보여줍니다:

from ultralytics import YOLO

# Load an official YOLO11 model pretrained on COCO
model = YOLO("yolo11n.pt")

# Perform tracking on a video file
# 'persist=True' ensures IDs are maintained between frames
# 'tracker' allows selection of algorithms like 'bytetrack.yaml' or 'botsort.yaml'
results = model.track(source="traffic_analysis.mp4", persist=True, tracker="bytetrack.yaml")

# Visualize the results
for result in results:
    result.show()

이 코드는 탐지부터 ID 할당까지 전체 파이프라인을 처리하므로 개발자는 영역 계산과 동작과 같은 높은 수준의 로직에 집중할 수 있습니다. 분석과 같은 높은 수준의 로직에 집중할 수 있습니다. 추가 사용자 지정은 추적 모드 설명서를 참조하세요.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기