다중 객체 추적(MOT)
다중 객체 추적(MOT) 살펴보기: YOLO11, 칼만 필터, 외관 일치 및 최신 데이터 연관을 통해 비디오 프레임 전반에서 객체를 추적하고 재식별합니다.
다중 객체 추적(MOT)은 비디오에서 여러 객체를 감지하고 연속된 프레임에서 각 객체의 고유한 식별을 유지하는 컴퓨터 비전(CV) 의 기본 작업입니다. 단일 이미지에서 객체를 찾아 분류하는 객체 감지와 달리 MOT는 시간적 차원을 추가합니다. "프레임에 어떤 물체가 있는가?"뿐만 아니라 "각 특정 물체가 어디로 가고 있는가?"라는 질문에도 답합니다. 각 객체에 영구 ID를 할당함으로써 MOT는 시간에 따른 움직임, 동작 및 상호 작용을 분석할 수 있어 동적인 장면을 이해하는 데 필수적입니다.
다중 객체 추적 작동 방식
MOT 프로세스는 일반적으로 추적 기반 탐지 패러다임을 따릅니다. 먼저, YOLO11과 같은 객체 감지기를 사용하여 동영상의 각 프레임에 있는 모든 객체를 식별합니다. 그런 다음 감지된 각 객체에는 고유한 추적 ID가 할당됩니다. 이후 프레임에서는 추적 알고리즘이 이러한 객체의 새로운 위치를 예측하여 새로 감지된 객체와 연결합니다. 이 연결은 매우 중요한 단계이며 여러 가지 기술을 사용합니다:
- 모션 예측: 칼만 필터(KF) 와 같은 알고리즘은 과거의 움직임을 기반으로 물체의 미래 위치를 추정합니다. 이를 통해 다음 프레임에서 물체의 검색 범위를 좁힐 수 있습니다.
- 외관 일치: 가려지거나 모양이 바뀐 물체를 다시 식별하기 위해 시스템은 종종 특징적인 특징을 추출합니다. 이러한 특징은 단순한 색상 히스토그램부터 복잡한 딥러닝 기반 임베딩까지 다양합니다.
- 데이터 연결: 이 구성 요소는 기존 오브젝트 트랙과 새로운 탐지 항목을 일치시킵니다. 이러한 할당을 처리하기 위해 헝가리 알고리즘과 같은 정교한 알고리즘이나 바이트트랙 및 BoT-SORT와 같은 최신 트래커에서 사용하는 방법을 사용하여 혼잡한 장면에서도 추적 연속성을 보장합니다.
Ultralytics는 이러한 추적 알고리즘을 원활하게 통합하여 사용자가 고성능 감지기로 강력한 다중 객체 추적을 쉽게 구현할 수 있도록 지원합니다.
다중 객체 추적과 객체 감지 비교
MOT와 객체 감지는 밀접한 관련이 있지만 서로 다른 용도로 사용됩니다. 개체 감지는 일련의 경계 상자와 클래스 레이블을 생성하는 정적 프레임 단위의 분석입니다. 반면, MOT는 시간이 지남에 따라 이러한 감지를 연결하여 각 개체에 대한 지속적인 '스토리'를 생성하는 동적 프로세스입니다. 객체 감지는 일련의 스냅샷을 찍는 것으로 생각할 수 있지만, 다중 객체 추적은 이러한 스냅샷을 조합하여 하나의 동영상을 만들어 객체가 어떻게 움직이고 상호 작용하는지에 대한 줄거리를 드러냅니다.
실제 애플리케이션
MOT는 다양한 산업 분야에서 광범위하게 실용적으로 활용되는 혁신적인 기술입니다.
- 자율주행 차량: 자율주행차의 경우 MOT는 안전을 위해 매우 중요합니다. 이를 통해 차량은 다른 차량, 보행자, 자전거 운전자의 궤적을 추적하고 이들의 움직임을 예측하여 정보에 입각한 결정을 내리고 충돌을 피할 수 있습니다. 이러한 지속적인 추적은 단일 프레임 감지보다 환경에 대한 더 풍부한 이해를 제공합니다.
- 리테일 및 공공장소 분석: 소매업에서 MOT는 유동인구 패턴과 체류 시간을 추적하여 고객 행동을 분석하는 데 사용됩니다. 이를 통해 매장 레이아웃을 최적화하고 대기열을 효과적으로 관리할 수 있습니다. 공공장소에서는 제한 구역에 들어오는 사람이 추적되면 경보가 울리는 보안 경보 시스템을 설정하는 등 군중 관리 및 보안에 사용할 수 있습니다.
- 스포츠 분석: 코치와 분석가는 MOT를 사용하여 선수의 움직임을 모니터링하고, 포메이션을 분석하고, 속도와 이동 거리와 같은 성과 지표를 평가합니다. 이를 자세 추정과 결합하여 운동 기술 및 게임 전략에 대한 보다 상세한 분석을 수행할 수 있습니다.
- 산업 자동화: 공장 현장에서 MOT를 사용하여 컨베이어 벨트 위의 부품을 추적하여 물체 계수 및 품질 관리를 수행함으로써 각 품목이 올바르게 처리되는지 확인할 수 있습니다. 이는 제조업에서 AI의 핵심 구성 요소입니다.