Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Inseguimento di più oggetti (MOT)

Esplora il Multi-Object Tracking (MOT) nella visione artificiale. Scopri come detect track utilizzando Ultralytics per la guida autonoma, la vendita al dettaglio e altro ancora.

Il Multi-Object Tracking (MOT) è un'attività dinamica nell'ambito della visione artificiale (CV) che comporta il rilevamento di più entità distinte all'interno di un flusso video e il mantenimento delle loro identità nel tempo. A differenza del rilevamento standard degli oggetti, che tratta ogni fotogramma come un' istantanea isolata, il MOT introduce una dimensione temporale nell' intelligenza artificiale (AI). Assegnando un numero di identificazione univoco (ID) a ciascuna istanza rilevata, come un pedone specifico in una folla o un veicolo su un'autostrada, gli algoritmi MOT consentono ai sistemi di tracciare traiettorie, analizzare comportamenti e comprendere interazioni. Questa capacità è fondamentale per la moderna comprensione dei video e consente alle macchine di percepire la continuità in un ambiente in evoluzione.

Come funziona il MOT

La maggior parte dei sistemi di tracciamento contemporanei opera secondo un paradigma di "tracciamento tramite rilevamento". Questo approccio separa il processo in due fasi principali: identificare ciò che si trova nell'inquadratura e poi associare tali risultati a oggetti noti del passato.

  1. Rilevamento: in ogni fotogramma, un modello ad alte prestazioni come YOLO26 scansiona l'immagine per individuare gli oggetti, generando riquadri di delimitazione e probabilità di classe.
  2. Previsione del movimento: per anticipare dove si sposterà un oggetto, gli algoritmi utilizzano spesso un filtro di Kalman. Questo strumento matematico stima lo stato di un sistema dinamico, come la velocità e la posizione, contribuendo a restringere l'area di ricerca nel fotogramma successivo .
  3. Associazione dei dati: il sistema abbina i nuovi rilevamenti alle tracce esistenti. Metodi di ottimizzazione come l'algoritmo ungherese risolvono questo problema di assegnazione riducendo al minimo il costo dell'abbinamento, spesso basandosi sull' Intersection over Union (IoU) per misurare la sovrapposizione spaziale.
  4. Re-identificazione (ReID): quando si verificano ostacoli visivi, noti come occlusioni, i tracker avanzati utilizzano incorporamenti visivi per riconoscere l'oggetto quando riappare. Questo aiuta a prevenire lo "scambio di identità", assicurando che il sistema sappia che l'auto che esce da un tunnel è la stessa che vi è entrata.

Distinguere il MOT dal tracciamento di oggetti singoli

Sebbene la terminologia sia simile, il Multi-Object Tracking (MOT) differisce in modo significativo dal Single Object Tracking (SOT). Il SOT si concentra sul seguire un bersaglio specifico inizializzato nel primo fotogramma, spesso ignorando tutte le altre entità. Al contrario, il MOT deve gestire un numero sconosciuto e variabile di bersagli che possono entrare o uscire dalla scena in qualsiasi momento. Ciò rende il MOT più impegnativo dal punto di vista computazionale, poiché richiede una logica robusta per gestire track e la fine track e le complesse interazioni tra più corpi in movimento.

Applicazioni nel mondo reale

La capacità di track entità contemporaneamente stimola l'innovazione in diversi settori industriali di rilievo.

  • Guida autonoma: le auto a guida autonoma si affidano fortemente al MOT per navigare in sicurezza. Tracciando pedoni, ciclisti e altri veicoli, i sistemi autonomi possono prevedere le posizioni future per evitare collisioni. Ciò spesso comporta la fusione dei dati provenienti dalle telecamere e dai sensori LiDAR per la massima affidabilità.
  • Analisi dei dati di vendita al dettaglio : nei negozi fisici, i rivenditori utilizzano l'intelligenza artificiale per mappare il percorso dei clienti. Gli algoritmi MOT generano mappe di calore del traffico pedonale, aiutando i manager a ottimizzare la disposizione dei negozi e a migliorare la gestione delle code nelle ore di punta.
  • Analisi sportive: le squadre professionistiche utilizzano il MOT per analizzare i movimenti dei giocatori e le formazioni delle squadre. Tracciando ogni giocatore sul campo, gli allenatori possono estrarre metriche dettagliate su velocità, distanza percorsa e posizionamento tattico utilizzando tecniche di stima della posizione.

Implementazione di MOT con Python

Ultralytics l'implementazione del tracciamento con modelli all'avanguardia. Il track() Il metodo integra perfettamente la logica di rilevamento e tracciamento, supportando algoritmi come ByteTrack e SORTEGGIAMENTO. L'esempio riportato di seguito mostra come tracciare i veicoli in un video utilizzando il metodo consigliato Modello YOLO26.

from ultralytics import YOLO

# Load the official YOLO26 small model
model = YOLO("yolo26s.pt")

# Track objects in a video file (or use '0' for webcam)
# The 'persist=True' argument keeps track IDs consistent between frames
results = model.track(source="traffic_analysis.mp4", show=True, persist=True)

# Print the IDs of objects tracked in the first frame
if results[0].boxes.id is not None:
    print(f"Tracked IDs: {results[0].boxes.id.int().tolist()}")

Sfide nel tracciamento multi-oggetto

Nonostante i progressi, il MOT rimane un campo difficile. L'occlusione è una delle principali difficoltà: quando gli oggetti si incrociano o si nascondono dietro ostacoli, mantenere l'identità è complesso. Scene affollate, come una maratona affollata o uno stormo di uccelli, mettono alla prova i limiti degli algoritmi di associazione dei dati. Inoltre, mantenere velocità di inferenza in tempo reale durante l'elaborazione di flussi video ad alta risoluzione richiede architetture di modelli efficienti e spesso hardware specializzato come i dispositivi NVIDIA .

Per affrontare queste sfide, i ricercatori stanno esplorando approcci di deep learning end-to-end che unificano il rilevamento e il tracciamento in un'unica rete, oltre a sfruttare Ultralytics per annotare set di dati complessi e addestrare robusti modelli personalizzati.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora