Inseguimento di più oggetti (MOT)
Esplorare il Multi-Object Tracking (MOT): tracciare e re-identificare gli oggetti nei fotogrammi video con YOLO11, filtri di Kalman, corrispondenza di aspetto e moderna associazione di dati.
Il Multi-Object Tracking (MOT) è un compito fondamentale della computer vision (CV) che prevede il rilevamento di più oggetti in un video e il mantenimento della loro identità unica in fotogrammi consecutivi. A differenza del rilevamento degli oggetti, che individua e classifica gli oggetti in una singola immagine, il MOT aggiunge una dimensione temporale. Non risponde solo a "Quali oggetti sono presenti nell'inquadratura?", ma anche a "Dove sta andando ogni specifico oggetto?". Assegnando un ID persistente a ciascun oggetto, MOT consente di analizzare il movimento, il comportamento e le interazioni nel tempo, rendendolo essenziale per la comprensione di scene dinamiche.
Come funziona il tracciamento di più oggetti
Il processo MOT segue in genere un paradigma di tracciamento per rilevamento. In primo luogo, viene utilizzato un rilevatore di oggetti, come YOLO11, per identificare tutti gli oggetti in ogni fotogramma di un video. A ogni oggetto rilevato viene assegnato un ID di tracciamento univoco. Nei fotogrammi successivi, un algoritmo di tracciamento prevede le nuove posizioni di questi oggetti e le associa agli oggetti appena rilevati. Questa associazione è una fase critica e si basa su diverse tecniche:
- Previsione del movimento: Algoritmi come il filtro di Kalman (KF) stimano la posizione futura di un oggetto in base al suo movimento passato. Questo aiuta a restringere la ricerca dell'oggetto nel fotogramma successivo.
- Corrispondenza dell'aspetto: per identificare nuovamente un oggetto dopo che è stato occluso o ha cambiato aspetto, i sistemi spesso estraggono caratteristiche distintive. Queste possono variare da semplici istogrammi di colore a complesse incorporazioni basate sul deep learning.
- Associazione dati: Questo componente associa le tracce degli oggetti esistenti ai nuovi rilevamenti. Per gestire queste assegnazioni vengono utilizzati algoritmi sofisticati come l'algoritmo ungherese o i metodi impiegati dai tracker moderni come ByteTrack e BoT-SORT, che garantiscono la continuità del tracciamento anche in scene affollate.
Ultralytics offre una perfetta integrazione di questi algoritmi di tracciamento, consentendo agli utenti di implementare facilmente un robusto tracciamento multi-oggetto con rivelatori ad alte prestazioni.
Tracciamento di più oggetti e rilevamento di oggetti
Pur essendo strettamente correlati, il MOT e il rilevamento degli oggetti hanno scopi distinti. Il rilevamento degli oggetti è un'analisi statica, fotogramma per fotogramma, che produce una serie di caselle di delimitazione e di etichette di classe. Al contrario, il MOT è un processo dinamico che collega questi rilevamenti nel tempo, creando una "storia" continua per ogni oggetto. Si può pensare al rilevamento degli oggetti come a una serie di istantanee, mentre il tracciamento multioggetto mette insieme queste istantanee per creare un film, rivelando la trama di come gli oggetti si muovono e interagiscono.
Applicazioni nel mondo reale
Il MOT è una tecnologia trasformativa con un'ampia gamma di utilizzi pratici in vari settori.
- Veicoli autonomi: Per le auto a guida autonoma, il MOT è fondamentale per la sicurezza. Consente a un veicolo di seguire le traiettorie di altre auto, pedoni e ciclisti, prevedendo i loro movimenti per prendere decisioni informate ed evitare collisioni. Questo tracciamento continuo fornisce una comprensione più ricca dell'ambiente rispetto al solo rilevamento di un singolo fotogramma.
- Analisi del commercio al dettaglio e degli spazi pubblici: Nel settore del commercio al dettaglio, il MOT viene utilizzato per analizzare il comportamento dei clienti, tracciando i modelli di traffico pedonale e i tempi di permanenza. Ciò consente di ottimizzare il layout dei negozi e di gestire efficacemente le code. Negli spazi pubblici, può essere utilizzato per la gestione della folla e della sicurezza, ad esempio per la creazione di un sistema di allarme che si attiva quando viene rilevata l'entrata di una persona in una zona riservata.
- Analitica sportiva: Gli allenatori e gli analisti utilizzano il MOT per monitorare i movimenti dei giocatori, analizzare le formazioni e valutare le metriche delle prestazioni come la velocità e la distanza percorsa. Questo può essere combinato con la stima della posa per un'analisi più dettagliata della tecnica atletica e della strategia di gioco.
- Automazione industriale: In fabbrica, l'intelligenza artificiale può essere utilizzata per tracciare i pezzi su un nastro trasportatore per il conteggio degli oggetti e il controllo di qualità, assicurando che ogni articolo venga lavorato correttamente. Si tratta di una componente chiave dell'intelligenza artificiale nella produzione.