Re-identificazione degli oggetti (Re-ID)
Scoprire il Re-ID degli oggetti: abbinare persone o veicoli tra telecamere non sovrapposte con embeddings di aspetto per potenziare la sorveglianza, l'analisi della vendita al dettaglio e la forensics.
La reidentificazione degli oggetti (Re-ID) è una tecnica specializzata di visione computerizzata (CV) utilizzata per riconoscere un oggetto attraverso più telecamere non sovrapposte o per periodi prolungati. A differenza del tracciamento continuo all'interno di un singolo flusso video, la Re-ID si concentra sulla corrispondenza dell'identità di un oggetto quando riappare dopo essere stato perso di vista. Ad esempio, è in grado di identificare una persona vista da una telecamera all'ingresso di un edificio e di riconoscere successivamente lo stesso individuo nel feed di un'altra telecamera da un corridoio. Questo risultato si ottiene creando per ogni oggetto una firma unica basata sull'aspetto, che rimane coerente nonostante i cambiamenti di prospettiva, illuminazione o posa.
Come funziona la reidentificazione degli oggetti
Il fulcro di Re-ID è l'apprendimento di una rappresentazione descrittiva delle caratteristiche, o embedding, per ogni oggetto rilevato. Questo processo coinvolge in genere un modello di apprendimento profondo, spesso costruito con framework come PyTorch o TensorFlow, che viene addestrato per estrarre caratteristiche visive distintive.
- Estrazione delle caratteristiche: Quando viene rilevato un oggetto, il suo patch di immagine (il contenuto all'interno del suo rettangolo di selezione) viene inserito in una rete neurale. Questa rete produce un vettore di caratteristiche compatto che racchiude l'aspetto unico dell'oggetto, come i colori e le trame dei vestiti di una persona o il modello e il colore di un'automobile.
- Apprendimento metrico: Per garantire che queste caratteristiche siano altamente discriminanti, i modelli vengono spesso addestrati utilizzando tecniche di apprendimento metrico profondo. Metodi come le reti siamesi o i modelli addestrati con una funzione di perdita tripla imparano a minimizzare la distanza tra vettori di caratteristiche dello stesso oggetto e a massimizzare la distanza tra vettori di oggetti diversi.
- Corrispondenza: una volta che un oggetto riappare nella vista di un'altra telecamera, il suo nuovo vettore di caratteristiche viene calcolato e confrontato con una galleria di vettori noti. Un punteggio di somiglianza elevato indica che la reidentificazione è avvenuta con successo. Questo processo è fondamentale per creare una visione olistica del percorso di un oggetto attraverso una rete di telecamere distribuita.
Re-identificazione dell'oggetto e tracciamento dell'oggetto
Sebbene entrambi siano utilizzati per seguire gli oggetti nel tempo, il Re-ID e il tracciamento degli oggetti risolvono problemi diversi.
- Tracciamento degli oggetti è il processo di seguire gli oggetti fotogramma per fotogramma all'interno di un singolo flusso video continuo. Assegna un ID temporaneo e si basa principalmente sul movimento e sulla continuità temporale per mantenere tale ID. Se un oggetto viene occluso per troppo tempo o si muove in modo troppo irregolare, la traccia può andare persa. I modelli Ultralytics supportano diversi algoritmi di tracciamento che eccellono in questo compito.
- La reidentificazione degli oggetti è specializzata nella corrispondenza di oggetti tra viste discontinue, siatra telecamere diverse sia dopo un lungo intervallo di tempo in cui il tracciamento fallisce. È meno interessata alla previsione di traiettorie uniformi e più concentrata sulla corrispondenza robusta dell'aspetto. In pratica, il Re-ID viene spesso utilizzato per integrare i sistemi di tracciamento degli oggetti. Ad esempio, quando si perde un ID di tracciamento, Re-ID può aiutare a ristabilirlo facendo corrispondere l'aspetto dell'oggetto alla sua ricomparsa.
Applicazioni nel mondo reale
La tecnologia Re-ID è fondamentale per lo sviluppo di sistemi di analisi video intelligenti per diversi settori.
- Analisi del commercio al dettaglio: Nei grandi centri commerciali, Re-ID può tracciare il percorso di un cliente attraverso più negozi e piani. Capendo come gli acquirenti navigano nello spazio, quali aree visitano e quanto tempo rimangono, i retailer possono ottenere informazioni preziose per ottimizzare la disposizione dei negozi, il posizionamento dei prodotti e l'esperienza complessiva dei clienti. Si tratta di un livello di analisi molto più profondo del semplice conteggio delle presenze.
- Smart City e sicurezza pubblica: Per la sorveglianza intelligente in ambienti urbani, Re-ID consente al personale di sicurezza di seguire una persona o un veicolo di interesse attraverso una rete di telecamere di tutta la città. Se un individuo sospetto viene individuato in un luogo, il sistema può cercare automaticamente le sue presenze nei feed di altre telecamere, accelerando in modo significativo la risposta agli incidenti e l'analisi forense senza la revisione manuale dei video. Questa capacità è preziosa anche per trovare persone scomparse in aree ampie e affollate. I set di dati come Market-1501 sono stati fondamentali per far progredire la ricerca sulla Re-ID delle persone per queste applicazioni.