Re-identificazione degli oggetti (Re-ID)
Scoprire il Re-ID degli oggetti: abbinare persone o veicoli tra telecamere non sovrapposte con embeddings di aspetto per potenziare la sorveglianza, l'analisi della vendita al dettaglio e la forensics.
La reidentificazione degli oggetti (Re-ID) è una sofisticata tecnica di
tecnica di visione computerizzata (CV) progettata per
riconoscere e associare un oggetto o un individuo specifico attraverso viste della telecamera non sovrapposte o intervalli di tempo distinti.
intervalli di tempo distinti. A differenza del rilevamento standard, che si limita a classificare un oggetto, la Re-ID si concentra sul determinare se un oggetto
oggetto rilevato in una posizione è la stessa identità di un oggetto visto in precedenza in una posizione diversa. Questa capacità
è essenziale per creare una comprensione coesiva del movimento e del comportamento in ambienti su larga scala, come ad esempio
aeroporti, centri commerciali e città intelligenti, dove una singola telecamera non può coprire l'intera area.
La meccanica della reidentificazione
La sfida principale della Re-ID è la corrispondenza delle identità nonostante le variazioni di illuminazione, posa, punto di vista e occlusione. Per
Per raggiungere questo obiettivo, il sistema crea una firma digitale unica per ogni oggetto rilevato.
-
Estrazione delle caratteristiche: Quando un oggetto viene identificato all'interno di un
un riquadro di delimitazione, un modello di
apprendimento profondo (DL) elabora la patch dell'immagine per
immagine per generare un vettore ad alta dimensionalità noto come
embedding. Questo vettore racchiude caratteristiche visive distinte
caratteristiche visive distinte, come il colore dei vestiti di una persona o i dettagli specifici della marca e del modello di un veicolo.
-
Apprendimento metrico: Per garantire l'accuratezza, questi modelli utilizzano
tecniche di apprendimento metrico. L'addestramento spesso prevede
reti neurali siamesi o l'utilizzo di una funzione di perdita
funzione di perdita tripletta, che insegna alla rete a
la rete a minimizzare la distanza tra le incorporazioni della stessa identità e a massimizzare la distanza tra identità diverse.
identità diverse.
-
Corrispondenza della galleria: durante l'inferenza, il sistema confronta l'incorporazione di un oggetto appena rilevato (la "query") con una "galleria" di incorporazioni memorizzate da rilevamenti precedenti.
(la "query") con una "galleria" di incorporazioni memorizzate da rilevamenti precedenti. Gli algoritmi classificano
questi confronti in base alla somiglianza, spesso utilizzando
coseno o la distanza euclidea per trovare la migliore corrispondenza.
migliore corrispondenza.
Re-ID vs. tracciamento dell'oggetto
Anche se spesso vengono utilizzati insieme, la reidentificazione degli oggetti e il
e il tracciamento degli oggetti hanno scopi distinti in una pipeline di analisi
analisi video.
-
Tracciamento degli oggetti: Questo processo mantiene l'identità di un oggetto, fotogramma per fotogramma, all'interno di un
un singolo flusso video continuo. Si basa fortemente sulla continuità temporale e su algoritmi di previsione del movimento
come il filtro di Kalman. Se un oggetto esce dall'inquadratura
se un oggetto esce dal fotogramma o viene occluso per un lungo periodo, la track viene solitamente persa o viene assegnato un nuovo ID al suo ritorno.
-
Re-identificazione degli oggetti: Re-ID risolve il problema delle "tracce perdute" riassociando un'identità
identità attraverso viste discontinue. Unisce i punti tra le diverse telecamere in un sistema di
sistema di tracciamento multi-oggetto (MOT),
permettendo di ricostruire una traiettoria completa su una rete distribuita.
Applicazioni nel mondo reale
La tecnologia Re-ID è una pietra miliare dell'analitica moderna, che consente di ottenere informazioni utili in diversi settori.
-
Commercio al dettaglio intelligente: In ambienti di vendita al dettaglio
ambienti di vendita al dettaglio alimentati dall'intelligenza artificiale, Re-ID aiuta a
i retailer a mappare i percorsi dei clienti all'interno di un negozio. Comprendendo quali sezioni un acquirente visita e
e identificandoli nuovamente mentre si spostano da un piano all'altro, le aziende possono ottimizzare il layout del negozio e il posizionamento dei prodotti senza dover raccogliere dati biometrici.
senza dover raccogliere dati biometrici.
-
Sorveglianza della città intelligente: Per la
sicurezza urbana,
Re-ID consente agli operatori di cercare una persona di interesse, come un bambino scomparso o un sospetto, attraverso una rete cittadina di telecamere.
rete di telecamere di tutta la città. Questo riduce in modo significativo il tempo necessario per la revisione dei video forensi, un processo supportato da
di ricerca come Market-1501.
Implementazione della Re-ID con Ultralytics YOLO
I moderni framework per il rilevamento degli oggetti spesso integrano algoritmi di tracciamento che utilizzano caratteristiche di aspetto simili a quelle di
Re-ID per mantenere l'identità durante le occlusioni. Il
YOLO11 può essere facilmente accoppiato con inseguitori avanzati come
come BoT-SORT, che incorpora le funzioni Re-ID per un tracciamento robusto.
L'esempio seguente mostra come avviare il tracciamento di una sorgente video utilizzando l'interfaccia Python .
from ultralytics import YOLO
# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")
# Run tracking on a video file using the BoT-SORT tracker
# BoT-SORT utilizes Re-ID features to improve tracking robustness
results = model.track(source="path/to/video.mp4", tracker="botsort.yaml", show=True)
# Access the unique tracking IDs assigned to detected objects
for r in results:
if r.boxes.id is not None:
print(f"Track IDs: {r.boxes.id.cpu().numpy()}")
Ulteriori letture e risorse
Per approfondire la comprensione delle tecnologie sottostanti, esplorare concetti quali
l 'estrazione di caratteristiche e l'architettura di una
rete neurale (NN). Quadri come
PyTorch e
TensorFlow forniscono gli strumenti necessari per costruire e
modelli Re-ID personalizzati. Per chi è interessato al campo più ampio del monitoraggio intelligente, l'esame della
comprensione dei video può fornire un ulteriore
contesto su come le macchine interpretano i dati visivi temporali.