Re-identificazione degli oggetti (Re-ID)
Scoprire il Re-ID degli oggetti: abbinare persone o veicoli tra telecamere non sovrapposte con embeddings di aspetto per potenziare la sorveglianza, l'analisi della vendita al dettaglio e la forensics.
La reidentificazione degli oggetti (Re-ID) è una tecnica specializzata nella
visione artificiale (CV) incentrata sull'associazione di
oggetti o individui specifici attraverso viste della telecamera distinte e non sovrapposte o per periodi di tempo prolungati. Mentre il
rilevamento standard degli oggetti identifica la classe di
un oggetto (ad esempio, "persona" o "auto") all'interno di una singola immagine, la Re-ID determina se un oggetto specifico
rilevato è esattamente lo stesso visto in precedenza. Questa capacità è fondamentale per creare una comprensione coerente
del movimento in ambienti di grandi dimensioni in cui una singola telecamera non è in grado di coprire l'intera area, collegando efficacemente
i punti tra osservazioni visive isolate.
Come funziona la reidentificazione
La sfida fondamentale del Re-ID è quella di abbinare le identità nonostante i cambiamenti di illuminazione, posa, angolazione della telecamera e
disordine dello sfondo. Per ottenere questo risultato, il sistema va oltre le semplici coordinate del riquadro di delimitazione e analizza il contenuto visivo
dell'oggetto.
-
Estrazione delle caratteristiche: quando viene rilevato un oggetto, un
modello di deep learning (DL) elabora il ritaglio dell'immagine
per generare un vettore di caratteristiche, spesso chiamato
embedding. Questo vettore rappresenta le caratteristiche visive di alto livello
, come la trama degli indumenti o il colore di un veicolo, in formato numerico.
-
Apprendimento metrico: il sistema utilizza l'
apprendimento metrico per garantire che gli embedding dello stesso
oggetto siano matematicamente vicini tra loro, mentre quelli di oggetti diversi siano distanti. Tecniche come le
reti neurali siamesi vengono comunemente addestrate a
questo scopo.
-
Corrispondenza di similarità: durante l'inferenza, il sistema calcola la
similarità coseno o la
distanza euclidea tra l'incorporamento dell'oggetto della query
e una "galleria" di identità precedentemente memorizzate. Se il punteggio di similarità supera una certa
soglia, viene dichiarata una corrispondenza.
Re-ID vs. tracciamento dell'oggetto
È importante distinguere il Re-ID dal
tracciamento degli oggetti, poiché svolgono ruoli complementari ma
distinti in una pipeline di visione.
-
Tracciamento degli oggetti: questo processo, spesso basato su algoritmi come il
filtro di Kalman, prevede la posizione di un
oggetto da un fotogramma video al fotogramma immediatamente successivo. Si basa in larga misura sulla continuità temporale e sulla sovrapposizione spaziale
, come l'
Intersection over Union (IoU).
-
Re-identificazione: la re-identificazione entra in gioco quando il tracciamento fallisce, ad esempio quando un oggetto è completamente
oscurato da un'occlusione o esce dal campo visivo di una
telecamera ed entra in quello di un'altra. Ristabilisce l'identità in base all'aspetto piuttosto che alla cronologia delle posizioni,
consentendo un solido
tracciamento multi-oggetto (MOT) su
reti distribuite.
Applicazioni nel mondo reale
La reidentificazione trasforma i rilevamenti isolati in traiettorie utilizzabili, consentendo analisi sofisticate in
vari settori.
-
Sicurezza nelle smart city: nella
sorveglianza urbana, il Re-ID consente agli
operatori di track persona o un veicolo specifico attraverso una rete di telecamere di traffico che copre l'intera città. Ciò è fondamentale per le
ricerche forensi, in quanto consente alle autorità di localizzare un bambino scomparso o un sospetto senza dover esaminare manualmente migliaia di
ore di filmati.
-
Analisi dei dati di vendita al dettaglio: negli
ambienti di vendita al dettaglio basati sull'intelligenza artificiale, i negozi utilizzano il Re-ID per
comprendere il percorso dei clienti. Riconoscendo nuovamente gli acquirenti mentre si spostano tra i corridoi o i piani, i rivenditori possono
generare mappe di calore dei percorsi più popolari e ottimizzare la disposizione dei negozi
, il tutto mantenendo la privacy grazie all'analisi di incorporamenti numerici anziché dati biometrici.
Implementazione del tracciamento con funzionalità Re-ID
Modelli moderni come YOLO26 e
YOLO11Ultralytics
possono essere integrati con tracker che utilizzano concetti di Re-ID
per mantenere le identità in condizioni difficili. Il
tracker BoT-SORT, disponibile nella libreria Ultralytics
, combina segnali di movimento con caratteristiche di aspetto per prestazioni robuste.
L'esempio seguente mostra come applicare questo tracciamento a un file video:
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Track objects in a video using BoT-SORT
# BoT-SORT uses appearance features to help re-identify objects after occlusions
results = model.track(source="path/to/video.mp4", tracker="botsort.yaml", persist=True)
# Process results
for result in results:
if result.boxes.id is not None:
print(f"Tracked IDs: {result.boxes.id.cpu().numpy()}")
Per approfondire l'architettura che supporta queste funzionalità, si consiglia di esaminare le
reti neurali convoluzionali (CNN)
e le backbone ResNet.
Comprendere questi fondamenti aiuta a selezionare i dati di addestramento giusti
per mettere a punto modelli Re-ID personalizzati per
ambienti specifici.