Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Re-identificazione degli oggetti (Re-ID)

Scoprire il Re-ID degli oggetti: abbinare persone o veicoli tra telecamere non sovrapposte con embeddings di aspetto per potenziare la sorveglianza, l'analisi della vendita al dettaglio e la forensics.

La reidentificazione degli oggetti (Re-ID) è una sofisticata tecnica di tecnica di visione computerizzata (CV) progettata per riconoscere e associare un oggetto o un individuo specifico attraverso viste della telecamera non sovrapposte o intervalli di tempo distinti. intervalli di tempo distinti. A differenza del rilevamento standard, che si limita a classificare un oggetto, la Re-ID si concentra sul determinare se un oggetto oggetto rilevato in una posizione è la stessa identità di un oggetto visto in precedenza in una posizione diversa. Questa capacità è essenziale per creare una comprensione coesiva del movimento e del comportamento in ambienti su larga scala, come ad esempio aeroporti, centri commerciali e città intelligenti, dove una singola telecamera non può coprire l'intera area.

La meccanica della reidentificazione

La sfida principale della Re-ID è la corrispondenza delle identità nonostante le variazioni di illuminazione, posa, punto di vista e occlusione. Per Per raggiungere questo obiettivo, il sistema crea una firma digitale unica per ogni oggetto rilevato.

  • Estrazione delle caratteristiche: Quando un oggetto viene identificato all'interno di un un riquadro di delimitazione, un modello di apprendimento profondo (DL) elabora la patch dell'immagine per immagine per generare un vettore ad alta dimensionalità noto come embedding. Questo vettore racchiude caratteristiche visive distinte caratteristiche visive distinte, come il colore dei vestiti di una persona o i dettagli specifici della marca e del modello di un veicolo.
  • Apprendimento metrico: Per garantire l'accuratezza, questi modelli utilizzano tecniche di apprendimento metrico. L'addestramento spesso prevede reti neurali siamesi o l'utilizzo di una funzione di perdita funzione di perdita tripletta, che insegna alla rete a la rete a minimizzare la distanza tra le incorporazioni della stessa identità e a massimizzare la distanza tra identità diverse. identità diverse.
  • Corrispondenza della galleria: durante l'inferenza, il sistema confronta l'incorporazione di un oggetto appena rilevato (la "query") con una "galleria" di incorporazioni memorizzate da rilevamenti precedenti. (la "query") con una "galleria" di incorporazioni memorizzate da rilevamenti precedenti. Gli algoritmi classificano questi confronti in base alla somiglianza, spesso utilizzando coseno o la distanza euclidea per trovare la migliore corrispondenza. migliore corrispondenza.

Re-ID vs. tracciamento dell'oggetto

Anche se spesso vengono utilizzati insieme, la reidentificazione degli oggetti e il e il tracciamento degli oggetti hanno scopi distinti in una pipeline di analisi analisi video.

  • Tracciamento degli oggetti: Questo processo mantiene l'identità di un oggetto, fotogramma per fotogramma, all'interno di un un singolo flusso video continuo. Si basa fortemente sulla continuità temporale e su algoritmi di previsione del movimento come il filtro di Kalman. Se un oggetto esce dall'inquadratura se un oggetto esce dal fotogramma o viene occluso per un lungo periodo, la track viene solitamente persa o viene assegnato un nuovo ID al suo ritorno.
  • Re-identificazione degli oggetti: Re-ID risolve il problema delle "tracce perdute" riassociando un'identità identità attraverso viste discontinue. Unisce i punti tra le diverse telecamere in un sistema di sistema di tracciamento multi-oggetto (MOT), permettendo di ricostruire una traiettoria completa su una rete distribuita.

Applicazioni nel mondo reale

La tecnologia Re-ID è una pietra miliare dell'analitica moderna, che consente di ottenere informazioni utili in diversi settori.

  • Commercio al dettaglio intelligente: In ambienti di vendita al dettaglio ambienti di vendita al dettaglio alimentati dall'intelligenza artificiale, Re-ID aiuta a i retailer a mappare i percorsi dei clienti all'interno di un negozio. Comprendendo quali sezioni un acquirente visita e e identificandoli nuovamente mentre si spostano da un piano all'altro, le aziende possono ottimizzare il layout del negozio e il posizionamento dei prodotti senza dover raccogliere dati biometrici. senza dover raccogliere dati biometrici.
  • Sorveglianza della città intelligente: Per la sicurezza urbana, Re-ID consente agli operatori di cercare una persona di interesse, come un bambino scomparso o un sospetto, attraverso una rete cittadina di telecamere. rete di telecamere di tutta la città. Questo riduce in modo significativo il tempo necessario per la revisione dei video forensi, un processo supportato da di ricerca come Market-1501.

Implementazione della Re-ID con Ultralytics YOLO

I moderni framework per il rilevamento degli oggetti spesso integrano algoritmi di tracciamento che utilizzano caratteristiche di aspetto simili a quelle di Re-ID per mantenere l'identità durante le occlusioni. Il YOLO11 può essere facilmente accoppiato con inseguitori avanzati come come BoT-SORT, che incorpora le funzioni Re-ID per un tracciamento robusto.

L'esempio seguente mostra come avviare il tracciamento di una sorgente video utilizzando l'interfaccia Python .

from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Run tracking on a video file using the BoT-SORT tracker
# BoT-SORT utilizes Re-ID features to improve tracking robustness
results = model.track(source="path/to/video.mp4", tracker="botsort.yaml", show=True)

# Access the unique tracking IDs assigned to detected objects
for r in results:
    if r.boxes.id is not None:
        print(f"Track IDs: {r.boxes.id.cpu().numpy()}")

Ulteriori letture e risorse

Per approfondire la comprensione delle tecnologie sottostanti, esplorare concetti quali l 'estrazione di caratteristiche e l'architettura di una rete neurale (NN). Quadri come PyTorch e TensorFlow forniscono gli strumenti necessari per costruire e modelli Re-ID personalizzati. Per chi è interessato al campo più ampio del monitoraggio intelligente, l'esame della comprensione dei video può fornire un ulteriore contesto su come le macchine interpretano i dati visivi temporali.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora