Yolo Vision Shenzhen
Shenzhen
Iscriviti ora

Miglioramento della reidentificazione dei veicoli con i modelliYOLO di Ultralytics

Abirami Vina

6 minuti di lettura

28 novembre 2025

Scoprite come i modelliYOLO Ultralytics possono svolgere un ruolo nelle soluzioni di reidentificazione dei veicoli, fornendo rilevamenti precisi e accurati.

Quando si assiste a una gara di Formula Uno, è facile individuare l'auto della propria squadra preferita. Il rosso acceso della Ferrari o l'argento della Mercedes si distinguono giro dopo giro. 

Chiedere a una macchina di fare lo stesso, non su una pista pulita ma su strade cittadine affollate e piene di traffico, è molto più impegnativo. Ecco perché la re-identificazione dei veicoli (vehicle re-ID) ha recentemente guadagnato attenzione nello spazio dell'intelligenza artificiale. 

La re-identificazione dei veicoli offre alle macchine la capacità di riconoscere lo stesso veicolo attraverso telecamere con più visuali o non sovrapposte. L'obiettivo è anche quello di identificare i veicoli dopo un'occlusione temporanea (quando un veicolo è parzialmente nascosto) o dopo cambiamenti nell'illuminazione e nel punto di vista. 

Una tecnologia fondamentale per il riconoscimento dei veicoli è la computer vision. La computer vision è un sottocampo dell'intelligenza artificiale che si occupa di insegnare alle macchine a comprendere e interpretare le informazioni visive, come immagini e video. Grazie a questa tecnologia, i sistemi di intelligenza artificiale possono analizzare le caratteristiche dei veicoli e track in modo affidabile attraverso grandi reti di telecamere per applicazioni come la sorveglianza urbana e il monitoraggio del traffico.

In particolare, i modelli Vision AI come Ultralytics YOLO11 e l'imminente Ultralytics YOLO26 supportano compiti come il rilevamento e il tracciamento degli oggetti. Sono in grado di individuare rapidamente i veicoli in ogni fotogramma e di seguirne il movimento in una scena. Quando questi modelli vengono combinati con reti di reidentificazione dei veicoli, il sistema combinato è in grado di riconoscere lo stesso veicolo in diverse riprese, anche quando cambiano le visuali o le condizioni di illuminazione.

Figura 1. Un esempio di utilizzo di YOLO11 per il tracciamento dei veicoli e la stima della velocità(Fonte)

In questo articolo analizziamo come funziona la reidentificazione dei veicoli, la tecnologia che la rende possibile e dove viene utilizzata nei sistemi di trasporto intelligenti. Iniziamo!

Che cos'è la reidentificazione dei veicoli?

La reidentificazione dei veicoli è un'importante applicazione della computer vision. Si tratta di riconoscere lo stesso veicolo quando appare su diverse telecamere non sovrapposte, mantenendo la sua identità costante durante gli spostamenti in città. Si tratta di una sfida perché ogni telecamera può riprendere il veicolo da un'angolazione diversa, con un'illuminazione diversa o con un'occlusione parziale.

Consideriamo uno scenario in cui una berlina blu attraversa un incrocio e successivamente appare in una strada diversa, osservata da un'altra telecamera. L'angolazione, l'illuminazione e lo sfondo sono cambiati e altre auto potrebbero bloccare brevemente la visuale. Nonostante ciò, il sistema di identificazione del veicolo deve comunque determinare che si tratta dello stesso veicolo.

I recenti progressi nel deep learning, in particolare con le reti neurali convoluzionali (CNN) e i modelli basati su trasformatori, hanno reso questo processo molto più accurato. Questi modelli sono in grado di estrarre modelli visivi significativi e di distinguere tra veicoli simili, pur identificando quello corretto. 

Nei sistemi di trasporto intelligenti, questa capacità supporta il monitoraggio continuo, la ricostruzione dei percorsi e l'analisi del traffico cittadino, fornendo ai sistemi smart-city un quadro più chiaro di come si muovono i veicoli. Ciò contribuisce a migliorare la sicurezza e l'efficienza.

Capire come funziona la reidentificazione dei veicoli 

In genere, le riprese video di incroci, aree di parcheggio e autostrade vengono analizzate con tecniche di re-identificazione dei veicoli per determinare se lo stesso veicolo appare in diverse telecamere. Questo concetto è simile a quello della reidentificazione delle persone, in cui i sistemi track individui in più punti di vista, ma in questo caso l'attenzione si concentra sull'analisi delle caratteristiche specifiche dei veicoli anziché sull'aspetto umano. 

Il processo prevede diverse fasi chiave, ognuna delle quali è progettata per aiutare il sistema a detect veicoli, estrarre le loro caratteristiche visive e abbinarle in modo affidabile a diversi punti di vista.

Ad alto livello, il sistema rileva innanzitutto i veicoli in ogni fotogramma e poi estrae caratteristiche come il colore, la forma e la struttura per creare una rappresentazione digitale unica, o embedding, per ciascuno di essi. Questi embedding vengono confrontati nel tempo e tra le varie telecamere, spesso con il supporto del tracciamento degli oggetti e di controlli spazio-temporali, per decidere se due avvistamenti appartengono allo stesso veicolo.

Figura 2. Come funziona la reidentificazione dei veicoli.(Fonte)

Ecco un'analisi più approfondita di questo processo:

  • Rilevamento dell'oggetto: Il sistema identifica e localizza innanzitutto i veicoli all'interno di ogni fotogramma video, in modo da sapere esattamente quali regioni elaborare. Questa fase è in genere gestita da modelli di rilevamento degli oggetti.

  • Estrazione delle caratteristiche: Dopo il rilevamento, una rete dedicata di Re-ID o di estrazione delle caratteristiche analizza ogni foto del veicolo e genera mappe di caratteristiche o rappresentazioni di caratteristiche che catturano dettagli visivi come colore, forma, struttura e parti distintive.

  • Generazione dell'embedding: Le caratteristiche estratte vengono trasformate in una rappresentazione numerica chiamata "feature embedding". Questo embedding agisce come un'impronta digitale che cattura l'aspetto del veicolo da diverse angolazioni. Prima della corrispondenza, queste incorporazioni vengono in genere normalizzate in modo che le differenze causate dall'illuminazione, dal contrasto o dalle impostazioni della telecamera non interferiscano con il confronto dell'identità. La normalizzazione garantisce che il sistema si concentri sulle caratteristiche significative e legate all'identità piuttosto che sul rumore.

  • Tracciamento degli oggetti: All'interno di una singola vista della telecamera, gli algoritmi di tracciamento collegano i rilevamenti tra i vari fotogrammi, aiutando a mantenere un'identità coerente mentre il veicolo si muove attraverso la scena.

  • Corrispondenza tra telecamere: per confrontare lo stesso veicolo tra telecamere diverse, il sistema confronta gli embeddings (generati dalla rete Re-ID) con le informazioni sulla tempistica e sulla posizione. Questa fase determina se due avvistamenti appartengono allo stesso veicolo, anche quando le telecamere non si sovrappongono.

Come i modelliYOLO di Ultralytics possono supportare la reidentificazione dei veicoli

I modelliYOLO Ultralytics svolgono un importante ruolo di supporto nelle pipeline di re-identificazione dei veicoli. Sebbene non eseguano la Re-ID da soli, forniscono altre funzionalità essenziali, come il rilevamento rapido e il tracciamento stabile, da cui dipendono le reti Re-ID per un'accurata corrispondenza tra telecamere. 

Diamo poi un'occhiata più da vicino a come i modelliYOLO Ultralytics , come YOLO11 , possono migliorare i sistemi di reidentificazione dei veicoli.

Un modulo per il rilevamento accurato dei veicoli: La prima parte dei sistemi Re-ID

Il fondamento di qualsiasi sistema di re-identificazione dei veicoli è il rilevamento accurato degli oggetti. I modelliYOLO Ultralytics , come YOLO11 , sono un'ottima opzione per questo scopo, in quanto sono in grado di detect rapidamente detect veicoli in ogni fotogramma, anche in scene movimentate con occlusioni parziali, traffico intenso o condizioni di illuminazione variabili. 

Possono anche essere addestrati in modo personalizzato, il che significa che è possibile perfezionare il modello sul proprio set di dati in modo che impari a riconoscere tipi di veicoli specifici, come taxi, furgoni per le consegne o veicoli della flotta. Questo è particolarmente utile quando una soluzione richiede un rilevamento più specializzato. Fornendo caselle di delimitazione pulite e precise, i modelliYOLO Ultralytics forniscono alle reti Re-ID input di alta qualità con cui lavorare, il che porta a una corrispondenza più affidabile tra le telecamere.

Supporto di un tracking affidabile a telecamera singola

Una volta rilevati i veicoli, modelli come YOLO11 possono anche supportare il tracciamento stabile degli oggetti all'interno di una singola vista della telecamera. Il tracciamento degli oggetti è il processo che consiste nel seguire un veicolo rilevato attraverso fotogrammi consecutivi e assegnargli un ID coerente mentre si muove.

Grazie al supporto integrato di algoritmi di tracciamento come ByteTrack e BoT-SORT nel pacchettoUltralytics Python , YOLO11 è in grado di mantenere ID coerenti mentre i veicoli si muovono in una scena. Questo tracciamento stabile riduce i cambi di identità prima che subentri il sistema Re-ID, migliorando così l'accuratezza della corrispondenza tra telecamere.

Re-ID opzionale a livello di tracker per una maggiore stabilità dell'identità

Oltre al tracciamento standard basato sul movimento, il pacchetto Ultralytics Python include funzionalità opzionali di Re-ID basate sull'aspetto all'interno del tracker BoT-SORT. Ciò significa che il tracker può utilizzare le caratteristiche dell'aspetto visivo, non solo i modelli di movimento o la sovrapposizione delle bounding-box, per determinare se due rilevamenti appartengono allo stesso veicolo. 

Quando è abilitato, BoT-SORT estrae le incorporazioni leggere dell'aspetto dal rilevatore o da un modello di classificazione YOLO11 e le utilizza per verificare l'identità tra i fotogrammi. Questo spunto aggiuntivo sull'aspetto aiuta il tracker a mantenere ID più stabili in situazioni difficili, come brevi occlusioni, veicoli che passano vicini o piccoli spostamenti causati dal movimento della telecamera. 

Sebbene questo Re-ID integrato non sia destinato a sostituire la reidentificazione completa del veicolo attraverso le telecamere, migliora la coerenza dell'identità all'interno di una singola vista della telecamera e produce tracklet più puliti su cui i moduli Re-ID a valle possono fare affidamento. Per utilizzare queste funzioni di tracciamento basate sull'aspetto, è sufficiente abilitare il Re-ID in un file di configurazione del tracker BoT-SORT impostando "with_reid" su "True" e selezionando il modello che fornirà le funzioni di aspetto.

Per maggiori dettagli, è possibile consultare lapagina di documentazione di Ultralytics sul tracciamento degli oggetti, che spiega le opzioni Re-ID disponibili e come configurarle.

Fornire input di alta qualità alle reti Re-ID

Oltre a migliorare la stabilità dell'identità durante il tracciamento, i modelli YOLO svolgono anche un ruolo importante nella preparazione di input visivi puliti per la rete Re-ID stessa.

Dopo il rilevamento di un veicolo, il suo riquadro di delimitazione viene tipicamente ritagliato e inviato a una rete di re-identificazione, che estrae le caratteristiche visive necessarie per la corrispondenza. Poiché i modelli Re-ID si basano molto su queste immagini ritagliate, input scadenti, come ritagli sfocati, disallineati o incompleti, possono portare a incorporazioni più deboli e a una corrispondenza meno affidabile tra telecamere.

I modelliYOLO Ultralytics aiutano a ridurre questi problemi producendo costantemente riquadri di delimitazione puliti e ben allineati che catturano completamente il veicolo di interesse. Grazie a riquadri più chiari e accurati, la rete Re-ID può concentrarsi su dettagli significativi come colore, forma, struttura e altre caratteristiche distintive. Gli input di alta qualità portano a prestazioni Re-ID più affidabili e precise in tutte le viste della telecamera.

Abilitazione della corrispondenza tra telecamere quando è combinata con un modello Re-ID

Sebbene i modelliYOLO Ultralytics non eseguano da soli la re-identificazione, forniscono le informazioni critiche di cui una rete Re-ID ha bisogno per confrontare i veicoli tra le diverse viste delle telecamere. Modelli come YOLO11 possono occuparsi di localizzare e tracciare i veicoli all'interno di ciascuna telecamera, mentre il modello Re-ID determina se due colture di veicoli provenienti da luoghi diversi appartengono alla stessa identità.

Quando questi componenti lavorano insieme, YOLO per il rilevamento e il tracciamento e un modello di embedding dedicato per l'estrazione delle caratteristiche, formano una pipeline completa di corrispondenza tra veicoli multicamera. In questo modo è possibile associare lo stesso veicolo mentre si muove attraverso una rete di telecamere più ampia.

In un recente studio, ad esempio, i ricercatori hanno utilizzato un modello leggero YOLO11 come rilevatore di veicoli in un sistema di tracciamento online multi-camera. Lo studio ha rilevato che l'uso di YOLO11 ha contribuito a ridurre il tempo di rilevamento senza sacrificare l'accuratezza, migliorando le prestazioni complessive del tracciamento a valle e della corrispondenza tra telecamere.

Figura 3. Tracciamento e reidentificazione di più veicoli YOLO11 più telecamere, YOLO11.(Fonte)

Architetture basate sull'apprendimento profondo per il Re-ID dei veicoli

Ora che abbiamo capito meglio come i modelliYOLO di Ultralytics possono supportare la reidentificazione dei veicoli, diamo un'occhiata più da vicino ai modelli di deep learning che gestiscono le fasi di estrazione delle caratteristiche e di corrispondenza. Questi modelli sono responsabili dell'apprendimento dell'aspetto dei veicoli, della creazione di incorporazioni robuste e della distinzione tra veicoli visivamente simili in diverse viste della telecamera. 

Ecco alcuni esempi dei componenti fondamentali del deep learning utilizzati nei sistemi di reidentificazione degli oggetti:

  • Estrazione di caratteristiche con le CNN: Le reti neurali convoluzionali come ResNet50 o ResNet101 apprendono caratteristiche profonde attraverso il riconoscimento dei modelli, identificando elementi come il colore, la forma e la struttura che differenziano un veicolo da un altro. Questi modelli appresi vengono poi convertiti in embeddings che fungono da rappresentazione digitale unica del veicolo.
  • Meccanismi di attenzione e trasformatori: Le reti e i livelli di attenzione, compresa l'attenzione spaziale, possono aiutare a evidenziare le regioni importanti di un veicolo, come i fari, i finestrini o le aree delle targhe. L'attenzione spaziale concentra il modello sui punti in cui si trovano gli spunti visivi più informativi, mentre i modelli basati sui trasformatori, come i Vision Transformers (ViT), catturano le relazioni globali sull'intera immagine. Insieme, migliorano l'accuratezza a grana fine quando i veicoli si assomigliano molto.
  • Reti basate su parti e multiramo: Alcuni modelli Re-ID analizzano separatamente regioni specifiche del veicolo, come il tetto, i fanali posteriori o i pannelli laterali, e poi combinano i risultati. In questo modo il sistema rimane robusto anche quando i veicoli sono parzialmente occlusi o visti da angolazioni difficili.

Oltre a questi componenti architettonici, l'apprendimento metrico svolge un ruolo fondamentale nell'addestramento dei modelli Re-ID dei veicoli. Funzioni di perdita come la triplet loss, la contrastive loss e la cross-entropy loss aiutano il sistema ad apprendere embeddings forti e discriminativi, mettendo insieme immagini dello stesso veicolo e separando quelle diverse.

Set di dati popolari per la reidentificazione dei veicoli e benchmark

Nella ricerca sulla visione artificiale, la qualità di un set di dati ha un impatto notevole sulle prestazioni di un modello una volta distribuito. Un set di dati fornisce le immagini o i video etichettati da cui un modello apprende. 

Per la reidentificazione dei veicoli, questi set di dati all'avanguardia devono catturare condizioni diverse, come l'illuminazione, i cambiamenti del punto di vista e le variazioni meteorologiche. Questa diversità aiuta i modelli a gestire la complessità degli ambienti di trasporto reali.

Ecco una carrellata di set di dati popolari che supportano l'addestramento, l'ottimizzazione e la valutazione dei modelli di reidentificazione dei veicoli: 

  • Set di dati VeRi-776: Si tratta di una raccolta di oltre 50.000 immagini di veicoli annotate acquisite da 20 telecamere cittadine. Le annotazioni includono l'ID del veicolo, il colore, il modello e le regioni della targa, consentendo un apprendimento dettagliato delle caratteristiche.
  • Set di dati VehicleID: Questo set di dati su larga scala contiene oltre 200.000 immagini che rappresentano più di 26.000 veicoli. Viene spesso scelto per studiare la scalabilità e per eseguire confronti di base tra diversi metodi.
  • Il set di dati VeRi-Wild: È stato progettato per riflettere la variabilità del mondo reale, comprese le differenze di punti di vista, condizioni atmosferiche e occlusione parziale. Viene comunemente utilizzato per valutare la robustezza e la generalizzazione dei modelli.
Figura 4. Esempio di veicoli nel dataset VeRi-776.(Fonte

Le prestazioni del modello su questi set di dati vengono solitamente valutate utilizzando parametri come la precisione mediamAP) e l'accuratezza Rank-1 o Rank-5. La mAP misura l'accuratezza con cui il modello recupera tutte le corrispondenze pertinenti per un determinato veicolo, mentre i punteggi Rank-1 e Rank-5 indicano se la corrispondenza corretta appare in cima all'elenco dei risultati o tra le prime previsioni. 

Insieme, questi parametri di riferimento forniscono ai ricercatori un modo coerente per confrontare i diversi approcci e svolgono un ruolo importante nel guidare lo sviluppo di sistemi di reidentificazione dei veicoli più accurati e affidabili per l'uso reale.

Applicazioni della reidentificazione dei veicoli

Dopo aver affrontato le nozioni fondamentali, analizziamo alcuni casi d'uso reali in cui la reidentificazione dei veicoli supporta flussi di lavoro pratici di trasporto, mobilità e sorveglianza.

Sorveglianza e monitoraggio del traffico urbano

Le strade urbane trafficate sono costantemente piene di movimento e le telecamere del traffico spesso faticano a tenere track dello stesso veicolo mentre si sposta tra le diverse aree. Cambiamenti di illuminazione, scene affollate e veicoli quasi identici possono causare la perdita di identità tra le telecamere. 

La re-identificazione dei veicoli risolve questo problema rilevando chiaramente i veicoli, estraendo le caratteristiche distintive e mantenendo ID coerenti anche in filmati a bassa risoluzione o molto trafficati. Il risultato è un tracciamento più fluido e continuo su tutta la rete, che fornisce alle squadre del traffico un quadro più chiaro di come i veicoli si muovono in città e consente di reagire in modo più rapido e informato a congestioni e incidenti.

Sistemi di parcheggio intelligenti

Le strutture di parcheggio intelligenti si basano sull'identificazione coerente dei veicoli per gestire l'ingresso, l'uscita, il controllo degli accessi e l'assegnazione degli spazi. Tuttavia, le telecamere in questi ambienti spesso riprendono i veicoli da angolazioni insolite e in condizioni di illuminazione difficili, come nei garage sotterranei, nelle aree in ombra o nei lotti all'aperto al crepuscolo. 

Queste condizioni rendono più difficile confermare se lo stesso veicolo viene visto in zone diverse. Quando le identità sono incoerenti, i registri di parcheggio possono essere interrotti, il controllo degli accessi diventa meno affidabile e i conducenti possono subire ritardi. Ecco perché molti sistemi di smart-parking incorporano modelli di re-identificazione dei veicoli per mantenere un'identità stabile per ogni veicolo mentre si muove attraverso la struttura.

Figura 5. Un esempio di reidentificazione di un veicolo che mostra l'immagine del veicolo selezionato a sinistra e i risultati della ricerca corrispondenti a destra.(Fonte)

Forze dell'ordine e medicina legale

Oltre al monitoraggio del traffico, la reidentificazione dei veicoli svolge un ruolo importante anche nelle indagini di polizia e forense. In molti casi, gli agenti devono seguire un veicolo attraverso diverse telecamere, ma le targhe possono essere illeggibili, mancanti o deliberatamente oscurate. 

Le scene affollate, la scarsa visibilità e l'occlusione parziale possono far sembrare ingannevolmente simili veicoli diversi, rendendo l'identificazione manuale lenta e inaffidabile. La reidentificazione dei veicoli può essere utilizzata per tracciare il movimento di un veicolo attraverso reti di telecamere non sovrapposte, analizzando le sue caratteristiche visive piuttosto che basarsi esclusivamente sulle targhe.

In questo modo gli investigatori possono seguire più facilmente i movimenti di un veicolo, capire quando è apparso in luoghi diversi e confermare il suo percorso prima e dopo un incidente. L'identificazione dei veicoli basata sull'intelligenza artificiale supporta anche attività quali la localizzazione di veicoli sospetti, la revisione di filmati di incidenti o la determinazione della direzione in cui un veicolo ha viaggiato prima o dopo un evento.

Figura 6. Veicoli abbinati a diverse telecamere con diverse prospettive.(Fonte)

Tracciabilità della flotta e della logistica

Le operazioni di flotta e logistica si affidano spesso a GPS, tag RFID e registri manuali per track movimenti dei veicoli, ma questi strumenti lasciano delle lacune nelle aree coperte da telecamere di sicurezza o di cantiere, come le baie di carico, i piazzali dei magazzini e le reti stradali interne. 

I veicoli si spostano spesso tra telecamere che non si sovrappongono, scompaiono dietro strutture o appaiono quasi identici ad altri della flotta, rendendo difficile confermare se lo stesso veicolo è stato visto in luoghi diversi. I sistemi di re-identificazione dei veicoli possono aiutare a colmare queste lacune analizzando i dettagli visivi e le informazioni temporali per mantenere un'identità coerente per ogni veicolo mentre si muove attraverso la struttura. 

In questo modo i gestori delle flotte hanno una visione più completa dell'attività all'interno dei loro hub, supportando attività come la verifica dei percorsi di consegna, l'identificazione di movimenti insoliti e la garanzia che i veicoli seguano i percorsi previsti.

Pro e contro delle attività di riordino dei veicoli

Ecco alcuni dei principali vantaggi dell'utilizzo della reidentificazione dei veicoli basata sull'intelligenza artificiale:

  • Riduzione del carico di lavoro manuale: Vehicle re-ID automatizza le attività di confronto dell'identità che altrimenti richiederebbero un'ampia revisione manuale, riducendo significativamente il tempo e l'impegno necessari per analizzare i filmati.
  • Automazione e approfondimenti in tempo reale: Combinando il rilevamento, la localizzazione e la corrispondenza delle caratteristiche, la RID dei veicoli supporta il monitoraggio automatico continuo e può fornire avvisi in tempo reale per una risposta più rapida agli incidenti.
  • Scalabilità e adattabilità: I modelli Re-ID possono adattarsi a nuovi ambienti, condizioni di illuminazione o angolazioni della telecamera grazie a un robusto apprendimento delle caratteristiche, all'estrazione di caratteristiche multiscala e a rappresentazioni invarianti che rimangono stabili sotto i cambiamenti visivi. Queste capacità li rendono adatti sia a reti cittadine di grandi dimensioni che a distribuzioni più piccole.

Sebbene la reidentificazione dei veicoli offra molti vantaggi, ci sono anche alcuni limiti da considerare. Ecco alcuni fattori che ne influenzano l'affidabilità in ambienti reali:

  • Elevata richiesta computazionale: L'estrazione delle caratteristiche, la generazione di embedding e la corrispondenza tra telecamere richiedono una notevole potenza di elaborazione, soprattutto quando si monitorano reti di telecamere di grandi dimensioni.
  • Variabilità ambientale: Fattori come l'illuminazione notturna, i cambiamenti meteorologici, le ombre e le occlusioni possono degradare la capacità del modello di mantenere identità coerenti tra le scene.
  • Limitazioni del set di dati e del dominio: I modelli addestrati su insiemi di dati limitati o idealizzati possono non generalizzarsi bene alle condizioni del mondo reale senza un'ulteriore messa a punto o adattamento al dominio.

La strada da percorrere per i metodi di reidentificazione dei veicoli

La reidentificazione dei veicoli continua a progredire con l'evolversi della tecnologia. Le recenti pubblicazioni di IEEE, CVPR e arXiv, insieme alle presentazioni alle conferenze internazionali, evidenziano un chiaro spostamento verso modelli più ricchi che combinano più fonti di dati e un ragionamento più avanzato sulle caratteristiche. Il lavoro futuro in questo settore si concentrerà probabilmente sulla costruzione di sistemi più robusti, efficienti e in grado di gestire la variabilità del mondo reale su scala.

Ad esempio, una direzione promettente è l'uso di modelli basati su trasformatori e reti di aggregazione di grafi. I trasformatori sono in grado di analizzare un'intera immagine e di capire come tutti i dettagli visivi si adattano tra loro, aiutando il sistema a riconoscere lo stesso veicolo anche quando l'angolo o l'illuminazione cambiano. 

I modelli basati su grafici fanno un ulteriore passo avanti, trattando le diverse parti del veicolo o le viste della telecamera come punti collegati in una rete. Ciò consente al sistema di comprendere la correlazione tra questi punti chiave e di prendere decisioni migliori sull'identità del veicolo e sulle caratteristiche discriminanti.

Un altro progresso fondamentale è la fusione di dati multimodali e la fusione di caratteristiche. Invece di basarsi solo sulle immagini, i sistemi più recenti combinano le informazioni visive con altri segnali multimediali, come i dati GPS o i modelli di movimento dei sensori. Questo contesto aggiuntivo rende più facile per il sistema rimanere preciso quando i veicoli sono parzialmente bloccati, quando l'illuminazione è scarsa o quando l'angolazione della telecamera cambia improvvisamente. 

Punti chiave

La re-identificazione dei veicoli sta diventando una metodologia chiave nei sistemi di trasporto intelligenti, aiutando le città a track veicoli in modo più affidabile attraverso diverse telecamere. Grazie ai progressi dell'apprendimento profondo e a una migliore convalida con l'utilizzo di set di dati più ricchi e diversificati, questi sistemi stanno diventando più precisi e pratici in condizioni reali. 

Con l'evoluzione della tecnologia, è importante bilanciare l'innovazione con pratiche responsabili in materia di privacy, sicurezza ed etica. Nel complesso, questi progressi stanno aprendo la strada a reti di trasporto più intelligenti, sicure ed efficienti.

Scoprite di più sull'IA visitando il nostro repository GitHub e unendovi alla nostra comunità. Consultate le nostre pagine dedicate alle soluzioni per conoscere l'IA nella robotica e la computer vision nella produzione. Scoprite le nostre opzioni di licenza per iniziare a lavorare con Vision A oggi!

Costruiamo insieme il futuro
dell'AI!

Inizia il tuo viaggio con il futuro del machine learning

Inizia gratis