Yolo Vision Shenzhen
Shenzhen
Iscriviti ora

Costruire un sistema ANPR con Ultralytics YOLO11 e GPT-4o Mini

Abirami Vina

5 minuti di lettura

10 febbraio 2025

Scoprite come costruire un sistema ANPR utilizzando Ultralytics YOLO11 per il rilevamento delle targhe e GPT-4o Mini per il riconoscimento del testo con una precisione in tempo reale.

Trovare parcheggio in un lotto affollato, aspettare in lunghe file ai caselli autostradali o rimanere bloccati ai controlli di sicurezza è frustrante. I controlli manuali dei veicoli spesso richiedono troppo tempo e causano ritardi. Senza un sistema automatizzato, tracciare le auto in modo efficiente può essere difficile. 

La computer vision ha cambiato questa situazione consentendo il riconoscimento delle targhe in tempo reale da immagini e flussi video. Per esempio, Ultralytics YOLO11 è un modello avanzato di computer vision in grado di eseguire compiti avanzati di Vision AI come il rilevamento, la classificazione e il tracciamento degli oggetti. Grazie alle capacità di rilevamento degli oggetti di YOLO11, è possibile detect con precisione le targhe dei veicoli nelle immagini. 

Ultralytics offre notebookGoogle Colab completi che semplificano il processo di creazione di soluzioni Vision AI. Questi notebook sono preconfigurati con le dipendenze essenziali, i modelli e le guide passo-passo, per facilitare la creazione di applicazioni. In particolare, esiste un notebook Colab dedicato all 'ANPR (Automatic Number Plate Recognition).

In questo articolo, utilizzando il notebook Ultralytics Colab per l'ANPR, vedremo come costruire una soluzione ANPR utilizzando Ultralytics YOLO11 per il rilevamento delle targhe e GPT-4o Mini per il riconoscimento del testo. 

Comprendere l'ANPR 

Tracciare le auto manualmente richiede molto tempo ed è soggetto a errori, soprattutto quando si muovono velocemente. Controllare ogni targa una per una rallenta il processo e aumenta il rischio di errori. Il riconoscimento automatico delle targhe risolve questo problema utilizzando la visione computerizzata per detect e leggere istantaneamente le targhe, rendendo più efficiente il monitoraggio del traffico e la sicurezza.

I sistemi ANPR possono acquisire immagini o video di veicoli in transito e utilizzare il rilevamento di oggetti in tempo reale per identificare le targhe. Una volta rilevate, il riconoscimento del testo viene utilizzato per estrarre automaticamente i numeri di targa, senza la necessità di intervento umano. Questo processo garantisce risultati accurati, anche quando i veicoli si muovono rapidamente o le targhe sono parzialmente oscurate.

__wf_reserved_inherit
Figura 1. Un esempio di utilizzo di YOLO11 per detect una targa.

Oggi i caselli autostradali, i sistemi di parcheggio e le forze dell'ordine si affidano sempre più all'ANPR per track veicoli in modo efficiente.

Sfide relative alla tecnologia ANPR

Sebbene l'ANPR identifichi rapidamente i veicoli, ci sono ancora alcune sfide che possono influire sulla sua accuratezza. Ecco alcuni problemi comuni che possono influire sul funzionamento di un sistema ANPR:

  • Scarsa illuminazione e maltempo: Le targhe diventano più difficili da leggere di notte e in caso di maltempo. La nebbia, la pioggia e il bagliore dei fari possono offuscare il testo, rendendolo illeggibile.
  • Targhe sfocate o bloccate: Un'auto in rapido movimento può lasciare un'immagine sfocata, soprattutto se la velocità dell'otturatore della fotocamera è troppo lenta. Sporcizia, graffi o parti della targa coperte possono anche causare problemi di riconoscimento. L'utilizzo di fotocamere di alta qualità con le giuste impostazioni aiuta a ottenere risultati più chiari.
  • Design delle targhe non uniformi: Non tutte le targhe hanno lo stesso aspetto. Alcune hanno caratteri fantasiosi, testo aggiuntivo o loghi che confondono il sistema.
  • Rischi per la privacy e sicurezza dei dati: È importante archiviare i dati dei veicoli in modo sicuro. Le giuste misure di sicurezza possono impedire l'accesso non autorizzato e proteggere le informazioni. Con le dovute garanzie, i sistemi ANPR possono essere sia sicuri che affidabili.

Come YOLO11 migliora i sistemi ANPR

Ultralytics YOLO11 può rendere i sistemi ANPR più veloci e precisi. Elabora rapidamente le immagini mantenendo la precisione e non richiede una grande potenza di calcolo, per cui funziona bene su tutti i sistemi, dalle piccole telecamere di sicurezza ai grandi sistemi di traffico.

Con l'addestramento personalizzato, YOLO11 può essere adattato a diversi stili di targa, lingue e ambienti. Si comporta bene anche in condizioni difficili, come la scarsa illuminazione, la sfocatura da movimento e gli angoli difficili, se addestrato su set di dati specializzati che includono immagini in queste condizioni.

Identificando istantaneamente i veicoli, YOLO11 aiuta a ridurre i tempi di attesa, a prevenire gli errori e a migliorare la sicurezza. Ciò rende più fluido il traffico e più efficienti le operazioni nei parcheggi, nei caselli autostradali e nei sistemi di sorveglianza.

Costruire un sistema ANPR con YOLO11 e GPT-4o Mini

Vediamo quindi come costruire un sistema ANPR utilizzando YOLO11 e GPT-4o Mini. 

Per questa soluzione esploreremo il codice mostrato nel notebook Ultralytics Google Collab. Il notebook Google Collab è facile da usare e chiunque può creare un sistema ANPR senza bisogno di una configurazione complicata.

Passaggio 1: Impostazione dell'ambiente

Per iniziare, dovremo installare le nostre dipendenze, ovvero i pacchetti software e le librerie essenziali necessari per eseguire il nostro sistema ANPR. Queste dipendenze aiutano con attività come il rilevamento di oggetti, l'elaborazione di immagini e il riconoscimento del testo, garantendo che il sistema funzioni in modo efficiente.

Installeremo il pacchettoUltralytics Python come mostrato di seguito. Questo pacchetto fornisce modelli pre-addestrati, utilità di addestramento e strumenti di inferenza che facilitano il detect e il riconoscimento delle targhe con YOLO11.

__wf_reserved_inherit
Figura 2. Installazione del pacchetto Ultralytics Python .

Dovremo anche configurare GPT-4o Mini per il riconoscimento del testo. Poiché GPT-4o Mini è responsabile dell'estrazione del testo dalle targhe rilevate, abbiamo bisogno di una chiave API per accedere al modello. Questa chiave può essere ottenuta registrandosi all'API GPT-4o Mini. Una volta ottenuta la chiave, può essere aggiunta al notebook Colab in modo che il sistema possa connettersi al modello ed elaborare i numeri di targa.

Dopo aver completato la configurazione ed eseguito il codice di installazione, YOLO11 sarà pronto a detect targhe e GPT-4o Mini sarà impostato per riconoscere ed estrarre il testo da esse.

Passaggio 2: Scarica il modello addestrato personalizzato

Ora che tutto è stato configurato, il passo successivo è scaricare il modello YOLO11 che è stato addestrato per detect targhe. Poiché questo modello è già stato addestrato per detect targhe, non è necessario addestrarlo da zero. Basta scaricarlo ed è già pronto all'uso. In questo modo si risparmia tempo e si semplifica il processo.

Inoltre, scaricheremo un file video di esempio per testare il sistema. Se lo desideri, puoi eseguire questa soluzione anche sui tuoi file video. Una volta scaricati, il modello e i file video verranno archiviati nell'ambiente notebook.

__wf_reserved_inherit
Fig. 3. Download del modello e del file video.

Passaggio 3: Carica il video e avvia il rilevamento

Una volta che il modello è pronto, è il momento di vederlo in azione. Innanzitutto, il file video viene caricato per l'elaborazione, assicurandosi che si apra correttamente. Viene quindi impostato un video writer per salvare il filmato elaborato con le targhe rilevate, mantenendo le dimensioni e la frequenza dei fotogrammi originali. Infine, il modello viene caricato per detect targhe in ogni fotogramma del video.

__wf_reserved_inherit
Fig. 4. Lettura del video e caricamento del modello.

Una volta caricato il modello, il sistema inizia ad analizzare ogni fotogramma del video per detect targhe. Quando viene individuata una targa, il sistema la evidenzia con un riquadro di rilevamento, facilitandone l'identificazione. Questa fase assicura che vengano catturati solo i dettagli rilevanti, filtrando le informazioni di sfondo non necessarie. Una volta rilevate le targhe, il video è pronto per la fase successiva.

Passaggio 4: Estrazione del testo dalle targhe

Dopo aver rilevato una targa, il passo successivo è il riconoscimento del testo. Il sistema ritaglia innanzitutto la targa dal fotogramma video, rimuovendo qualsiasi distrazione per una visione chiara. Questo aiuta a concentrarsi sui dettagli, migliorando la precisione anche in condizioni difficili come scarsa illuminazione o sfocatura da movimento.

Una volta isolata la targa, GPT-4o Mini analizza l'immagine, estrae i numeri e le lettere e li converte in testo leggibile. Il testo riconosciuto viene quindi aggiunto di nuovo al video, etichettando ogni targa rilevata in tempo reale.

Una volta completati questi passaggi, il sistema ANPR è pienamente funzionante e pronto a riconoscere le targhe con facilità. 

Passaggio 5: Salvataggio del video elaborato

La fase finale salva il video elaborato ed elimina i file temporanei, assicurando che tutto funzioni correttamente. 

Ogni frame elaborato, con le targhe rilevate e il testo riconosciuto, viene scritto nel video di output finale. Una volta elaborati tutti i frame, il sistema chiude il file video da cui stava leggendo, liberando memoria e risorse di sistema. Finalizza e salva anche il video di output, rendendolo pronto per la riproduzione o ulteriori analisi.

__wf_reserved_inherit
Figura 5. Utilizzo di YOLO11 e GPT-4o Mini per ANPR.

Implementazione di un sistema ANPR

Dopo aver costruito e testato una soluzione ANPR, il passo successivo è l'implementazione in un ambiente reale. La maggior parte dei modelli Vision AI dipende da un'elaborazione ad alte prestazioni, ma Ultralytics YOLO11 è ottimizzato per l'Edge AI. È in grado di funzionare in modo efficiente su dispositivi di piccole dimensioni senza richiedere l'elaborazione in cloud o una connessione Internet costante, il che lo rende un'ottima scelta per i luoghi con risorse limitate.

Ad esempio, una comunità recintata può implementare YOLO11 su un dispositivo edge per identificare i veicoli al loro ingresso, eliminando la necessità di grandi server. Tutto viene elaborato in loco in tempo reale, garantendo un accesso agevole, una riduzione della congestione e una maggiore sicurezza.

__wf_reserved_inherit
Figura 6. Rilevamento di targhe con YOLO11.

Nel frattempo, nelle aree con connettività Internet stabile, l'ANPR basato su cloud può gestire più telecamere contemporaneamente. Per esempio, in un centro commerciale, può track veicoli attraverso diversi ingressi e memorizzare i numeri di targa in un sistema centrale, rendendo più facile il monitoraggio del parcheggio, il miglioramento della sicurezza e la gestione del flusso di veicoli in remoto.

Il futuro dell'ANPR

L'installazione di un sistema di riconoscimento automatico delle targhe (ANPR) è semplice con Ultralytics YOLO11. Rileva con precisione le targhe e può essere addestrato su misura per adattarsi a diversi ambienti e requisiti.

I sistemi ANPR migliorano la sicurezza, semplificano la gestione dei parcheggi e migliorano il monitoraggio del traffico. Automatizzando il riconoscimento delle targhe, riducono gli errori, accelerano l'identificazione e rendono più efficiente il tracciamento dei veicoli in varie applicazioni.

Unisciti alla nostra community e visita il nostro repository GitHub per vedere l'AI in azione. Esplora le nostre opzioni di licenza e scopri di più sulla Vision AI nella produzione e sull'AI nelle auto a guida autonoma nelle nostre pagine delle soluzioni.

Costruiamo insieme il futuro
dell'AI!

Inizia il tuo viaggio con il futuro del machine learning

Inizia gratis