Scoprite come costruire un sistema ANPR utilizzando Ultralytics YOLO11 per il rilevamento delle targhe e GPT-4o Mini per il riconoscimento del testo con una precisione in tempo reale.

Scoprite come costruire un sistema ANPR utilizzando Ultralytics YOLO11 per il rilevamento delle targhe e GPT-4o Mini per il riconoscimento del testo con una precisione in tempo reale.
Trovare parcheggio in un parcheggio affollato, attendere in lunghe file ai caselli o rimanere bloccati ai controlli di sicurezza è frustrante. I controlli manuali dei veicoli spesso richiedono troppo tempo e causano ritardi. Senza un sistema automatizzato, tracciare le auto in modo efficiente può essere difficile.
La visione computerizzata ha cambiato questa situazione consentendo il riconoscimento delle targhe in tempo reale da immagini e flussi video. Ad esempio, Ultralytics YOLO11 è un modello avanzato di computer vision in grado di eseguire compiti avanzati di Vision AI come il rilevamento, la classificazione e il tracciamento degli oggetti. Grazie alle capacità di rilevamento degli oggetti di YOLO11, è possibile individuare con precisione le targhe dei veicoli nelle immagini.
Ultralytics offre notebook Google Colab completi che semplificano il processo di creazione di soluzioni Vision AI. Questi notebook sono preconfigurati con le dipendenze essenziali, i modelli e le guide passo-passo, per facilitare la creazione di applicazioni. In particolare, esiste un notebook Colab dedicato all 'ANPR (Automatic Number Plate Recognition).
In questo articolo, utilizzando il notebook Ultralytics Colab per l'ANPR, vedremo come costruire una soluzione ANPR utilizzando Ultralytics YOLO11 per il rilevamento delle targhe e GPT-4o Mini per il riconoscimento del testo.
Tracciare le auto manualmente richiede molto tempo ed è soggetto a errori, soprattutto quando si muovono velocemente. Controllare ogni targa una per una rallenta il processo e aumenta il rischio di errori. Il riconoscimento automatico delle targhe risolve questo problema utilizzando la visione computerizzata per rilevare e leggere istantaneamente le targhe, rendendo più efficiente il monitoraggio del traffico e la sicurezza.
I sistemi ANPR possono acquisire immagini o video dei veicoli in transito e utilizzare il rilevamento degli oggetti in tempo reale per identificare le targhe. Una volta rilevate, il riconoscimento del testo viene utilizzato per estrarre automaticamente i numeri di targa, senza bisogno dell'intervento umano. Questo processo garantisce risultati accurati, anche quando i veicoli si muovono rapidamente o le targhe sono parzialmente oscurate.
Oggi i caselli autostradali, i sistemi di parcheggio e le forze dell'ordine si affidano sempre più all'ANPR per tracciare i veicoli in modo efficiente.
Sebbene l'ANPR identifichi rapidamente i veicoli, ci sono ancora alcune sfide che possono comprometterne l'accuratezza. Ecco alcuni problemi comuni che possono influire sul funzionamento di un sistema ANPR:
Ultralytics YOLO11 può rendere i sistemi ANPR più veloci e precisi. Elabora rapidamente le immagini mantenendo la precisione e non richiede una grande potenza di calcolo, per cui funziona bene su tutti i sistemi, dalle piccole telecamere di sicurezza ai grandi sistemi di traffico.
Con l'addestramento personalizzato, YOLO11 può essere adattato a diversi stili di targa, lingue e ambienti. Si comporta bene anche in condizioni difficili, come la scarsa illuminazione, la sfocatura da movimento e gli angoli difficili, se addestrato su set di dati specializzati che includono immagini in queste condizioni.
Identificando istantaneamente i veicoli, YOLO11 aiuta a ridurre i tempi di attesa, a prevenire gli errori e a migliorare la sicurezza. Ciò rende più fluido il traffico e più efficienti le operazioni nei parcheggi, nei caselli autostradali e nei sistemi di sorveglianza.
Vediamo quindi come costruire un sistema ANPR utilizzando YOLO11 e GPT-4o Mini.
Per questa soluzione esploreremo il codice mostrato nel notebook Ultralytics Google Collab. Il notebook Google Collab è facile da usare e chiunque può creare un sistema ANPR senza bisogno di una configurazione complicata.
Per iniziare, dobbiamo installare le nostre dipendenze, ovvero i pacchetti software e le librerie essenziali per il funzionamento del nostro sistema ANPR. Queste dipendenze aiutano a svolgere compiti come il rilevamento degli oggetti, l'elaborazione delle immagini e il riconoscimento del testo, garantendo un funzionamento efficiente del sistema.
Installeremo il pacchetto Ultralytics Python come mostrato di seguito. Questo pacchetto fornisce modelli pre-addestrati, utilità di addestramento e strumenti di inferenza che facilitano il rilevamento e il riconoscimento delle targhe con YOLO11.
È inoltre necessario configurare GPT-4o Mini per il riconoscimento del testo. Poiché GPT-4o Mini è responsabile dell'estrazione del testo dalle targhe rilevate, abbiamo bisogno di una chiave API per accedere al modello. Questa chiave può essere ottenuta iscrivendosi all'API di GPT-4o Mini. Una volta ottenuta la chiave, è possibile aggiungerla al notebook Colab in modo che il sistema possa collegarsi al modello ed elaborare i numeri di targa.
Dopo aver completato la configurazione ed eseguito il codice di installazione, YOLO11 sarà pronto a rilevare le targhe e GPT-4o Mini sarà impostato per riconoscere ed estrarre il testo da esse.
Ora che tutto è stato configurato, il passo successivo è scaricare il modello YOLO11 che è stato addestrato per rilevare le targhe. Poiché questo modello è già stato addestrato per rilevare le targhe, non è necessario addestrarlo da zero. Basta scaricarlo ed è già pronto all'uso. In questo modo si risparmia tempo e si semplifica il processo.
Inoltre, scaricheremo un file video di esempio per testare il sistema. Se si desidera, è possibile eseguire questa soluzione anche sui propri file video. Una volta scaricati, il modello e i file video verranno memorizzati nell'ambiente del notebook.
Una volta che il modello è pronto, è il momento di vederlo in azione. Innanzitutto, il file video viene caricato per l'elaborazione, assicurandosi che si apra correttamente. Viene quindi impostato un video writer per salvare il filmato elaborato con le targhe rilevate, mantenendo le dimensioni e la frequenza dei fotogrammi originali. Infine, il modello viene caricato per rilevare le targhe in ogni fotogramma del video.
Una volta caricato il modello, il sistema inizia ad analizzare ogni fotogramma del video per rilevare le targhe. Quando viene individuata una targa, il sistema la evidenzia con un riquadro di rilevamento, facilitandone l'identificazione. Questa fase assicura che vengano catturati solo i dettagli rilevanti, filtrando le informazioni di sfondo non necessarie. Una volta rilevate le targhe, il video è pronto per la fase successiva.
Dopo aver rilevato una targa, il passo successivo è il riconoscimento del testo. Il sistema ritaglia innanzitutto la targa dal fotogramma video, eliminando qualsiasi distrazione per una visione chiara. Questo aiuta a concentrarsi sui dettagli, migliorando l'accuratezza anche in condizioni difficili come la scarsa illuminazione o la sfocatura del movimento.
Una volta isolata la piastra, GPT-4o Mini analizza l'immagine, estrae i numeri e le lettere e li converte in testo leggibile. Il testo riconosciuto viene quindi aggiunto al video, etichettando ogni piastra rilevata in tempo reale.
Una volta completati questi passaggi, il sistema ANPR è completamente funzionante e pronto a riconoscere le targhe con facilità.
La fase finale salva il video elaborato e pulisce i file temporanei, assicurando che tutto funzioni correttamente.
Ogni fotogramma elaborato, con le lastre rilevate e il testo riconosciuto, viene scritto nel video di uscita finale. Una volta elaborati tutti i fotogrammi, il sistema chiude il file video da cui stava leggendo, liberando memoria e risorse di sistema. Inoltre, finalizza e salva il video di uscita, rendendolo pronto per la riproduzione o per ulteriori analisi.
Dopo aver costruito e testato una soluzione ANPR, il passo successivo è l'implementazione in un ambiente reale. La maggior parte dei modelli Vision AI dipende da un'elaborazione ad alte prestazioni, ma Ultralytics YOLO11 è ottimizzato per l'Edge AI. È in grado di funzionare in modo efficiente su dispositivi di piccole dimensioni senza richiedere l'elaborazione in cloud o una connessione Internet costante, il che lo rende un'ottima scelta per i luoghi con risorse limitate.
Ad esempio, una comunità recintata può implementare YOLO11 su un dispositivo edge per identificare i veicoli al loro ingresso, eliminando la necessità di grandi server. Tutto viene elaborato in loco in tempo reale, garantendo un accesso agevole, una riduzione della congestione e una maggiore sicurezza.
Nel frattempo, nelle aree con connettività Internet stabile, l'ANPR basato su cloud può gestire più telecamere contemporaneamente. Per esempio, in un centro commerciale, può tracciare i veicoli attraverso diversi ingressi e memorizzare i numeri di targa in un sistema centrale, rendendo più facile il monitoraggio del parcheggio, il miglioramento della sicurezza e la gestione del flusso di veicoli in remoto.
L'installazione di un sistema di riconoscimento automatico delle targhe (ANPR) è semplice con Ultralytics YOLO11. Rileva con precisione le targhe e può essere addestrato su misura per adattarsi a diversi ambienti e requisiti.
I sistemi ANPR aumentano la sicurezza, semplificano la gestione dei parcheggi e migliorano il monitoraggio del traffico. Automatizzando il riconoscimento delle targhe, riducono gli errori, velocizzano l'identificazione e rendono più efficiente la localizzazione dei veicoli in diverse applicazioni.
Unitevi alla nostra comunità e visitate il nostro repository GitHub per vedere l'IA in azione. Esplorate le nostre opzioni di licenza e scoprite di più sull'IA di Vision nella produzione e sull'IA nelle auto a guida autonoma nelle nostre pagine dedicate alle soluzioni.