Construire un système ANPR avec Ultralytics YOLO11 et GPT-4o Mini

Abirami Vina

5 minutes de lecture

10 février 2025

Apprenez à construire un système de RPM utilisant Ultralytics YOLO11 pour la détection des plaques d'immatriculation et GPT-4o Mini pour la reconnaissance de texte avec une précision en temps réel.

Il est frustrant de trouver une place de stationnement dans un parking bondé, d'attendre dans de longues files d'attente au péage ou d'être bloqué aux points de contrôle de sécurité. Les contrôles manuels des véhicules prennent souvent trop de temps et entraînent des retards. Sans système automatisé, le suivi efficace des véhicules peut s'avérer difficile. 

La vision par ordinateur a changé la donne en permettant la reconnaissance en temps réel des plaques minéralogiques à partir d'images et de flux vidéo. Par exemple, Ultralytics YOLO11 est un modèle avancé de vision par ordinateur qui peut effectuer des tâches avancées d'intelligence artificielle telles que la détection, la classification et le suivi d'objets. Grâce aux capacités de détection d'objets de YOLO11, vous pouvez détecter avec précision les plaques d'immatriculation des véhicules dans les images. 

Ultralytics propose des blocs-notes Google Colab complets qui simplifient le processus de création de solutions Vision alimentées par l'IA. Ces notebooks sont préconfigurés avec des dépendances essentielles, des modèles et des guides étape par étape, ce qui facilite la création d'applications. Il existe notamment un notebook Colab dédié à la reconnaissance automatique des plaques d'immatriculation ( RAPI ).

Dans cet article, en utilisant le Ultralytics Colab notebook for ANPR, nous allons explorer comment construire une solution ANPR en utilisant Ultralytics YOLO11 pour la détection des plaques minéralogiques et GPT-4o Mini pour la reconnaissance de texte. 

Comprendre l'ANPR 

Le suivi manuel des voitures prend beaucoup de temps et est source d'erreurs, surtout lorsque les véhicules se déplacent rapidement. Vérifier chaque plaque d'immatriculation une à une ralentit le processus et augmente le risque d'erreurs. La reconnaissance automatique des plaques d' immatriculation résout ce problème en utilisant la vision artificielle pour détecter et lire instantanément les plaques d'immatriculation, ce qui rend la surveillance du trafic et la sécurité plus efficaces.

Les systèmes ANPR peuvent capturer des images ou des vidéos des véhicules qui passent et utiliser la détection d'objets en temps réel pour identifier les plaques d'immatriculation. Une fois la plaque détectée, la reconnaissance de texte est utilisée pour extraire automatiquement les numéros de plaque, sans intervention humaine. Ce processus garantit des résultats précis, même lorsque les véhicules se déplacent rapidement ou que les plaques sont partiellement masquées.

__wf_reserved_inherit
Fig. 1. Exemple d'utilisation de YOLO11 pour détecter une plaque d'immatriculation.

De nos jours, les postes de péage, les systèmes de stationnement et les forces de l'ordre s'appuient de plus en plus sur la RAPI pour suivre efficacement les véhicules.

Défis liés à la technologie ANPR

Bien que la RAPI permette d'identifier rapidement les véhicules, certains problèmes peuvent affecter sa précision. Voici quelques problèmes courants qui peuvent avoir une incidence sur le fonctionnement d'un système de RAPI :

  • Faible luminosité et mauvais temps : Les plaques d'immatriculation sont plus difficiles à lire la nuit et par mauvais temps. Le brouillard, la pluie et l'éblouissement des phares peuvent brouiller le texte et le rendre illisible.
  • Plaques floues ou bloquées : Une voiture roulant rapidement peut laisser une image floue, surtout si la vitesse d'obturation de l'appareil photo est trop lente. La saleté, les rayures ou le recouvrement d'une partie de la plaque peuvent également poser des problèmes de reconnaissance. L'utilisation d'appareils photo de haute qualité avec les bons réglages permet d'obtenir des résultats plus clairs.
  • Des modèles de plaques incohérents : Toutes les plaques ne se ressemblent pas. Certaines ont des polices de caractères fantaisistes, du texte supplémentaire ou des logos qui perturbent le système.
  • Risques pour la vie privée et sécurité des données : Il est important de stocker les données relatives aux véhicules en toute sécurité. Les bonnes mesures de sécurité peuvent empêcher les accès non autorisés et protéger les informations. Avec des mesures de protection appropriées, les systèmes de RAPI peuvent être à la fois sûrs et fiables.

Comment YOLO11 améliore les systèmes de RPA

Ultralytics YOLO11 peut rendre les systèmes de RPA plus rapides et plus précis. Il traite les images rapidement tout en maintenant la précision et ne nécessite pas une grande puissance de calcul, de sorte qu'il fonctionne bien sur tous les systèmes, des petites caméras de sécurité aux grands systèmes de circulation.

Grâce à un entraînement personnalisé, YOLO11 peut être adapté à différents styles de plaques d'immatriculation, à différentes langues et à différents environnements. Il donne également de bons résultats dans des conditions difficiles telles que la faible luminosité, le flou de mouvement et les angles difficiles lorsqu'il est entraîné sur mesure à partir d'ensembles de données spécialisés comprenant des images dans ces conditions.

En identifiant instantanément les véhicules, YOLO11 permet de réduire les temps d'attente, d'éviter les erreurs et d'améliorer la sécurité. La circulation est ainsi plus fluide et les opérations plus efficaces dans les parkings, les postes de péage et les systèmes de surveillance.

Construire un système ANPR avec YOLO11 et GPT-4o Mini

Ensuite, nous allons voir comment construire un système ANPR en utilisant YOLO11 et GPT-4o Mini. 

Nous allons explorer le code présenté dans le carnet Ultralytics Google Collab pour cette solution. Le cahier Google Collab est facile à utiliser et n'importe qui peut créer un système ANPR sans avoir besoin d'une configuration compliquée.

Étape 1 : Mise en place de l'environnement

Pour commencer, nous devons installer nos dépendances, c'est-à-dire les logiciels et bibliothèques essentiels au fonctionnement de notre système de RPM. Ces dépendances permettent d'effectuer des tâches telles que la détection d'objets, le traitement d'images et la reconnaissance de texte, garantissant ainsi le bon fonctionnement du système.

Nous installerons le paquetage Python Ultralytics comme indiqué ci-dessous. Ce package fournit des modèles pré-entraînés, des utilitaires d'entraînement et des outils d'inférence, facilitant la détection et la reconnaissance des plaques d'immatriculation avec YOLO11.

__wf_reserved_inherit
Fig 2. Installation du paquetage Ultralytics Python.

Nous devons également configurer GPT-4o Mini pour la reconnaissance de texte. Puisque GPT-4o Mini est responsable de l'extraction du texte des plaques détectées, nous avons besoin d'une clé API pour accéder au modèle. Cette clé peut être obtenue en s'inscrivant à l'API de GPT-4o Mini. Une fois la clé obtenue, elle peut être ajoutée au notebook Colab afin que le système puisse se connecter au modèle et traiter les numéros de plaque.

Après avoir terminé la configuration et exécuté le code d'installation, YOLO11 sera prêt à détecter les plaques d'immatriculation, et GPT-4o Mini sera configuré pour reconnaître et extraire le texte de ces plaques.

Étape 2 : Télécharger le modèle formé sur mesure

Maintenant que tout est configuré, l'étape suivante consiste à télécharger le modèle YOLO11 qui a été entraîné sur mesure pour détecter les plaques d'immatriculation. Comme ce modèle a déjà été entraîné pour détecter les plaques d'immatriculation, il n'est pas nécessaire de l'entraîner à partir de zéro. Il suffit de le télécharger pour qu'il soit prêt à l'emploi. Cela permet de gagner du temps et facilite grandement le processus.

Nous téléchargerons également un exemple de fichier vidéo pour tester le système. Si vous le souhaitez, vous pouvez également utiliser cette solution sur vos propres fichiers vidéo. Une fois téléchargés, le modèle et les fichiers vidéo seront stockés dans l'environnement de l'ordinateur portable.

__wf_reserved_inherit
Fig. 3. Téléchargement du modèle et du fichier vidéo.

Étape 3 : Chargement de la vidéo et début de la détection

Une fois le modèle prêt, il est temps de le voir en action. Tout d'abord, le fichier vidéo est chargé pour traitement, en veillant à ce qu'il s'ouvre correctement. Un graveur vidéo est ensuite configuré pour enregistrer la séquence traitée avec les plaques d'immatriculation détectées tout en conservant la taille et la fréquence d'images d'origine. Enfin, le modèle est chargé de détecter les plaques d'immatriculation dans chaque image de la vidéo.

__wf_reserved_inherit
Fig. 4. Lecture de la vidéo et chargement du modèle.

Une fois le modèle chargé, le système commence à analyser chaque image de la vidéo pour détecter les plaques d'immatriculation. Lorsqu'une plaque est détectée, le système la met en évidence à l'aide d'une boîte de détection, ce qui facilite son identification. Cette étape garantit que seuls les détails pertinents sont capturés, en filtrant les informations d'arrière-plan inutiles. Une fois les plaques détectées, la vidéo est prête pour l'étape suivante.

Étape 4 : Extraction du texte des plaques d'immatriculation

Après avoir détecté une plaque d'immatriculation, l'étape suivante est la reconnaissance du texte. Le système commence par découper la plaque d'immatriculation dans l'image vidéo, en éliminant toute distraction pour obtenir une vue claire. Cela permet de se concentrer sur les détails et d'améliorer la précision, même dans des conditions difficiles telles qu'une faible luminosité ou un flou de mouvement.

Une fois la plaque isolée, GPT-4o Mini analyse l'image, extrait les chiffres et les lettres et les convertit en texte lisible. Le texte reconnu est ensuite ajouté à la vidéo, étiquetant chaque plaque détectée en temps réel.

Une fois ces étapes terminées, le système RAPI est entièrement fonctionnel et prêt à reconnaître facilement les plaques d'immatriculation. 

Étape 5 : Enregistrement de la vidéo traitée

L'étape finale consiste à enregistrer la vidéo traitée et à nettoyer les fichiers temporaires, afin de s'assurer que tout se passe bien. 

Chaque image traitée, avec les plaques détectées et le texte reconnu, est écrite dans la vidéo de sortie finale. Une fois toutes les images traitées, le système ferme le fichier vidéo à partir duquel il lisait, libérant ainsi de la mémoire et des ressources système. Il finalise et enregistre également la vidéo de sortie, la rendant prête à être lue ou à faire l'objet d'une analyse plus poussée.

__wf_reserved_inherit
Fig. 5. Utilisation de YOLO11 et de GPT-4o Mini pour la RNA.

Déploiement d'un système RAPI

Après avoir construit et testé une solution de RNA, l'étape suivante consiste à la déployer dans un environnement réel. La plupart des modèles Vision AI dépendent d'un système informatique haute performance, mais Ultralytics YOLO11 est optimisé pour l'Edge AI. Il peut fonctionner efficacement sur de petits appareils sans nécessiter de traitement en nuage ou de connexion Internet permanente, ce qui en fait un excellent choix pour les sites disposant de ressources limitées.

Par exemple, une communauté fermée peut déployer YOLO11 sur un appareil périphérique pour identifier les véhicules dès leur entrée, ce qui élimine le besoin de gros serveurs. Tout est traité sur place en temps réel, ce qui garantit un accès fluide, une réduction des encombrements et une sécurité accrue.

__wf_reserved_inherit
Fig. 6. Détection de plaques d'immatriculation avec YOLO11.

Par ailleurs, dans les zones où la connectivité internet est stable, la RAPI basée sur le cloud peut gérer plusieurs caméras simultanément. Par exemple, dans un centre commercial, il peut suivre les véhicules à travers les différentes entrées et stocker les numéros de plaque dans un système central, ce qui facilite la surveillance du stationnement, l'amélioration de la sécurité et la gestion à distance du flux de véhicules.

La voie à suivre pour l'ANPR

La mise en place d'un système de reconnaissance automatique des plaques d'immatriculation (RAPI) est simple avec Ultralytics YOLO11. Il détecte avec précision les plaques d'immatriculation et peut être personnalisé pour s'adapter à différents environnements et exigences.

Les systèmes ANPR renforcent la sécurité, rationalisent la gestion des parkings et améliorent la surveillance du trafic. En automatisant la reconnaissance des plaques d'immatriculation, ils réduisent les erreurs, accélèrent l'identification et rendent le suivi des véhicules plus efficace dans diverses applications.

Rejoignez notre communauté et visitez notre dépôt GitHub pour voir l'IA en action. Explorez nos options de licence et découvrez plus en détail Vision AI in manufacturing et AI in self-driving cars sur nos pages de solutions.

Construisons ensemble le futur
de l'IA !

Commencez votre voyage avec l'avenir de l'apprentissage automatique

Commencer gratuitement
Lien copié dans le presse-papiers