Indem Sie auf „Alle Cookies akzeptieren“ klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Website-Navigation zu verbessern, die Website-Nutzung zu analysieren und unsere Marketingbemühungen zu unterstützen. Mehr Infos
Cookie-Einstellungen
Indem Sie auf „Alle Cookies akzeptieren“ klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Website-Navigation zu verbessern, die Website-Nutzung zu analysieren und unsere Marketingbemühungen zu unterstützen. Mehr Infos
Erfahren Sie, wie Sie ein ANPR-System mit Ultralytics YOLO11 für die Nummernschilderkennung und GPT-4o Mini für die Texterkennung mit Echtzeitgenauigkeit erstellen.
Es ist frustrierend, auf einem überfüllten Parkplatz einen Stellplatz zu finden, in langen Schlangen an Mautstellen zu warten oder an Sicherheitskontrollen aufgehalten zu werden. Manuelle Fahrzeugkontrollen dauern oft zu lange und verursachen Verzögerungen. Ohne ein automatisiertes System kann die effiziente Verfolgung von Fahrzeugen eine Herausforderung darstellen.
Computer Vision hat dies verändert, indem es die Echtzeit-Kennzeichenerkennung aus Bildern und Videostreams ermöglicht. Zum Beispiel ist Ultralytics YOLO11 ein fortschrittliches Computer Vision Modell, das fortschrittliche Vision AI-Aufgaben wie Objekterkennung, Klassifizierung und Tracking durchführen kann. Mit den Objekterkennungsfähigkeiten von YOLO11 können Sie Fahrzeugkennzeichen in Bildern präzise erkennen.
Ultralytics bietet umfassende Google Colab Notebooks, die den Prozess der Erstellung von Vision AI-gestützten Lösungen vereinfachen. Diese Notebooks sind vorkonfiguriert mit den wichtigsten Abhängigkeiten, Modellen und Schritt-für-Schritt-Anleitungen, was die Erstellung von Anwendungen vereinfacht. Insbesondere gibt es ein spezielles Colab Notebook für ANPR (Automatic Number Plate Recognition, automatische Kennzeichenerkennung).
In diesem Artikel werden wir anhand des Ultralytics Colab Notebooks für ANPR untersuchen, wie man eine ANPR-Lösung mit Ultralytics YOLO11 für die Nummernschilderkennung und GPT-4o Mini für die Texterkennung erstellt.
ANPR verstehen
Das manuelle Erfassen von Autos ist zeitaufwendig und fehleranfällig, insbesondere wenn sie sich schnell bewegen. Die Überprüfung jedes einzelnen Nummernschilds verlangsamt den Prozess und erhöht das Fehlerrisiko. Die automatische Nummernschilderkennung löst dieses Problem, indem sie Computer Vision verwendet, um Nummernschilder sofort zu erkennen und zu lesen, wodurch die Verkehrsüberwachung und Sicherheit effizienter werden.
ANPR-Systeme können Bilder oder Videos von vorbeifahrenden Fahrzeugen aufnehmen und die Objekterkennung in Echtzeit nutzen, um Nummernschilder zu identifizieren. Nach der Erkennung wird die Texterkennung verwendet, um die Kennzeichen automatisch zu extrahieren, ohne dass ein menschliches Eingreifen erforderlich ist. Dieser Prozess gewährleistet genaue Ergebnisse, selbst wenn sich Fahrzeuge schnell bewegen oder Kennzeichen teilweise verdeckt sind.
Abb. 1. Ein Beispiel für die Verwendung von YOLO11 zur Erkennung eines Nummernschilds.
Heutzutage verlassen sich Mautstellen, Parksysteme und Strafverfolgungsbehörden zunehmend auf ANPR, um Fahrzeuge effizient zu verfolgen.
Herausforderungen im Zusammenhang mit der ANPR-Technologie
Obwohl ANPR Fahrzeuge schnell identifiziert, gibt es immer noch einige Herausforderungen, die die Genauigkeit beeinträchtigen können. Hier sind einige häufige Probleme, die die Funktionsweise eines ANPR-Systems beeinträchtigen können:
Schwaches Licht und schlechtes Wetter: Nummernschilder sind nachts und bei schlechtem Wetter schwerer zu lesen. Nebel, Regen und das Blenden durch Scheinwerfer können den Text verschwimmen lassen und ihn unleserlich machen.
Verschwommene oder blockierte Kennzeichen: Ein sich schnell bewegendes Auto kann ein verschwommenes Bild hinterlassen, besonders wenn die Verschlusszeit der Kamera zu langsam ist. Schmutz, Kratzer oder Teile des Kennzeichens, die bedeckt sind, können ebenfalls Erkennungsprobleme verursachen. Die Verwendung hochwertiger Kameras mit den richtigen Einstellungen hilft, klarere Ergebnisse zu erzielen.
Inkonsistente Kennzeichengestaltungen: Nicht alle Kennzeichen sehen gleich aus. Einige haben ausgefallene Schriftarten, zusätzlichen Text oder Logos, die das System verwirren.
Datenschutzrisiken und Datensicherheit: Die sichere Speicherung von Fahrzeugdaten ist wichtig. Die richtigen Sicherheitsmaßnahmen können unbefugten Zugriff verhindern und Informationen schützen. Mit geeigneten Schutzvorkehrungen können ANPR-Systeme sowohl sicher als auch zuverlässig sein.
Wie YOLO11 ANPR-Systeme verbessert
Ultralytics YOLO11 kann ANPR-Systeme schneller und genauer machen. Es verarbeitet Bilder schnell und präzise und benötigt keine hohe Rechenleistung, sodass es von kleinen Überwachungskameras bis hin zu großen Verkehrssystemen gut funktioniert.
Durch Custom Training kann YOLO11 an verschiedene Kennzeichenstile, Sprachen und Umgebungen angepasst werden. Es funktioniert auch gut unter schwierigen Bedingungen wie schlechten Lichtverhältnissen, Bewegungsunschärfe und schwierigen Winkeln, wenn es mit spezialisierten Datensätzen trainiert wird, die Bilder dieser Bedingungen enthalten.
Durch die sofortige Identifizierung von Fahrzeugen trägt YOLO11 dazu bei, Wartezeiten zu verkürzen, Fehler zu vermeiden und die Sicherheit zu verbessern. Dies sorgt für einen reibungsloseren Verkehrsfluss und effizientere Abläufe auf Parkplätzen, an Mautstellen und in Überwachungssystemen.
Aufbau eines ANPR-Systems mit YOLO11 und GPT-4o Mini
Als Nächstes werden wir durchgehen, wie man ein ANPR-System mit YOLO11 und GPT-4o Mini aufbaut.
Wir werden den Code untersuchen, der im Ultralytics Google Collab Notebook für diese Lösung gezeigt wird. Das Google Colab Notebook ist einfach zu bedienen und jeder kann ein ANPR-System erstellen, ohne dass eine komplizierte Einrichtung erforderlich ist.
Schritt 1: Einrichten der Umgebung
Um zu beginnen, müssen wir unsere Abhängigkeiten installieren, d. h. die wesentlichen Softwarepakete und Bibliotheken, die für den Betrieb unseres ANPR-Systems erforderlich sind. Diese Abhängigkeiten helfen bei Aufgaben wie Objekterkennung, Bildverarbeitung und Texterkennung und sorgen dafür, dass das System effizient arbeitet.
Wir werden das Ultralytics Python-Paket installieren, wie unten gezeigt. Dieses Paket bietet vortrainierte Modelle, Trainingsdienstprogramme und Inferenztools, die es einfacher machen, Nummernschilder mit YOLO11 zu erkennen.
Abb. 2. Installation des Ultralytics Python-Pakets.
Wir müssen auch GPT-4o Mini für die Texterkennung einrichten. Da GPT-4o Mini für das Extrahieren von Text aus erkannten Kennzeichen verantwortlich ist, benötigen wir einen API-Schlüssel, um auf das Modell zuzugreifen. Dieser Schlüssel kann durch die Anmeldung für die GPT-4o Mini API erhalten werden. Sobald Sie den Schlüssel haben, kann er dem Colab-Notebook hinzugefügt werden, damit sich das System mit dem Modell verbinden und Kennzeichen verarbeiten kann.
Nachdem die Einrichtung abgeschlossen und der Installationscode ausgeführt wurde, ist YOLO11 bereit, Nummernschilder zu erkennen, und GPT-4o Mini ist eingerichtet, um Text von diesen zu erkennen und zu extrahieren.
Schritt 2: Laden Sie das benutzerdefinierte trainierte Modell herunter
Nachdem nun alles eingerichtet ist, besteht der nächste Schritt darin, das YOLO11-Modell herunterzuladen, das speziell für die Erkennung von Nummernschildern trainiert wurde. Da dieses Modell bereits für die Erkennung von Nummernschildern trainiert wurde, ist es nicht erforderlich, es von Grund auf neu zu trainieren. Sie können es einfach herunterladen und es ist einsatzbereit. Das spart Zeit und vereinfacht den Prozess erheblich.
Außerdem laden wir eine Beispielvideodatei herunter, um das System zu testen. Wenn Sie möchten, können Sie diese Lösung auch mit Ihren eigenen Videodateien ausführen. Nach dem Herunterladen werden das Modell und die Videodateien in der Notebook-Umgebung gespeichert.
Abb. 3. Herunterladen des Modells und der Videodatei.
Schritt 3: Laden Sie das Video und starten Sie die Erkennung
Sobald das Modell fertig ist, ist es an der Zeit, es in Aktion zu sehen. Zuerst wird die Videodatei zur Verarbeitung geladen, um sicherzustellen, dass sie korrekt geöffnet wird. Anschließend wird ein Video-Writer eingerichtet, um das verarbeitete Filmmaterial mit erkannten Nummernschildern zu speichern, wobei die ursprüngliche Größe und Bildrate beibehalten werden. Schließlich wird das Modell geladen, um Nummernschilder in jedem Frame des Videos zu erkennen.
Abb. 4. Das Video wird gelesen und das Modell geladen.
Sobald das Modell geladen ist, beginnt das System, jedes Frame des Videos zu analysieren, um Nummernschilder zu erkennen. Wenn ein Schild gefunden wird, hebt das System es mit einem Erkennungsfeld hervor, wodurch es leicht zu identifizieren ist. Dieser Schritt stellt sicher, dass nur die relevanten Details erfasst werden, während unnötige Hintergrundinformationen herausgefiltert werden. Nachdem die Schilder erfolgreich erkannt wurden, ist das Video nun bereit für den nächsten Schritt.
Schritt 4: Extrahieren von Text aus Nummernschildern
Nachdem ein Nummernschild erkannt wurde, ist der nächste Schritt die Texterkennung. Das System schneidet zuerst das Schild aus dem Videobild aus, wodurch Ablenkungen für eine klare Sicht entfernt werden. Dies hilft, sich auf die Details zu konzentrieren und die Genauigkeit auch unter schwierigen Bedingungen wie schlechten Lichtverhältnissen oder Bewegungsunschärfe zu verbessern.
Sobald die Platte isoliert ist, analysiert GPT-4o Mini das Bild, extrahiert die Zahlen und Buchstaben und wandelt sie in lesbaren Text um. Der erkannte Text wird dann wieder zum Video hinzugefügt und kennzeichnet jede erkannte Platte in Echtzeit.
Nachdem diese Schritte abgeschlossen sind, ist das ANPR-System voll funktionsfähig und bereit, Nummernschilder mühelos zu erkennen.
Schritt 5: Speichern des verarbeiteten Videos
Der letzte Schritt speichert das verarbeitete Video und bereinigt temporäre Dateien, um einen reibungslosen Ablauf zu gewährleisten.
Jedes verarbeitete Frame mit erkannten Kennzeichen und erkanntem Text wird in das endgültige Ausgabevideo geschrieben. Sobald alle Frames verarbeitet wurden, schließt das System die Videodatei, aus der es gelesen hat, wodurch Speicher und Systemressourcen freigegeben werden. Außerdem wird das Ausgabevideo fertiggestellt und gespeichert, sodass es für die Wiedergabe oder weitere Analysen bereit ist.
Abb. 5. Verwendung von YOLO11 und GPT-4o Mini für ANPR.
Bereitstellung eines ANPR-Systems
Nach dem Aufbau und Testen einer ANPR-Lösung besteht der nächste Schritt darin, sie in einer realen Umgebung einzusetzen. Die meisten Vision-KI-Modelle sind auf High-Performance-Computing angewiesen, aber Ultralytics YOLO11 ist für Edge-KI optimiert. Es kann effizient auf kleinen Geräten laufen, ohne Cloud-Verarbeitung oder eine ständige Internetverbindung zu benötigen, was es zu einer guten Wahl für Standorte mit begrenzten Ressourcen macht.
Beispielsweise kann eine Wohnanlage YOLO11 auf einem Edge-Gerät einsetzen, um Fahrzeuge bei der Einfahrt zu identifizieren, wodurch große Server überflüssig werden. Alles wird vor Ort in Echtzeit verarbeitet, was einen reibungslosen Zugang, weniger Staus und erhöhte Sicherheit gewährleistet.
Abb. 6. Erkennung von Nummernschildern mit YOLO11.
In Gebieten mit stabiler Internetverbindung kann Cloud-basiertes ANPR unterdessen mehrere Kameras gleichzeitig verarbeiten. In einem Einkaufszentrum kann es beispielsweise Fahrzeuge an verschiedenen Eingängen verfolgen und Kennzeichen in einem zentralen System speichern, was die Überwachung des Parkens, die Verbesserung der Sicherheit und die Fernverwaltung des Fahrzeugflusses erleichtert.
Der weitere Weg für ANPR
Das Einrichten eines automatischen Kennzeichenerkennungssystems (ANPR) ist mit Ultralytics YOLOv8 einfach. Es erkennt Kennzeichen genau und kann kundenspezifisch trainiert werden, um sich an verschiedene Umgebungen und Anforderungen anzupassen.
ANPR-Systeme verbessern die Sicherheit, rationalisieren das Parkraummanagement und verbessern die Verkehrsüberwachung. Durch die Automatisierung der Kennzeichenerkennung reduzieren sie Fehler, beschleunigen die Identifizierung und machen die Fahrzeugverfolgung in verschiedenen Anwendungen effizienter.