So verwenden Sie Ultralytics YOLO11 für die OBB-Objekterkennung

Abirami Vina

5 Minuten lesen

8. Oktober 2024

Erfahren Sie, wie Ultralytics YOLO11 die Objekterkennung mit Hilfe von orientierten Bounding Boxes (OBB) verbessern kann und für welche Anwendungen sich diese Bildverarbeitungsaufgabe ideal eignet.

Die jährliche Hybrid-Veranstaltung von Ultralytics, YOLO Vision 2024 (YV24), konzentrierte sich auf die Erörterung der neuesten Durchbrüche in den Bereichen KI und Computer Vision. Dies war die perfekte Gelegenheit, um unser neuestes Modell, Ultralytics YOLO11, vorzustellen. Das Modell unterstützt die gleichen Computer-Vision-Aufgaben wie Ultralytics YOLOv8, so dass der Umstieg auf das neue Modell für die Benutzer mühelos ist.

Angenommen, Sie verwenden YOLOv8 für die Objekterkennung mit orientierten Bounding Boxes (OBB), um Objekte aus verschiedenen Winkeln zu erkennen. Sie können nun mit ein paar kleinen Änderungen an Ihrem Code zu YOLO11 wechseln und von den Verbesserungen von YOLO11 profitieren, die von erhöhter Genauigkeit und Effizienz bis hin zur Verarbeitungsgeschwindigkeit reichen. Falls Sie noch keine Modelle wie YOLO11 verwenden, ist die OBB-Erkennung ein großartiges Beispiel dafür , wie YOLO11 in einer Reihe von Branchen eingesetzt werden kann und praktische Lösungen bietet, die eine echte Wirkung haben.

In diesem Artikel werden wir uns ansehen, was OBB-Objekterkennung ist, wo sie angewendet werden kann und wie man YOLO11 zur Erkennung von OBB verwendet. Wir gehen auch darauf ein, wie die neuen Funktionen von YOLO11 diese Prozesse verbessern können und wie man Inferenzen durchführt und benutzerdefinierte Modelle trainiert, um das Beste aus den OBB-Erkennungsfunktionen zu machen.

Die YOLO11-Funktionen der nächsten Generation umfassen Aufgaben wie OBB-Objekterkennung

Die OBB-Objekterkennung geht einen Schritt weiter als die herkömmliche Objekterkennung, indem sie Objekte in verschiedenen Winkeln erkennt. Im Gegensatz zu normalen Bounding Boxes, die an den Bildachsen ausgerichtet bleiben, drehen sich OBBs, um sich der Ausrichtung des Objekts anzupassen. Die OBB-Objekterkennung kann zur Analyse von Luft- oder Satellitenbildern verwendet werden, bei denen die Objekte nicht immer gerade sind. In Branchen wie Stadtplanung, Energie und Verkehr kann die Fähigkeit, schräge Objekte wie Gebäude, Fahrzeuge oder Infrastruktur genau zu erkennen, die Grundlage für Computer-Vision-Anwendungen mit greifbaren Vorteilen bilden. 

__wf_reserved_inherit
Abb. 1. Vergleich zwischen normalen Begrenzungsrahmen und orientierten Begrenzungsrahmen.

YOLO11 unterstützt die OBB-Erkennung und wurde mit dem DOTA v1.0-Datensatz trainiert, um Objekte wie Flugzeuge, Schiffe und Lagertanks aus verschiedenen Perspektiven zu erkennen. YOLO11 ist in verschiedenen Modellvarianten erhältlich, um unterschiedlichen Anforderungen gerecht zu werden, darunter YOLO11n-obb (Nano), YOLO11s-obb (Small), YOLO11m-obb (Medium), YOLO11l-obb (Large) und YOLO11x-obb (Extra Large). Jedes Modell bietet eine andere Größe mit unterschiedlicher Geschwindigkeit, Genauigkeit und Rechenleistung. Die Benutzer können das Modell wählen, das für ihre Anwendung die richtige Balance zwischen Geschwindigkeit und Genauigkeit bietet. 

YOLO11 Anwendungsfälle, die einen neuen Blickwinkel auf die Erkennung eröffnen

Die Objekterkennungsfunktionen von YOLO11, insbesondere die Unterstützung für orientierte Bounding Boxes, bringen mehr Präzision in verschiedene Branchen. Im Folgenden sehen wir uns einige Beispiele an, wie YOLO11 und die OBB-Erkennung in der Praxis eingesetzt werden können, um Prozesse in verschiedenen Bereichen effizienter, genauer und einfacher zu gestalten.

Stadtplanung und Infrastrukturüberwachung mit YOLO11

Wenn Sie jemals das Design und den Grundriss einer Stadt bewundert haben, dann ist das der detaillierten Arbeit der Stadtplanung und der Infrastrukturüberwachung zu verdanken. Einer der vielen Aspekte der Infrastrukturüberwachung ist das Erkennen und Verwalten wichtiger Strukturen wie Lagertanks, Pipelines und Industrieanlagen. YOLO11 kann Stadtplanern bei der Analyse von Luftbildern helfen, um diese kritischen Komponenten schnell und genau zu erkennen. 

Die Erkennung von Objekten anhand von Boundingboxen ist hier besonders hilfreich, da sie die Erkennung von Objekten aus verschiedenen Blickwinkeln ermöglicht (was bei Luftbildern häufig der Fall ist). Präzision ist hier unerlässlich, um den Überblick über Industriegebiete zu behalten, Umweltauswirkungen zu verwalten und sicherzustellen, dass die Infrastruktur ordnungsgemäß gewartet wird. OBB macht den Erkennungsprozess zuverlässiger und hilft den Planern, fundierte Entscheidungen über das Wachstum, die Sicherheit und die Nachhaltigkeit der Stadt zu treffen. Die Verwendung von YOLO11 kann Planern helfen, die Infrastruktur zu überwachen und zu verwalten, die den reibungslosen Betrieb von Städten gewährleistet.

__wf_reserved_inherit
Abb. 2. Verwendung von YOLO11 zur Erkennung von Lagertanks in Luftaufnahmen.

Inspektion von Solarzellen mit Drohnen, YOLO11 und KI

Da erneuerbare Energien und Innovationen wie Solaranlagen immer beliebter werden, werden regelmäßige Inspektionen immer wichtiger. Solarmodule müssen überprüft werden, um sicherzustellen, dass sie effizient arbeiten. Im Laufe der Zeit können Risse, Schmutzablagerungen oder Ausrichtungsfehler ihre Leistung beeinträchtigen. Regelmäßige Inspektionen tragen dazu bei, diese Probleme frühzeitig zu erkennen, so dass Wartungsarbeiten durchgeführt werden können, um einen reibungslosen Betrieb zu gewährleisten.

So können beispielsweise Solarpaneele mit Drohnen, die mit Edge AI und YOLO11 integriert sind, auf Schäden untersucht werden. Die Analyse von Bildern am Rande bringt mehr Präzision und Effizienz in den Inspektionsprozess. Aufgrund der Bewegung und der Perspektive der Drohne kann das Überwachungsmaterial die Solarpaneele oft aus verschiedenen Blickwinkeln erfassen. In diesen Fällen kann die OBB-Erkennung von YOLO11 den Drohnen helfen, Solarpaneele genau zu identifizieren. 

YOLO11 kann Erkenntnisse für das Flottenmanagement liefern

In Häfen werden jede Woche Hunderte von Schiffen abgefertigt, und die Verwaltung einer so großen Flotte kann eine Herausforderung darstellen. Eine zusätzliche Schwierigkeit ergibt sich bei der Analyse von Schiffen in Luftbildern, denn die Schiffe erscheinen oft in unterschiedlichen Winkeln. Hier kommt die Unterstützung von YOLO11 für die OBB-Erkennung zum Tragen. 

Die OBB-Erkennung ermöglicht es dem Modell, Schiffe in verschiedenen Winkeln genauer zu erkennen als herkömmliche rechteckige Boxen. Durch den Einsatz von YOLO11 mit OBB können Schifffahrtsunternehmen den Standort und den Zustand ihrer Flotte leichter identifizieren und wichtige Details wie Flottenbewegungen und Lieferkettenlogistik verfolgen. Solche Vision-fähigen Lösungen helfen, Routen zu optimieren, Verspätungen zu reduzieren und das gesamte Flottenmanagement auf allen Schifffahrtsrouten zu verbessern.

__wf_reserved_inherit
Abb. 3. Verwendung von YOLO11 zur Erkennung von Schiffen und Häfen in einem bestimmten Winkel.

YOLO11 für KI-Entwickler: Erkennung von orientierten Bounding Boxes

Wenn Sie ein KI-Entwickler sind, der YOLO11 für die OBB-Erkennung nutzen möchte, gibt es zwei einfache Optionen für den Einstieg. Wenn Sie gerne mit Code arbeiten, ist das Ultralytics Python-Paket eine gute Wahl. Wenn Sie eine benutzerfreundliche Lösung ohne Code mit Cloud-Schulungsmöglichkeiten bevorzugen, ist Ultralytics HUB eine firmeneigene Plattform, die genau dafür entwickelt wurde. Weitere Einzelheiten finden Sie in unserem Leitfaden zur Schulung und zum Einsatz von Ultralytics YOLO11 mit Ultralytics HUB.

Nachdem wir nun Beispiele gesehen haben, wo die OBB-Unterstützung von YOLO11 eingesetzt werden kann, wollen wir das Ultralytics-Python-Paket erkunden und sehen, wie Sie damit Inferenzen durchführen und benutzerdefinierte Modelle trainieren können. 

Inferenzen mit YOLO11 durchführen

Um YOLO11 mit Python zu verwenden, müssen Sie zunächst das Ultralytics-Paket installieren. Je nach Ihren Präferenzen können Sie es mit pip, conda oder Docker installieren. Eine schrittweise Anleitung finden Sie in unserem Ultralytics-Installationshandbuch. Sollten Sie während der Installation auf Probleme stoßen, finden Sie in unserem Leitfaden für häufige Probleme hilfreiche Tipps zur Fehlerbehebung.

Sobald Sie das Ultralytics-Paket installiert haben, ist die Arbeit mit YOLO11 unglaublich einfach. Die Ausführung einer Schlussfolgerung bezieht sich auf den Prozess der Verwendung eines trainierten Modells, um Vorhersagen für neue Bilder zu treffen - wie die Erkennung von Objekten mit OBB in Echtzeit. Es unterscheidet sich vom Modelltraining, bei dem Sie dem Modell beibringen, neue Objekte zu erkennen oder seine Leistung bei bestimmten Aufgaben zu verbessern. Inferencing wird verwendet, wenn das Modell auf ungesehene Daten angewendet werden soll.

Das folgende Beispiel zeigt Ihnen, wie Sie ein Modell laden und es zur Vorhersage von orientierten Bounding Boxes auf einem Bild verwenden können. Ausführlichere Beispiele und Tipps für fortgeschrittene Anwender finden Sie in der offiziellen Ultralytics-Dokumentation, die bewährte Verfahren und weitere Anweisungen enthält.

__wf_reserved_inherit
Abb. 4. Ein Codeschnipsel, der die Durchführung von Inferenzen mit YOLO11 zeigt.

Training eines benutzerdefinierten YOLO11-Modells

Wenn Sie ein YOLO11-Modell trainieren, können Sie seine Leistung für bestimmte Datensätze und Aufgaben, wie z. B. die orientierte Bounding-Box-Objekterkennung, feinabstimmen. Während vortrainierte Modelle wie YOLO11 für die allgemeine Objekterkennung verwendet werden können, ist das Training eines benutzerdefinierten Modells unerlässlich, wenn Sie das Modell für die Erkennung einzigartiger Objekte oder zur Optimierung der Leistung in einem bestimmten Datensatz benötigen.

Im folgenden Codeschnipsel werden die Schritte zum Trainieren eines YOLO11-Modells für die OBB-Erkennung beschrieben. 

Zunächst wird das Modell mit vortrainierten YOLO11 OBB-spezifischen Gewichten initialisiert (yolo11n-obb.pt). Dann wird eine Trainingsfunktion verwendet, um das Modell auf einem benutzerdefinierten Datensatz zu trainieren, wobei Parameter wie die Konfigurationsdatei des Datensatzes, die Anzahl der Trainingszyklen, die Größe des Trainingsbildes und die Hardware, auf der das Training durchgeführt werden soll (z. B. CPU oder GPU), angegeben werden. Nach dem Training wird die Leistung des Modells validiert, um Metriken wie Genauigkeit und Verlust zu überprüfen. 

Mithilfe des trainierten Modells können Sie Inferenzen auf neue Bilder anwenden, um Objekte mit OBB zu erkennen und sie zu visualisieren. Außerdem kann das trainierte Modell mit der Exportfunktion in Formate wie ONNX konvertiert werden, um es einzusetzen.

__wf_reserved_inherit
Abb. 5. Ein Beispiel für das Training von YOLO11 für die OBB-Objekterkennung.

Der Weg in die Zukunft für YOLO11-KI-Verbesserungen

Ultralytics YOLO11 bringt die Objekterkennung mit seiner Unterstützung für orientierte Bounding Boxes auf die nächste Stufe. Da YOLO11 in der Lage ist, Objekte in unterschiedlichen Winkeln zu erkennen, kann es für verschiedene Anwendungen in unterschiedlichen Branchen eingesetzt werden. Es eignet sich beispielsweise perfekt für Branchen wie Stadtplanung, Energie und Schifffahrt, wo Präzision für Aufgaben wie die Inspektion von Solarpanels oder die Überwachung von Flotten entscheidend ist. Mit schnellerer Leistung und verbesserter Genauigkeit kann YOLO11 KI-Entwicklern helfen, reale Herausforderungen zu lösen. 

Mit der zunehmenden Verbreitung von KI und ihrer Integration in unser tägliches Leben werden Modelle wie YOLO11 die Zukunft von KI-Lösungen prägen.

Um mehr über das Potenzial von Vision AI zu erfahren, schließen Sie sich unserer wachsenden Community an und erkunden Sie unser GitHub-Repository. Wir treiben Innovationen voran, indem wir Bereiche wie das Gesundheitswesen und selbstfahrende Autos neu erfinden.

Lassen Sie uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise in die Zukunft des maschinellen Lernens

Kostenloser Start
Link in die Zwischenablage kopiert