Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024

So verwenden Sie Ultralytics YOLO11 für die OBB-Objekterkennung

Abirami Vina

5 Min. Lesezeit

8. Oktober 2024

Verstehen Sie, wie Ultralytics YOLO11 die Objekterkennung mithilfe von Oriented Bounding Boxes (OBB) verbessern kann und für welche Anwendungen diese Computer-Vision-Aufgabe ideal ist.

Ultralytics' jährliche Hybridveranstaltung, YOLO Vision 2024 (YV24), konzentrierte sich auf die Diskussion der neuesten Durchbrüche in KI und Computer Vision. Dies war die perfekte Gelegenheit, unser neuestes Modell, Ultralytics YOLO11, vorzustellen. Das Modell unterstützt die gleichen Computer-Vision-Aufgaben wie Ultralytics YOLOv8, wodurch der Wechsel zum neuen Modell für die Benutzer mühelos wird.

Angenommen, Sie verwenden YOLOv8 für die Objekterkennung mit orientierten Begrenzungsrahmen (OBB), um Objekte aus verschiedenen Winkeln zu erkennen. Sie können jetzt mit wenigen kleinen Änderungen an Ihrem Code zu YOLO11 wechseln und von den Verbesserungen von YOLO11 profitieren, die von erhöhter Genauigkeit und Effizienz bis hin zu Verarbeitungsgeschwindigkeit reichen. Falls Sie Modelle wie YOLO11 noch nicht verwendet haben, ist die OBB-Erkennung ein gutes Beispiel dafür, wie YOLO11 in einer Reihe von Branchen eingesetzt werden kann und praktische Lösungen bietet, die eine echte Wirkung erzielen.

In diesem Artikel werden wir uns ansehen, was OBB-Objekterkennung ist, wo sie angewendet werden kann und wie man YOLO11 zur Erkennung von OBB verwendet. Wir werden auch erläutern, wie die neuen Funktionen von YOLO11 diese Prozesse verbessern können und wie man Inferenz ausführt und benutzerdefinierte Modelle trainiert, um die OBB-Erkennungsfunktionen optimal zu nutzen.

Zu den YOLO11-Funktionen der nächsten Generation gehören Aufgaben wie die OBB-Objekterkennung

Die OBB-Objekterkennung geht einen Schritt über die traditionelle Objekterkennung hinaus, indem sie Objekte in verschiedenen Winkeln erkennt. Im Gegensatz zu regulären Begrenzungsrahmen, die an den Achsen des Bildes ausgerichtet bleiben, drehen sich OBBs, um sich an der Ausrichtung des Objekts auszurichten. Die OBB-Objekterkennung kann zur Analyse von Luft- oder Satellitenbildern verwendet werden, bei denen Objekte nicht immer gerade sind. In Branchen wie Stadtplanung, Energie und Transport kann die Fähigkeit, abgewinkelte Objekte wie Gebäude, Fahrzeuge oder Infrastruktur genau zu erkennen, die Grundlage für Computer Vision-Anwendungen mit konkreten Vorteilen bilden. 

__wf_reserved_inherit
Abb. 1. Vergleich von normalen Bounding Boxes und orientierten Bounding Boxes.

YOLO11 unterstützt die OBB-Erkennung und wurde auf dem DOTA v1.0-Datensatz trainiert, um Objekte wie Flugzeuge, Schiffe und Lagertanks aus verschiedenen Perspektiven zu erkennen. YOLO11 ist in verschiedenen Modellvarianten erhältlich, um unterschiedlichen Anforderungen gerecht zu werden, darunter YOLO11n-obb (Nano), YOLO11s-obb (Small), YOLO11m-obb (Medium), YOLO11l-obb (Large) und YOLO11x-obb (Extra Large). Jedes Modell bietet eine andere Größe mit unterschiedlichen Geschwindigkeits-, Genauigkeits- und Rechenleistungsstufen. Benutzer können das Modell auswählen, das das richtige Gleichgewicht zwischen Geschwindigkeit und Genauigkeit für ihre Anwendung bietet. 

YOLO11 Anwendungsfälle, die einen neuen Blickwinkel auf die Erkennung eröffnen

Die Objekterkennungsfunktionen von YOLO11, insbesondere die Unterstützung für orientierte Begrenzungsrahmen (oriented bounding boxes, OBB), bringen mehr Präzision in verschiedene Branchen. Als Nächstes werfen wir einen Blick auf einige Beispiele, wie YOLO11 und OBB-Erkennung in realen Situationen eingesetzt werden können, um Prozesse in verschiedenen Bereichen effizienter, genauer und einfacher zu verwalten.

Stadtplanung und Infrastrukturüberwachung mit YOLO11

Wenn Sie jemals das Design und die Anordnung einer Stadt bewundert haben, ist dies der detaillierten Arbeit der Stadtplanung und der Infrastrukturüberwachung zu verdanken. Einer der vielen Aspekte der Infrastrukturüberwachung ist die Identifizierung und Verwaltung wichtiger Strukturen wie Lagertanks, Pipelines und Industriestandorte. YOLO11 kann Stadtplanern helfen, Luftaufnahmen zu analysieren, um diese kritischen Komponenten schnell und genau zu erkennen. 

Die Objekterkennung mit ausgerichteten Begrenzungsrahmen ist hier besonders hilfreich, da sie die Erkennung von Objekten ermöglicht, die aus verschiedenen Winkeln betrachtet werden (was bei Luftaufnahmen oft der Fall ist). Präzision ist hier von entscheidender Bedeutung, um Industriegebiete im Auge zu behalten, Umweltauswirkungen zu bewältigen und sicherzustellen, dass die Infrastruktur ordnungsgemäß gewartet wird. OBB macht den Erkennungsprozess zuverlässiger und hilft Planern, fundierte Entscheidungen über das Wachstum, die Sicherheit und die Nachhaltigkeit der Stadt zu treffen. Die Verwendung von YOLO11 kann Planern helfen, die Infrastruktur, die den reibungslosen Betrieb von Städten gewährleistet, zu überwachen und zu verwalten.

__wf_reserved_inherit
Abb. 2. Verwendung von YOLO11 zur Erkennung von Lagertanks in Luftaufnahmen.

Inspektion von Solarmodulen mit Drohnen, YOLO11 und Edge AI

Da erneuerbare Energien und Innovationen wie Solarparks immer beliebter werden, werden regelmäßige Inspektionen immer wichtiger. Solarmodule müssen überprüft werden, um sicherzustellen, dass sie effizient arbeiten. Im Laufe der Zeit können Dinge wie Risse, Schmutzablagerungen oder Fehlausrichtungen ihre Leistung mindern. Routineinspektionen helfen, diese Probleme frühzeitig zu erkennen, so dass Wartungsarbeiten durchgeführt werden können, um einen reibungslosen Betrieb zu gewährleisten.

Beispielsweise können Solarmodule mithilfe von Drohnen, die mit Edge-KI integriert sind und YOLO11 auf Schäden untersucht werden. Die Analyse von Bildern auf der Edge bringt mehr Präzision und Effizienz in den Inspektionsprozess. Aufgrund der Bewegung und Perspektive der Drohne kann das Überwachungsmaterial Solarmodule oft aus verschiedenen Winkeln erfassen. In diesen Fällen kann die OBB-Erkennung von YOLO11 Drohnen helfen, Solarmodule genau zu identifizieren. 

YOLO11 kann Einblicke für das Flottenmanagement liefern

Häfen wickeln jede Woche Hunderte von Schiffen ab, und die Verwaltung einer so großen Flotte kann eine Herausforderung darstellen. Eine zusätzliche Schwierigkeit entsteht bei der Analyse von Schiffen in Luftaufnahmen; die Schiffe erscheinen oft in unterschiedlichen Winkeln. Hier kommt die Unterstützung von YOLO11 für die OBB-Erkennung ins Spiel. 

Die OBB-Erkennung ermöglicht es dem Modell, Schiffe in verschiedenen Winkeln genauer zu erkennen als mit herkömmlichen rechteckigen Begrenzungsrahmen. Durch die Verwendung von YOLO11 mit OBB können Schifffahrtsunternehmen den Standort und den Zustand ihrer Flotte leichter identifizieren und wichtige Details wie Flottenbewegungen und Logistik der Lieferkette verfolgen. Solche visionsgestützten Lösungen tragen dazu bei, Routen zu optimieren, Verzögerungen zu reduzieren und das gesamte Flottenmanagement auf den Schifffahrtsrouten zu verbessern.

__wf_reserved_inherit
Abb. 3. Verwendung von YOLO11 zur Erkennung von Schiffen und Häfen in einem bestimmten Winkel.

YOLO11 für KI-Entwickler: Erkennung von orientierten Bounding Boxes

Wenn Sie als KI-Entwickler YOLO11 für die OBB-Erkennung (Oriented Bounding Box) nutzen möchten, gibt es zwei einfache Möglichkeiten, um zu beginnen. Wenn Sie sich mit der Arbeit mit Code wohlfühlen, ist das Ultralytics Python-Paket eine ausgezeichnete Wahl. Wenn Sie eine benutzerfreundliche No-Code-Lösung mit Cloud-Trainingsfunktionen bevorzugen, ist Ultralytics HUB eine interne Plattform, die genau dafür entwickelt wurde. Weitere Informationen finden Sie in unserem Leitfaden zum Trainieren und Bereitstellen von Ultralytics YOLO11 mit Ultralytics HUB.

Nachdem wir nun Beispiele dafür gesehen haben, wo die OBB-Unterstützung von YOLO11 angewendet werden kann, wollen wir das Ultralytics Python-Paket untersuchen und sehen, wie Sie damit Inferenzläufe durchführen und benutzerdefinierte Modelle trainieren können. 

Inferenzläufe mit YOLO11 durchführen

Um YOLO11 mit Python zu verwenden, müssen Sie zunächst das Ultralytics-Paket installieren. Je nach Ihren Vorlieben können Sie es mit pip, conda oder Docker installieren. Eine Schritt-für-Schritt-Anleitung finden Sie in unserem Ultralytics Installationshandbuch. Wenn Sie während der Installation auf Schwierigkeiten stoßen, bietet unser Leitfaden zu häufigen Problemen hilfreiche Tipps zur Fehlerbehebung.

Sobald Sie das Ultralytics-Paket installiert haben, ist die Arbeit mit YOLO11 unglaublich einfach. Das Durchführen einer Inferenz bezieht sich auf den Prozess der Verwendung eines trainierten Modells, um Vorhersagen über neue Bilder zu treffen - wie z. B. das Erkennen von Objekten mit OBB in Echtzeit. Es unterscheidet sich vom Modelltraining, bei dem Sie dem Modell beibringen, neue Objekte zu erkennen oder seine Leistung bei bestimmten Aufgaben zu verbessern. Inferencing wird verwendet, wenn Sie das Modell auf ungesehene Daten anwenden möchten.

Das folgende Beispiel führt Sie durch das Laden eines Modells und dessen Verwendung zur Vorhersage von orientierten Begrenzungsrahmen in einem Bild. Für detailliertere Beispiele und erweiterte Anwendungstipps sollten Sie die offizielle Ultralytics-Dokumentation für Best Practices und weitere Anweisungen konsultieren.

__wf_reserved_inherit
Abb. 4. Ein Code-Snippet, das die Ausführung von Inferenz mit YOLO11 demonstriert.

Training eines benutzerdefinierten YOLO11-Modells

Das Training eines YOLO11-Modells bedeutet, dass Sie seine Leistung auf bestimmten Datensätzen und Aufgaben feinabstimmen können, wie z. B. die Objekterkennung mit orientierten Begrenzungsrahmen. Während vortrainierte Modelle wie YOLO11 für die allgemeine Objekterkennung verwendet werden können, ist das Training eines benutzerdefinierten Modells unerlässlich, wenn das Modell eindeutige Objekte erkennen oder die Leistung auf einem bestimmten Datensatz optimieren soll.

Im folgenden Code-Snippet werden die Schritte zum Trainieren eines YOLO11-Modells für die OBB-Erkennung behandelt. 

Zuerst wird das Modell mit vortrainierten YOLO11 OBB-spezifischen Gewichten (yolo11n-obb.pt) initialisiert. Dann wird eine Trainingsfunktion verwendet, um das Modell auf einem benutzerdefinierten Datensatz zu trainieren, mit Parametern wie der Datensatzkonfigurationsdatei, der Anzahl der Trainingszyklen, der Trainingsbildgröße und der Hardware, auf der das Training ausgeführt werden soll (z. B. CPU oder GPU). Nach dem Training wird die Leistung des Modells validiert, um Metriken wie Genauigkeit und Verlust zu überprüfen. 

Mit dem trainierten Modell können Sie Inferenz auf neuen Bildern ausführen, um Objekte mit OBB zu erkennen und zu visualisieren. Außerdem kann das trainierte Modell mit der Exportfunktion in Formate wie ONNX für die Bereitstellung konvertiert werden.

__wf_reserved_inherit
Abb. 5. Ein Beispiel für das Training von YOLO11 zur OBB-Objekterkennung.

Der Weg nach vorn für YOLO11 KI-Fortschritte

Ultralytics YOLO11 hebt die Objekterkennung mit seiner Unterstützung für orientierte Begrenzungsrahmen auf die nächste Stufe. Durch die Möglichkeit, Objekte in verschiedenen Winkeln zu erkennen, kann YOLO11 für verschiedene Anwendungen in unterschiedlichen Branchen eingesetzt werden. Es eignet sich beispielsweise perfekt für Branchen wie Stadtplanung, Energie und Schifffahrt, wo Präzision für Aufgaben wie die Inspektion von Solarmodulen oder die Überwachung von Flotten entscheidend ist. Mit schnellerer Leistung und verbesserter Genauigkeit kann YOLO11 KI-Entwicklern helfen, reale Herausforderungen zu lösen. 

Da KI immer breiter eingesetzt und in unser tägliches Leben integriert wird, werden Modelle wie YOLO11 die Zukunft von KI-Lösungen gestalten.

Um mehr über das Potenzial von Vision AI zu erfahren, treten Sie unserer wachsenden Community bei und erkunden Sie unser GitHub-Repository. Wir treiben Innovationen voran, indem wir Sektoren wie das Gesundheitswesen bis hin zu selbstfahrenden Autos neu erfinden.

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens

Kostenlos starten
Link in die Zwischenablage kopiert