Was ist die Erkennung mit orientierten Begrenzungsrahmen (OBB)?
Erfahre, wie die Erkennung mit orientierten Begrenzungsrahmen (OBB) die Objekterkennung verbessert, indem sie gedrehte Objekte in Bildern für reale Anwendungen präzise identifiziert.

Objekte zu erkennen, egal wie sie angeordnet sind oder in welche Richtung sie weisen, fällt uns als Menschen ganz natürlich. Ob Autos an einer Kreuzung oder Boote in einem Hafen – wir können leicht erkennen, was es ist und in welche Richtung es zeigt. Für Künstliche Intelligenz (KI)-Systeme ist das jedoch nicht so einfach.
Zum Beispiel ermöglicht Computer Vision, ein Teilbereich der KI, der sich auf das Verständnis von Bildern und Videos konzentriert, Aufgaben wie Objekterkennung, die Maschinen dabei hilft, Objekte in einer Szene zu identifizieren und zu lokalisieren. Herkömmliche Objekterkennung verlässt sich auf achsenparallele Bounding Boxes, um Kästchen um Objekte zu zeichnen. Diese Boxen haben gerade Seiten und feste rechte Winkel. Dieser Ansatz funktioniert gut, wenn Objekte aufrecht stehen und nicht zu nah beieinander liegen.
Aber wenn Objekte geneigt, rotiert oder eng beieinander sind, hat die herkömmliche Objekterkennung oft Schwierigkeiten, sie präzise zu erfassen. Um diese komplexeren Situationen zu bewältigen, wurden Techniken wie die Oriented Bounding Box (OBB) Detection eingeführt. Im Gegensatz zu Standard-Bounding-Boxes können sich OBBs drehen, um sich dem Winkel und der Form des Objekts anzupassen, was eine engere und genauere Passform ermöglicht.
Computer-Vision-Modelle wie Ultralytics YOLO11, die OBB-Detection unterstützen, ermöglichen eine Reihe von Echtzeitanwendungen, insbesondere in Szenarien, in denen die Objektausrichtung wichtig ist, wie etwa bei der Luftüberwachung. Darüber hinaus wird OBB-Detection auch im Gesundheitswesen, in der Landwirtschaft und bei der Dokumentenanalyse eingesetzt.
In diesem Artikel untersuchen wir, was OBB-Detection ist, wie sie funktioniert und wo sie in realen Szenarien angewendet wird. Fangen wir an!

Abb. 1. Eine Beispiel-Demo zur Verwendung von YOLO11 für die OBB-Detection von Booten.
Link to this sectionWas ist eine Oriented Bounding Box?#
Eine orientierte Bounding Box ist eine Art rechteckige Box, die in der Computer Vision verwendet wird, um erkannte Objekte in einem Bild darzustellen. Während Standard-Bounding-Boxes an den horizontalen und vertikalen Achsen des Bildes ausgerichtet sind, können sich OBBs drehen, um sich dem tatsächlichen Winkel des Objekts anzupassen.
Diese Fähigkeit zur Rotation bringt mehrere Vorteile mit sich. OBBs können sich enger an der Ausrichtung eines Objekts orientieren, wodurch die Box passgenau um Form und Richtung des Objekts liegt. Das Ergebnis ist eine genauere und präzisere Erkennung.
OBBs sind besonders nützlich, wenn Objekte nicht perfekt aufrecht stehen, wie etwa ein Auto, das in einer Kurve in einer Luftaufnahme fährt, ein schräg liegendes Buch auf einem Schreibtisch oder ein rotierter Tumor in einem medizinischen Scan. Durch die genauere Anpassung an den Winkel eines Objekts verbessern OBBs die Erkennungsleistung, reduzieren Hintergrundstörungen und eignen sich besonders gut für Anwendungen, bei denen die Ausrichtung eines Objekts genauso wichtig ist wie seine Position.

Abb. 2. Vergleich von Objekterkennung und OBB-Detection.
Link to this sectionOBB-Detection vs. Objekterkennung#
OBB-Detection und herkömmliche Objekterkennung mögen auf den ersten Blick ähnlich aussehen, werden jedoch unterschiedlich eingesetzt und für verschiedene Situationen verwendet. Schauen wir uns an einem Beispiel genauer an, wie sie sich vergleichen lassen.
Computer-Vision-Modelle, wie YOLO11, können darauf trainiert werden, Objekte in verschiedenen realen Anwendungen, wie etwa der industriellen Inspektion, zu erkennen und zu klassifizieren. Man denke an eine Fließbandfertigung in einer Fabrik, bei der verschiedene Maschinenteile auf einem Förderband bewegt werden. Einige Teile liegen vielleicht ordentlich platziert, aber andere können durch Vibrationen oder Geschwindigkeit leicht gedreht, geneigt oder überlappend sein.
Herkömmliche Objekterkennung verwendet aufrechte, rechteckige Boxen, die sich an den horizontalen und vertikalen Kanten des Bildes ausrichten. Wenn ein Teil also gedreht ist, passt die Box möglicherweise nicht richtig – sie könnte einen Teil des Objekts ausschließen oder zu viel Hintergrund enthalten. Dies kann die Erkennungen weniger genau machen und es dem System erschweren, das Teil sicher zu identifizieren.
Nehmen wir nun an, du verwendest stattdessen OBB-Detection. In diesem Fall kann das Modell eine Box zeichnen, die sich dreht, um dem exakten Winkel jedes Teils zu entsprechen. Ein geneigtes Zahnrad oder eine schräge Komponente wird eng von einer Box umschlossen, die ihrer Form und Richtung entspricht. Das bedeutet bessere Präzision, weniger Fehler und zuverlässigere Ergebnisse, insbesondere bei Anwendungsfällen wie automatisierter Qualitätskontrolle oder robotergestützter Sortierung.
Link to this sectionBeliebte OBB-Detection-Modelle#
Nachdem wir nun ein besseres Verständnis davon haben, was OBB-Detection ist, werfen wir einen Blick auf einige der am häufigsten verwendeten Vision-KI-Modelle, die sie unterstützen.
Mehrere fortschrittliche Computer-Vision-Modelle wurden speziell für die Erkennung rotierter oder geneigter Objekte entwickelt. Unter ihnen sind die Ultralytics YOLO-Modelle besonders bekannt für ihre zuverlässigen und effizienten OBB-Detection-Fähigkeiten.
Frühere Versionen wie Ultralytics YOLOv5 wurden für die Standard-Objekterkennung entwickelt. Spätere Iterationen, wie Ultralytics YOLOv8 und das neuere YOLO11, führten eine native Unterstützung für OBB-Detection ein. Insbesondere YOLO11 bietet modernste Genauigkeit, ohne die Geschwindigkeit zu beeinträchtigen, was es zu einer wirkungsvollen Option für Echtzeitanwendungen macht.
Vortrainierte YOLO11 OBB-Modelle, wie YOLO11n-obb, werden auf Datensätzen wie DOTAv1 trainiert, der aus Luftbildern besteht, die mit einer Reihe von Objektklassen wie Flugzeugen, Schiffen und Tennisplätzen annotiert sind, die in verschiedenen Winkeln und Ausrichtungen erscheinen.
Außerdem sind diese Modelle in fünf verschiedenen Größen erhältlich, von Nano (n-obb) bis Extra-Large (x-obb), um unterschiedliche Leistungsanforderungen zu erfüllen. Diese Vielseitigkeit ermöglicht ihren Einsatz in verschiedenen Branchen – von der Überwachung städtischer Infrastruktur und der Inspektion von Maschinen bis hin zum Lesen von schrägem Text in gescannten Dokumenten.
Link to this sectionBenutzerdefiniertes Training von YOLO11 für Oriented Bounding Box Detection#
In vielen realen Situationen können sich die Objekte, die du erkennen musst, völlig von denen in Standard-Trainingsdatensätzen unterscheiden. Zum Beispiel könnten Objekte wie Werkzeuge an einer Produktionslinie, Produktverpackungen oder Komponenten auf einer Leiterplatte gedreht, unregelmäßig platziert oder anders geformt sein.
Um diese benutzerdefinierten Objekte genau zu erkennen, insbesondere wenn die Ausrichtung wichtig ist, ist es wichtig, Modelle wie YOLO11 unter Verwendung deiner eigenen Bilder und Labels zu trainieren. Dieser Prozess wird als benutzerdefiniertes Training bezeichnet.
Hier ist ein genauerer Blick auf den schrittweisen Prozess zum Training von YOLO11 für OBB-Detection:
- Bildersammlung: Sammle Bilder, die deine Zielobjekte aus verschiedenen Winkeln, Positionen und in realen Umgebungen zeigen.
- Objektannotation: Beschrifte jedes Objekt mit rotierten Bounding Boxes (OBBs), um sowohl ihren Standort als auch ihre Ausrichtung mit Annotationswerkzeugen mit OBB-Unterstützung zu erfassen.
- Datensatzvorbereitung: Organisiere deine Bilder und Labels in der YOLO-Verzeichnisstruktur und erstelle eine YAML-Konfigurationsdatei mit deinen Klassennamen und Datensatzpfaden.
- Modelltraining: Wähle eine Version des YOLO11-Modells, die deinen Anforderungen entspricht, und führe den Trainingsprozess aus, damit das Modell von deinen beschrifteten Bildern lernen kann.
- Evaluierung und Bereitstellung: Teste dein trainiertes Modell an neuen Bildern, bewerte seine Genauigkeit und setze es in praktischen Anwendungen wie Fertigung, Luftüberwachung oder Dokumentenanalyse ein.
Link to this sectionDurch OBB-Detection ermöglichte Anwendungen#
Objekte, die nicht mittig oder geneigt sind, kommen in realen Szenarien häufig vor. Gehen wir einige Beispiele durch, bei denen OBB-Detection einen echten Unterschied macht, indem sie diese Objekte präzise erkennt.
Link to this sectionRöntgenbildanalyse mittels OBB-Detection#
OBB-Detection kann die medizinische Bildanalyse durch eine verbesserte Präzision einen Schritt weiter bringen. Medizinische Bilder enthalten oft anatomische Strukturen wie Tumore, Organe oder Knochen. Diese Strukturen treten häufig in unregelmäßigen Formen und unterschiedlichen Ausrichtungen auf. Da OBBs sich drehen können, um sich dem Winkel eines Objekts anzupassen, bieten sie eine genauere Lokalisierung und Messung, was für Diagnose und Behandlungsplanung entscheidend ist.
Dieser Ansatz ist besonders effektiv bei der Analyse von Röntgenbildern von Knochenbrüchen, bei denen die Position und Ausrichtung der Knochen Schlüsselfaktoren sind. Zum Beispiel wurde OBB-Detection verwendet, um Röntgenbilder von Ellenbogen bei Kindern zu analysieren. Durch die Anpassung an die Ausrichtung der Knochen konnte die Erkennungsgenauigkeit verbessert werden.

Abb. 3. Röntgenbilder (a, d) mit Objekterkennung (b, e) und Oriented Bounding Box Detection (c, f).
Link to this sectionLuftüberwachung durch OBB-Detection#
Luftüberwachung ist ein unverzichtbares Werkzeug in Sektoren wie öffentliche Sicherheit, Umweltüberwachung und Stadtplanung. Von Drohnen oder Satelliten aufgenommene Bilder können helfen, Objekte wie Schiffe, Fahrzeuge und Gebäude zu identifizieren. In diesen Bildern erscheinen Objekte jedoch oft klein und in ungewöhnlichen Winkeln, was ihre genaue Erkennung erschwert.
OBB-Detection löst dies, indem die Bounding Boxes geneigt werden, um dem Winkel jedes Objekts zu entsprechen. Dies führt zu genaueren Messungen der Größe und Ausrichtung eines Objekts und unterstützt eine bessere Entscheidungsfindung in Bereichen wie Stadtplanung, Verteidigung, Katastrophenhilfe und Umweltüberwachung.
Ein interessantes Beispiel für OBB-Detection ist die Schiffsverfolgung in der maritimen Überwachung. Satellitenbilder erfassen Schiffe oft in unterschiedlichen Winkeln und Größen aufgrund von Wetter, Beleuchtung oder Bewegung. OBBs können sich an diese Änderungen anpassen und die Erkennung verbessern, insbesondere bei kleineren oder teilweise verdeckten Schiffen.

Abb. 4. Ein Einblick in die Verwendung von OBB-Detection zur maritimen Überwachung.
Link to this sectionVerwendung von OBB-Detection in der Landwirtschaft#
Das Sortieren von Erntegut nach der Ernte ist ein entscheidender Schritt, um Qualität sicherzustellen, bevor es verpackt und auf den Markt gebracht wird. Während viele Systeme für rundes Obst wie Äpfel und Orangen gut funktionieren, können lange und schmale Feldfrüchte wie Karotten oder Zizania-Sprossen viel schwieriger zu handhaben sein. Ihre Formen variieren, und sie liegen oft in verschiedenen Winkeln, was ihre genaue Erkennung und Sortierung erschwert.
Um dies anzugehen, haben Forscher ein System entwickelt, das Oriented Bounding Box (OBB) Detection verwendet, um diese Feldfrüchte zu klassifizieren und genauer zu sortieren. Das System kann mehrere Feldfrüchte in einem Bild erkennen, selbst wenn sie geneigt oder überlappend sind, und ihre Qualität und Position in Echtzeit beurteilen.
Link to this sectionVor- und Nachteile der OBB-Detection#
Hier sind einige der Vorteile der Verwendung von OBB-Detection:
- Verbesserter Input für nachgelagerte Aufgaben: Computer-Vision-Aufgaben wie Instanzsegmentierung und Objektverfolgung können besser funktionieren, wenn sie genauere Objekterkennungen erhalten.
- Verbessertes räumliches Denken: Durch die Erfassung des Orientierungswinkels machen OBBs es möglich, die Ausrichtung und Richtung eines Objekts zu verstehen.
- Reduzierte Überlappung in überfüllten Szenen: OBBs reduzieren Mehrdeutigkeit, indem sie Objekte enger umschließen, selbst in belebten oder überladenen Szenen.
Obwohl OBB-Detection hilft, die Erkennungsgenauigkeit in komplexen Szenen zu verbessern, gibt es einige Einschränkungen zu berücksichtigen:
- Größere Empfindlichkeit gegenüber Rauschen: Kleine Fehler bei der Vorhersage des Winkels können einen größeren Einfluss auf die Erkennungsgenauigkeit haben, insbesondere bei eng gepackten oder länglichen Objekten.
- Spezialisierte Werkzeuge erforderlich: Da nicht alle Annotations- und Trainingsplattformen OBBs nativ unterstützen, kann die Arbeit mit ihnen zusätzliche Werkzeuge oder Konfigurationen erfordern.
- Begrenzte Verfügbarkeit von Datensätzen: Im Vergleich zur Standard-Objekterkennung gibt es derzeit weniger öffentlich verfügbare Datensätze mit OBB-Annotationen, was es etwas schwieriger machen kann, zu starten oder Ergebnisse zu vergleichen.
Link to this sectionWichtige Erkenntnisse#
Oriented Bounding Box Detection macht es Computer-Vision-Lösungen einfacher, Objekte zu erkennen, die nicht perfekt gerade oder ausgerichtet sind. Durch die Erfassung sowohl der Position als auch der Ausrichtung von Objekten steigert OBB-Detection die Genauigkeit bei realen Anwendungsfällen wie dem Scannen medizinischer Bilder, der Überwachung von Ackerland oder der Analyse von Satellitenfotos.
Da Modelle wie YOLO11 OBB-Detection zugänglicher machen, wird es zu einer praktischen Wahl für viele Branchen. Egal, ob du es mit geneigten, überlappenden oder seltsam geformten Objekten zu tun hast, OBB-Detection fügt eine zusätzliche Ebene der Präzision hinzu, die Standardmethoden oft vermissen lassen.
Neugierig auf KI? Erkunde unser GitHub-Repository, verbinde dich mit unserer Community und sieh dir unsere Lizenzoptionen an, um dein Computer-Vision-Projekt zu starten. Erfahre mehr über Innovationen wie KI im Einzelhandel und Computer Vision in der Logistik auf unseren Lösungsseiten.






