Was ist die Erkennung von orientierten Begrenzungsrahmen (OBB)?

Objekte zu erkennen, unabhängig davon, wie sie angeordnet sind oder in welche Richtung sie zeigen, ist für uns Menschen ganz natürlich. Ob es sich um Autos an einer Kreuzung oder Boote in einem Hafen handelt, wir können leicht erkennen, was sie sind und in welche Richtung sie zeigen. Für Systeme der künstlichen Intelligenz (KI) ist das jedoch nicht so einfach.

Zum Beispiel ermöglicht Computer Vision, ein Zweig der KI, der sich auf das Verständnis von Bildern und Videos konzentriert, Aufgaben wie die Objekterkennung, die Maschinen hilft, Objekte innerhalb einer Szene zu identifizieren und zu lokalisieren. Die traditionelle Objekterkennung verwendet achsenparallele Bounding Boxes, um Objekte zu umrahmen. Diese Boxen haben gerade Seiten und feste rechte Winkel. Dieser Ansatz funktioniert gut, wenn Objekte aufrecht stehen und nicht zu nahe beieinander liegen.

Wenn Objekte jedoch geneigt, gedreht oder nahe beieinander liegen, hat die traditionelle Objekterkennung oft Schwierigkeiten, sie genau zu erfassen. Um diese komplexeren Situationen zu bewältigen, wurden Techniken wie die Oriented Bounding Box (OBB)-Erkennung eingeführt. Im Gegensatz zu Standard-Bounding-Boxes können OBBs gedreht werden, um sich an den Winkel und die Form des Objekts anzupassen, was eine engere und genauere Anpassung ermöglicht.

Computer-Vision-Modelle wie Ultralytics YOLO11die die OBB-Erkennung unterstützen, ermöglichen eine Reihe von Echtzeitanwendungen, insbesondere in Szenarien, in denen die Objektorientierung eine Rolle spielt, wie z. B. bei der Überwachung aus der Luft. Darüber hinaus wird die OBB-Erkennung auch im Gesundheitswesen, in der Landwirtschaft und bei der Dokumentenanalyse eingesetzt.

In diesem Artikel werden wir untersuchen, was OBB-Erkennung ist, wie sie funktioniert und wo sie in realen Szenarien eingesetzt wird. Los geht's!

__wf_reserved_inherit — Abb. 1. Ein Beispiel für die Verwendung von YOLO11 für die OBB-Erkennung von Booten.

‍

Was ist eine Oriented Bounding Box?

Eine orientierte Bounding Box ist eine Art rechteckige Box, die in der Computer Vision verwendet wird, um erkannte Objekte in einem Bild darzustellen. Während Standard-Bounding-Boxes an der horizontalen und vertikalen Achse des Bildes ausgerichtet sind, können OBBs gedreht werden, um sich an den tatsächlichen Winkel des Objekts anzupassen.

Diese Drehfähigkeit bringt mehrere Vorteile mit sich. OBBs können sich enger an der Ausrichtung eines Objekts ausrichten, sodass die Box eng um die Form und Richtung des Objekts passt. Dadurch wird die Erkennung genauer und präziser.

OBBs sind besonders nützlich, wenn Objekte nicht perfekt aufrecht stehen, wie z. B. ein Auto, das in Luftaufnahmen auf einer kurvigen Straße abbiegt, ein geneigtes Buch auf einem Schreibtisch oder ein gedrehter Tumor in einem medizinischen Scan. Durch die genauere Anpassung an den Winkel eines Objekts verbessern OBBs die Erkennungsleistung, reduzieren Hintergrundstörungen und eignen sich besonders gut für Anwendungen, bei denen die Ausrichtung eines Objekts genauso wichtig ist wie seine Position.

‍

OBB-Erkennung vs. Objekterkennung

OBB-Erkennung und traditionelle Objekterkennung sehen auf den ersten Blick ähnlich aus, werden aber unterschiedlich und für unterschiedliche Situationen eingesetzt. Sehen wir uns anhand eines Beispiels genauer an, wie sie sich unterscheiden.

Computer-Vision-Modelle wie YOLO11 können trainiert werden, um Objekte in verschiedenen realen Anwendungen detect und zu classify , z. B. in der industriellen Inspektion. Stellen Sie sich ein Fließband in einer Fabrik vor, auf dem sich verschiedene Maschinenteile entlang eines Förderbands bewegen. Einige Teile könnten sauber platziert sein, aber andere könnten aufgrund von Vibrationen oder Geschwindigkeit leicht gedreht oder gekippt sein oder sich überlappen.

Die traditionelle Objekterkennung verwendet aufrechte, rechteckige Boxen, die an den horizontalen und vertikalen Kanten des Bildes ausgerichtet sind. Wenn also ein Teil gedreht wird, passt die Box möglicherweise nicht richtig - sie könnte einen Teil des Objekts auslassen oder zu viel vom Hintergrund einschließen. Dies kann die Erkennung weniger genau machen und es dem System erschweren, das Teil zuverlässig zu identifizieren.

Nehmen wir nun an, Sie verwenden stattdessen die OBB-Erkennung. In diesem Fall kann das Modell eine Box zeichnen, die sich dreht, um genau dem Winkel jedes Teils zu entsprechen. Ein geneigtes Zahnrad oder eine abgewinkelte Komponente wird von einer Box umschlossen, die zu ihrer Form und Richtung passt. Dies bedeutet eine bessere Präzision, weniger Fehler und zuverlässigere Ergebnisse, insbesondere in Bezug auf Anwendungsfälle wie die automatisierte Qualitätskontrolle oder die Robotersortierung.

Beliebte OBB-Erkennungsmodelle

Nachdem wir nun ein besseres Verständnis davon haben, was OBB-Erkennung ist, werfen wir einen Blick auf einige der am weitesten verbreiteten Vision-KI-Modelle, die sie unterstützen.

Mehrere fortschrittliche Computer-Vision-Modelle wurden speziell für die Erkennung gedrehter oder gekippter Objekte entwickelt. Unter ihnen sind die Ultralytics YOLO besonders bekannt für ihre zuverlässigen und effizienten OBB-Erkennungsfunktionen.

Frühere Versionen wie Ultralytics YOLOv5 waren für die Erkennung von Standardobjekten konzipiert. Spätere Iterationen wie Ultralytics YOLOv8 und das neuere YOLO11, boten native Unterstützung für die OBB-Erkennung. Insbesondere YOLO11 bietet eine hochmoderne Genauigkeit ohne Geschwindigkeitseinbußen, was es zu einer wirkungsvollen Option für Echtzeitanwendungen macht.

Vortrainierte YOLO11 OBB-Modelle wie obb werden auf Datensätzen wie DOTAv1 trainiert, die aus Luftbildern bestehen, die mit einer Reihe von Objektklassen wie Flugzeugen, Schiffen und Tennisplätzen versehen sind, die in verschiedenen Winkeln und Ausrichtungen erscheinen.

Außerdem sind diese Modelle in fünf verschiedenen Größen erhältlich, von nano (obb) bis extra-large (obb), um unterschiedlichen Leistungsanforderungen gerecht zu werden. Dank dieser Vielseitigkeit können sie in verschiedenen Branchen eingesetzt werden - von der Überwachung der städtischen Infrastruktur über die Inspektion von Maschinen bis hin zum Lesen von schiefem Text in gescannten Dokumenten.

Benutzerdefiniertes Training YOLO11 für orientierte Bounding-Box-Erkennung

In vielen realen Situationen können sich die zu detect Objekte völlig von denen in Standard-Trainingsdatensätzen unterscheiden. Beispielsweise können Objekte wie Werkzeuge an einer Fertigungsstraße, Produktverpackungen oder Komponenten auf einer Leiterplatte gedreht, unregelmäßig angeordnet oder anders geformt sein.

Um diese benutzerdefinierten Objekte genau zu detect , insbesondere wenn die Ausrichtung eine Rolle spielt, ist es wichtig, Modelle wie YOLO11 anhand Ihrer eigenen Bilder und Beschriftungen zu trainieren. Dieser Prozess wird als benutzerdefiniertes Training bezeichnet.

Hier ist ein genauerer Blick auf den Schritt-für-Schritt-Prozess für das Training von YOLO11 für die OBB-Erkennung:

Bildersammlung: Sammeln Sie Bilder, die Ihre Zielobjekte aus verschiedenen Winkeln, Positionen und realen Umgebungen zeigen.
‍
Objektannotation: Beschriften Sie jedes Objekt mit rotierten Begrenzungsrahmen (OBBs), um sowohl seinen Standort als auch seine Ausrichtung mithilfe von Annotationstools mit OBB-Unterstützung zu erfassen.
‍
Vorbereitung der Datensätze: Organisieren Sie Ihre Bilder und Etiketten in der YOLO und erstellen Sie eine YAML-Konfigurationsdatei mit Ihren Klassennamen und Datensatzpfaden.
‍
Modell-Training: Wählen Sie eine Version des YOLO11 , die Ihren Anforderungen entspricht, und führen Sie den Trainingsprozess durch, damit das Modell aus Ihren beschrifteten Bildern lernen kann.
‍
Evaluierung und Bereitstellung: Testen Sie Ihr trainiertes Modell mit neuen Bildern, bewerten Sie seine Genauigkeit und stellen Sie es in praktischen Anwendungen wie Fertigung, Luftüberwachung oder Dokumentenanalyse bereit.

Anwendungen, die durch OBB-Erkennung ermöglicht werden

Objekte, die nicht zentriert oder geneigt sind, kommen in realen Szenarien recht häufig vor. Lassen Sie uns einige Beispiele durchgehen, bei denen die OBB-Erkennung einen echten Unterschied macht, indem sie diese Objekte präzise erkennt.

Analyse von Röntgenbildern mithilfe der OBB-Erkennung

Die OBB-Erkennung kann die medizinische Bildanalyse durch eine höhere Präzision noch verbessern. Medizinische Bilder enthalten oft anatomische Strukturen wie Tumore, Organe oder Knochen. Diese Strukturen weisen oft unregelmäßige Formen und unterschiedliche Ausrichtungen auf. Da sich OBBs drehen können, um sich dem Winkel eines Objekts anzupassen, ermöglichen sie eine genauere Lokalisierung und Messung, was für die Diagnose und Behandlungsplanung von entscheidender Bedeutung ist.

Dieser Ansatz ist besonders effektiv bei der Analyse von Röntgenbildern von Knochenbrüchen, bei denen die Position und Ausrichtung der Knochen Schlüsselfaktoren sind. Beispielsweise wurde die OBB-Erkennung zur Analyse von pädiatrischen Ellenbogen-Röntgenbildern verwendet. Durch die Anpassung an die Ausrichtung der Knochen konnte die Erkennungsgenauigkeit verbessert werden.

‍

Luftüberwachung mit OBB-Erkennung

Die Überwachung aus der Luft ist ein wichtiges Instrument in Bereichen wie der öffentlichen Sicherheit, der Umweltüberwachung und der Stadtplanung. Die von Drohnen oder Satelliten aufgenommenen Bilder können helfen, Objekte wie Schiffe, Fahrzeuge und Gebäude zu identifizieren. Allerdings erscheinen die Objekte auf diesen Bildern oft klein und in ungewöhnlichen Winkeln, was ihre genaue detect erschwert.

Die OBB-Erkennung löst dies, indem sie die Bounding Boxes so neigt, dass sie mit dem Winkel jedes Objekts übereinstimmen. Dies führt zu genaueren Messungen der Größe und Ausrichtung eines Objekts und unterstützt eine bessere Entscheidungsfindung in Bereichen wie Stadtplanung, Verteidigung, Katastrophenschutz und Umweltüberwachung.

Ein interessantes Beispiel für die OBB-Erkennung ist die Schiffsverfolgung in der maritimen Überwachung. Satellitenbilder erfassen Schiffe oft in unterschiedlichen Winkeln und Größen aufgrund von Wetter, Beleuchtung oder Bewegung. OBBs können sich an diese Veränderungen anpassen und die Erkennung verbessern, insbesondere bei kleineren oder teilweise verdeckten Schiffen.

‍

Verwendung der OBB-Erkennung in der Landwirtschaft

Das Sortieren von Pflanzen nach der Ernte ist ein wichtiger Schritt, um die Qualität zu gewährleisten, bevor sie verpackt und auf den Markt gebracht werden. Während viele Systeme für runde Früchte wie Äpfel und Orangen gut funktionieren, sind lange und schmale Pflanzen wie Karotten oder Zizania-Sprossen viel schwieriger zu handhaben. Sie haben unterschiedliche Formen und stehen oft in verschiedenen Winkeln, so dass es schwierig ist, sie genau detect und zu sortieren.

Um dieses Problem zu lösen, haben Forscher ein System entwickelt, das die Erkennung von orientierten Bounding Boxen (OBB) nutzt, um diese Pflanzen genauer zu identifizieren und zu bewerten. Das System kann mehrere Pflanzen in einem Bild detect , selbst wenn sie geneigt sind oder sich überlappen, und ihre Qualität und Position in Echtzeit bewerten.

Vor- und Nachteile der OBB-Erkennung

Hier sind einige der Vorteile der Verwendung von OBB-Erkennung:

Verbesserte Eingabe für nachgelagerte Aufgaben: Computer-Vision-Aufgaben wie Instanzsegmentierung und Objekterkennung können besser funktionieren, wenn sie genauere Objekterkennungen erhalten.
Verbessertes räumliches Denken: Durch die Erfassung des Ausrichtungswinkels ermöglichen OBBs das Verständnis der Ausrichtung und Richtung eines Objekts.
Reduzierte Überlappung in überfüllten Szenen: OBBs reduzieren Mehrdeutigkeiten, indem sie Objekte auch in belebten oder unübersichtlichen Szenen enger anpassen.

Obwohl die OBB-Erkennung zur Verbesserung der Erkennungsgenauigkeit in komplexen Szenen beiträgt, sind einige Einschränkungen zu berücksichtigen:

Größere Empfindlichkeit gegenüber Rauschen: Kleine Fehler bei der Winkelvorhersage können größere Auswirkungen auf die Erkennungsgenauigkeit haben, insbesondere bei dicht gepackten oder länglichen Objekten.
‍
Spezialisierte Werkzeuge erforderlich: Da nicht alle Labeling- und Trainingsplattformen OBBs nativ unterstützen, kann die Arbeit mit ihnen zusätzliche Werkzeuge oder Setups erfordern.
Begrenzte Datensatzverfügbarkeit: Im Vergleich zur Standard-Objekterkennung gibt es derzeit weniger öffentlich verfügbare Datensätze mit OBB-Annotationen, was den Einstieg oder den Vergleich von Ergebnissen etwas erschweren kann.

Wesentliche Erkenntnisse

Die Erkennung von orientierten Bounding Boxes erleichtert es Computer-Vision-Lösungen, Objekte zu erkennen, die nicht perfekt gerade oder ausgerichtet sind. Durch die Erfassung sowohl der Position als auch der Ausrichtung von Objekten erhöht die OBB-Erkennung die Genauigkeit in realen Anwendungsfällen wie dem Scannen medizinischer Bilder, der Überwachung von Ackerland oder der Analyse von Satellitenfotos.

Mit Modellen wie YOLO11 wird die OBB-Erkennung für viele Branchen zu einer praktischen Wahl. Ganz gleich, ob Sie es mit geneigten, überlappenden oder seltsam geformten Objekten zu tun haben, die OBB-Erkennung bietet eine zusätzliche Präzisionsebene, die bei Standardmethoden oft fehlt.

Neugierig auf KI? Entdecken Sie unser GitHub-Repository, vernetzen Sie sich mit unserer Community und informieren Sie sich über unsere Lizenzoptionen, um Ihr Computer-Vision-Projekt zu starten. Erfahren Sie mehr über Innovationen wie KI im Einzelhandel und Computer Vision in der Logistik auf unseren Lösungsseiten.

Was ist die Erkennung von Oriented Bounding Boxes (OBB)?

Was ist eine Oriented Bounding Box?

OBB-Erkennung vs. Objekterkennung

Beliebte OBB-Erkennungsmodelle

Benutzerdefiniertes Training YOLO11 für orientierte Bounding-Box-Erkennung

Anwendungen, die durch OBB-Erkennung ermöglicht werden

Analyse von Röntgenbildern mithilfe der OBB-Erkennung

Luftüberwachung mit OBB-Erkennung

Verwendung der OBB-Erkennung in der Landwirtschaft

Vor- und Nachteile der OBB-Erkennung

Wesentliche Erkenntnisse

Mehr in dieser Kategorie lesen

Selbstüberwachtes Lernen zur Rauschunterdrückung: Eine schrittweise Aufschlüsselung

Was bedeutet Bildabgleich bei Vision AI? Eine kurze Einführung

Eine Einführung in das aufstrebende Gebiet der neurosymbolischen KI

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Was ist die Erkennung von Oriented Bounding Boxes (OBB)?

Was ist eine Oriented Bounding Box?

OBB-Erkennung vs. Objekterkennung

Beliebte OBB-Erkennungsmodelle

Benutzerdefiniertes Training YOLO11 für orientierte Bounding-Box-Erkennung

Anwendungen, die durch OBB-Erkennung ermöglicht werden

Analyse von Röntgenbildern mithilfe der OBB-Erkennung

Luftüberwachung mit OBB-Erkennung

Verwendung der OBB-Erkennung in der Landwirtschaft

Vor- und Nachteile der OBB-Erkennung

Wesentliche Erkenntnisse

Mehr in dieser Kategorie lesen

Selbstüberwachtes Lernen zur Rauschunterdrückung: Eine schrittweise Aufschlüsselung

Was bedeutet Bildabgleich bei Vision AI? Eine kurze Einführung

Eine Einführung in das aufstrebende Gebiet der neurosymbolischen KI

Lasst uns gemeinsam die Zukunft der KI gestalten!

Lasst uns gemeinsam die Zukunft
der KI gestalten!