Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024

Die Vorteile von Ultralytics YOLO11 als ankerfreier Detektor

Abirami Vina

5 Min. Lesezeit

5. Dezember 2024

Verstehen Sie, wie Ultralytics YOLO11 die ankerfreie Objekterkennung unterstützt und welche Vorteile diese Modellarchitektur für verschiedene Anwendungen mit sich bringt.

Wenn wir auf die Geschichte der Vision AI-Modelle zurückblicken, so existiert das Konzept der Objekterkennung – eine zentrale Aufgabe der Computer Vision, bei der Objekte innerhalb eines Bildes oder Videos identifiziert und lokalisiert werden – bereits seit den 1960er Jahren. Der Hauptgrund für ihre Bedeutung bei hochmodernen Innovationen heutzutage ist jedoch, dass sich die Objekterkennungstechniken und Modellarchitekturen seither weiterentwickelt und rasant verbessert haben. 

In einem früheren Artikel haben wir die Entwicklung der Objekterkennung und den Weg zu den Ultralytics YOLO-Modellen erörtert. Heute konzentrieren wir uns auf die Erforschung eines spezifischeren Meilensteins auf diesem Weg: den Übergang von ankerbasierten zu ankerfreien Detektoren. 

Anchor-basierte Detektoren verwenden vordefinierte Boxen, sogenannte "Anker", um vorherzusagen, wo sich Objekte in einem Bild befinden. Im Gegensatz dazu verzichten ankerfreie Detektoren auf diese vordefinierten Boxen und sagen stattdessen Objektpositionen direkt voraus.

Auch wenn diese Verschiebung wie eine einfache, logische Änderung erscheinen mag, hat sie tatsächlich zu großen Verbesserungen der Genauigkeit und Effizienz der Objekterkennung geführt. In diesem Artikel werden wir verstehen, wie Anchor-Free-Detektoren die Computer Vision durch Fortschritte wie Ultralytics YOLO11 neu gestaltet haben.

Was sind ankerbasierte Detektoren?

Ankerbasierte Detektoren verwenden vordefinierte Boxen, sogenannte Anker, um Objekte in einem Bild zu lokalisieren. Stellen Sie sich diese Anker als ein Gitter aus Boxen unterschiedlicher Größe und Form vor, die über das Bild gelegt werden. Das Modell passt diese Boxen dann an die von ihm erkannten Objekte an. Wenn das Modell beispielsweise ein Auto identifiziert, ändert es die Ankerbox, um sie genauer an die Position und Größe des Autos anzupassen.

Jeder Anker ist mit einem möglichen Objekt im Bild verbunden, und während des Trainings lernt das Modell, wie es die Anker-Boxen anpasst, um die Position, Größe und das Seitenverhältnis des Objekts besser anzupassen. Dies ermöglicht es dem Modell, Objekte zu erkennen, die unterschiedliche Größen und Ausrichtungen haben. Die Auswahl des richtigen Satzes von Anker-Boxen kann jedoch zeitaufwändig sein, und der Feinabstimmungsprozess kann fehleranfällig sein.

__wf_reserved_inherit
Abb. 1. Was ist eine Anchor Box?

Obwohl ankerbasierte Detektoren wie YOLOv4 in vielen Anwendungen gut funktioniert haben, haben sie doch einige Nachteile. Zum Beispiel passen Anker-Boxen nicht immer gut zu Objekten unterschiedlicher Form oder Größe, was es dem Modell erschwert, kleine oder unregelmäßig geformte Objekte zu erkennen. Der Prozess der Auswahl und Feinabstimmung der Anker-Box-Größen kann ebenfalls zeitaufwendig sein und erfordert viel manuellen Aufwand. Abgesehen davon haben ankerbasierte Modelle oft Schwierigkeiten, Objekte zu erkennen, die verdeckt sind oder sich überlappen, da sich die vordefinierten Boxen möglicherweise nicht gut an diese komplexeren Szenarien anpassen.

Der Übergang zur ankerfreien Objektdetektion

Anchor-freie Detektoren erlangten ab 2018 mit Modellen wie CornerNet und CenterNet Aufmerksamkeit, die einen neuen Ansatz für die Objekterkennung verfolgten, indem sie die Notwendigkeit vordefinierter Ankerboxen eliminierten. Im Gegensatz zu traditionellen Modellen, die sich auf Ankerboxen unterschiedlicher Größe und Form verlassen, um vorherzusagen, wo sich Objekte befinden, sagen ankerfreie Modelle die Positionen von Objekten direkt voraus. Sie konzentrieren sich auf Schlüsselpunkte oder Merkmale des Objekts, wie z. B. das Zentrum, was den Erkennungsprozess vereinfacht und ihn schneller und genauer macht.

Hier ist, wie ankerfreie Modelle im Allgemeinen funktionieren:

  • Keypoint-Erkennung: Anstatt vordefinierte Boxen zu verwenden, identifizieren einige Modelle wichtige Punkte auf einem Objekt, wie z. B. den Mittelpunkt oder bestimmte Ecken. Diese Keypoints helfen Modellen, herauszufinden, wo sich das Objekt befindet und wie groß es ist.
  • Zentrum-Vorhersage: Einige Modelle konzentrieren sich auf die Vorhersage des Zentrums eines Objekts. Sobald das Zentrum lokalisiert ist, kann das Modell von dort aus die Größe und Position des gesamten Objekts vorhersagen.
  • Heatmap-Regression: Viele ankerfreie Modelle verwenden Heatmaps, wobei jedes Pixel eine mögliche Position eines Objekts darstellt. Stärkere Heatmap-Werte deuten auf eine höhere Wahrscheinlichkeit hin, dass sich an diesem Punkt ein Objekt befindet.
__wf_reserved_inherit
Abb. 2. Anchor-basierte Detektion vs. Anchor-freie Detektion.

Da ankerfreie Modelle nicht auf Anchor Boxes basieren, haben sie ein einfacheres Design. Das bedeutet, dass sie recheneffizienter sind. Da sie nicht mehrere Anchor Boxes verarbeiten müssen, können sie Objekte schneller erkennen - ein wichtiger Vorteil in Echtzeitanwendungen wie autonomes Fahren und Videoüberwachung. 

Anchor-freie Modelle sind auch viel besser im Umgang mit kleinen, unregelmäßigen oder verdeckten Objekten. Da sie sich auf die Erkennung von Schlüsselpunkten konzentrieren, anstatt zu versuchen, Ankerboxen anzupassen, sind sie viel flexibler. Dies ermöglicht es ihnen, Objekte in unübersichtlichen oder komplexen Umgebungen genau zu erkennen, in denen ankerbasierte Modelle möglicherweise versagen.

Ultralytics YOLO11: Ein ankerfreier Detektor

Ursprünglich für Geschwindigkeit und Effizienz entwickelt, haben sich YOLO-Modelle schrittweise von ankerbasierten Methoden zur ankerfreien Erkennung verlagert, wodurch Modelle wie YOLO11 schneller, flexibler und besser für eine Vielzahl von Echtzeitanwendungen geeignet sind.

Hier ist ein kurzer Überblick darüber, wie sich das ankerfreie Design in den verschiedenen YOLO-Versionen entwickelt hat:

  • Ultralytics YOLOv5u: Führte den Anchor-Free Split Ultralytics Head ein, wodurch die Notwendigkeit vordefinierter Ankerboxen entfiel. Stattdessen sagt das Modell direkt voraus, wo sich Objekte in einem Bild befinden, was den Prozess vereinfacht und die Flexibilität und Geschwindigkeit verbessert.
  • YOLOv6: Es wurde eine neue Methode namens Anchor-Aided Training (AAT) verwendet, bei der Anker nur während des Trainings verwendet wurden. Dies ermöglichte es dem Modell, von der Struktur ankerbasierter Methoden während des Trainings zu profitieren, während es zur Laufzeit weiterhin ankerfreie Erkennung für bessere Geschwindigkeit und Anpassungsfähigkeit verwendete.
  • Ultralytics YOLOv8: Vollständig auf ankerfreie Erkennung umgestellt, indem der Anchor-Free Split Ultralytics Head verwendet wird. Dies machte das Modell schneller und genauer, insbesondere für kleine oder ungewöhnlich geformte Objekte, die nicht gut zu Ankerboxen passen.
  • Ultralytics YOLO11: Baut auf dem ankerfreien Ansatz von YOLOv8 auf und optimiert die Erkennung noch weiter, indem es Ankerboxen vollständig eliminiert. Dies führt zu einer schnelleren, genaueren Erkennung für Echtzeitanwendungen wie Verhaltensüberwachung von Tieren und Einzelhandelsanalysen.
__wf_reserved_inherit
Abb. 3. Vergleich von Ultralytics YOLOv8 und Ultralytics YOLO11.

Anwendungsbereiche von YOLO11 in der Praxis

Ein gutes Beispiel für die Vorteile der ankerfreien Erkennung mit YOLO11 sind autonome Fahrzeuge. In selbstfahrenden Autos ist die schnelle und genaue Erkennung von Fußgängern, anderen Fahrzeugen und Hindernissen entscheidend für die Sicherheit. Der ankerfreie Ansatz von YOLO11 vereinfacht den Erkennungsprozess, indem er die wichtigsten Punkte von Objekten, wie z. B. die Mitte eines Fußgängers oder die Begrenzungen eines anderen Fahrzeugs, direkt vorhersagt, anstatt sich auf vordefinierte Ankerboxen zu verlassen. 

__wf_reserved_inherit
Abb. 4. Vorteile der Anchor-Free Detection in YOLO11 (Bild vom Autor).

YOLO11 muss kein Raster von Ankern an jedes Objekt anpassen, was rechenintensiv und langsam sein kann. Stattdessen konzentriert es sich auf Hauptmerkmale, wodurch es schneller und effizienter wird. Wenn beispielsweise ein Fußgänger auf die Fahrbahn tritt, kann YOLO11 schnell seinen Standort identifizieren, indem es wichtige Punkte genau bestimmt, selbst wenn die Person teilweise verdeckt oder in Bewegung ist. Die Fähigkeit, sich ohne Ankerboxen an unterschiedliche Formen und Größen anzupassen, ermöglicht es YOLO11, Objekte zuverlässiger und mit höherer Geschwindigkeit zu erkennen, was für die Echtzeit-Entscheidungsfindung in autonomen Fahrsystemen von entscheidender Bedeutung ist.

Weitere Anwendungsbereiche, in denen die ankerfreien Fähigkeiten von YOLO11 besonders zur Geltung kommen, sind:

  • Einzelhandel und Bestandsverwaltung: YOLO11 erleichtert die Überwachung von Produkten in Regalen, selbst wenn diese gestapelt oder teilweise verdeckt sind. Dies trägt zu einer schnelleren und genaueren Bestandsverfolgung bei und reduziert Fehler.
  • Medizinische Bildgebung: YOLO11 ist auch im Gesundheitswesen wirksam, wo es Tumore oder andere Anomalien in medizinischen Scans erkennen kann. Seine Fähigkeit, mit unregelmäßig geformten Objekten zu arbeiten, trägt zur Verbesserung der Genauigkeit bei der Diagnose komplexer Erkrankungen bei.
  • Wildtierüberwachung: In der Wildtierforschung kann YOLO11 Tiere in dichten Wäldern oder schwierigem Gelände verfolgen und Forschern helfen, das Verhalten zu überwachen oder gefährdete Arten zu schützen.
  • Sportanalyse: YOLO11 kann verwendet werden, um Spieler, Ballbewegungen oder andere Elemente in Echtzeit während Sportveranstaltungen zu verfolgen, um Teams, Trainern und Rundfunkanstalten wertvolle Einblicke zu geben.

Überlegungen bei der Arbeit mit ankerfreien Modellen

Obwohl ankerfreie Modelle wie YOLO11 viele Vorteile bieten, bringen sie auch gewisse Einschränkungen mit sich. Eine der wichtigsten praktischen Überlegungen ist, dass selbst ankerfreie Modelle mit Verdeckungen oder stark überlappenden Objekten zu kämpfen haben können. Der Grund dafür ist, dass Computer Vision darauf abzielt, die menschliche Vision nachzubilden, und so wie wir manchmal Schwierigkeiten haben, verdeckte Objekte zu identifizieren, können KI-Modelle vor ähnlichen Herausforderungen stehen.

Ein weiterer interessanter Faktor hängt mit der Verarbeitung von Modellvorhersagen zusammen. Obwohl die Architektur von ankerfreien Modellen einfacher ist als die von ankerbasierten Modellen, ist in bestimmten Fällen eine zusätzliche Verfeinerung erforderlich. Beispielsweise können Nachbearbeitungstechniken wie die Non-Maximum Suppression (NMS) erforderlich sein, um überlappende Vorhersagen zu bereinigen oder die Genauigkeit in überfüllten Szenen zu verbessern.

Die Zukunft der KI mit YOLO11 verankern

Der Übergang von ankerbasierten zu ankerfreien Detektion war ein bedeutender Fortschritt in der Objektdetektion. Mit ankerfreien Modellen wie YOLO11 wird der Prozess vereinfacht, was zu Verbesserungen sowohl in der Genauigkeit als auch in der Geschwindigkeit führt.

Durch YOLO11 haben wir gesehen, wie sich ankerpunktfreie Objekterkennung in Echtzeitanwendungen wie selbstfahrenden Autos, Videoüberwachung und medizinischer Bildgebung auszeichnet, wo eine schnelle und präzise Erkennung entscheidend ist. Dieser Ansatz ermöglicht es YOLO11, sich leichter an unterschiedliche Objektgrößen und komplexe Szenen anzupassen, was zu einer besseren Leistung in verschiedenen Umgebungen führt.

Da sich Computer Vision ständig weiterentwickelt, wird die Objekterkennung nur noch schneller, flexibler und effizienter werden.

Erkunden Sie unser GitHub-Repository und treten Sie unserer engagierten Community bei, um über alle Themen rund um KI auf dem Laufenden zu bleiben. Erfahren Sie, wie Vision AI Branchen wie Fertigung und Landwirtschaft beeinflusst.

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens

Kostenlos starten
Link in die Zwischenablage kopiert