Vergleich von Ultralytics YOLO11 mit vorherigen YOLO-Modellen

2. April 2025
Vergleichen Sie Ultralytics YOLOv8, YOLOv9, YOLOv10 und Ultralytics YOLO11, um zu verstehen, wie sich diese Modelle von 2023 bis 2025 entwickelt und verbessert haben.

2. April 2025
Vergleichen Sie Ultralytics YOLOv8, YOLOv9, YOLOv10 und Ultralytics YOLO11, um zu verstehen, wie sich diese Modelle von 2023 bis 2025 entwickelt und verbessert haben.
Von der Automatisierung alltäglicher Aufgaben bis hin zur Unterstützung fundierter Entscheidungen in Echtzeit verändert künstliche Intelligenz (KI) die Zukunft verschiedener Branchen. Ein besonders faszinierender Bereich der KI ist Computer Vision, auch bekannt als Vision AI. Sie konzentriert sich darauf, Maschinen in die Lage zu versetzen, visuelle Daten wie Menschen zu analysieren und zu interpretieren.
Insbesondere treiben Computer Vision Modelle Innovationen voran, die sowohl die Sicherheit als auch die Effizienz verbessern. Zum Beispiel werden diese Modelle in selbstfahrenden Autos zur Erkennung von Fußgängern und in Überwachungskameras zur Rund-um-die-Uhr-Überwachung von Grundstücken eingesetzt.
Einige der bekanntesten Computer-Vision-Modelle sind die YOLO-Modelle (You Only Look Once), die für ihre Echtzeit-Objekterkennung bekannt sind. Im Laufe der Zeit haben sich die YOLO-Modelle verbessert, wobei jede neue Version eine bessere Leistung und mehr Flexibilität bietet.
Neuere Versionen wie Ultralytics YOLO11 können eine Vielzahl von Aufgaben bewältigen, wie z. B. Instanzsegmentierung, Bildklassifizierung, Pose-Schätzung und Multi-Objekt-Tracking, mit besserer Genauigkeit, Geschwindigkeit und Präzision als je zuvor.
In diesem Artikel vergleichen wir Ultralytics YOLOv8, YOLOv9, YOLOv10 und Ultralytics YOLO11, um ein besseres Verständnis dafür zu bekommen, wie sich diese Modelle entwickelt haben. Wir werden ihre wichtigsten Funktionen, Benchmark-Ergebnisse und Leistungsunterschiede analysieren. Los geht's!
YOLOv8, veröffentlicht von Ultralytics am 10. Januar 2023, war ein wichtiger Fortschritt im Vergleich zu früheren YOLO-Modellen. Es ist für eine genaue Echtzeit-Erkennung optimiert und kombiniert bewährte Ansätze mit innovativen Updates für bessere Ergebnisse.
YOLOv8 geht über die Objekterkennung hinaus und unterstützt auch die folgenden Computer-Vision-Aufgaben: Instanzsegmentierung, Pose-Schätzung, Objekterkennung mit orientierten Begrenzungsrahmen (OBB) und Bildklassifizierung. Ein weiteres wichtiges Merkmal von YOLOv8 ist, dass es in fünf verschiedenen Modellvarianten erhältlich ist – Nano, Small, Medium, Large und X – sodass Sie das richtige Gleichgewicht zwischen Geschwindigkeit und Genauigkeit basierend auf Ihren Anforderungen wählen können.
Aufgrund ihrer Vielseitigkeit und starken Leistung kann YOLOv8 in vielen realen Anwendungen eingesetzt werden, wie z. B. Sicherheitssystemen, intelligenten Städten, dem Gesundheitswesen und der industriellen Automatisierung.
Hier ist ein genauerer Blick auf einige der wichtigsten Funktionen von YOLOv8:
YOLOv9 wurde am 21. Februar 2024 von Chien-Yao Wang und Hong-Yuan Mark Liao vom Institute of Information Science, Academia Sinica, Taiwan, veröffentlicht. Es unterstützt Aufgaben wie Objekterkennung und Instanzsegmentierung.
Dieses Modell baut auf Ultralytics YOLOv5 auf und führt zwei wesentliche Neuerungen ein: Programmable Gradient Information (PGI) und Generalized Efficient Layer Aggregation Network (GELAN).
PGI hilft YOLOv9, wichtige Informationen während der Datenverarbeitung durch die Schichten zu erhalten, was zu genaueren Ergebnissen führt. Gleichzeitig verbessert GELAN die Nutzung der Schichten durch das Modell, wodurch die Leistung und die Recheneffizienz gesteigert werden. Dank dieser Verbesserungen kann YOLOv9 Echtzeitaufgaben auf Edge-Geräten und in mobilen Apps bewältigen, wo die Rechenressourcen oft begrenzt sind.
Hier ist ein Einblick in einige der wichtigsten Funktionen von YOLOv8:
YOLOv10 wurde am 23. Mai 2024 von Forschern der Tsinghua University vorgestellt und konzentriert sich auf die Echtzeit-Objekterkennung. Es behebt Einschränkungen in früheren YOLO-Versionen, indem es die Notwendigkeit der Non-Maximum Suppression (NMS), einem Nachbearbeitungsschritt zur Eliminierung doppelter Erkennungen, beseitigt und das gesamte Modelldesign verfeinert. Dies führt zu einer schnelleren und effizienteren Objekterkennung bei gleichzeitiger Erzielung modernster Genauigkeit.
Ein wesentlicher Bestandteil dessen, was dies ermöglicht, ist ein Trainingsansatz, der als konsistente Dual-Label-Zuweisung bekannt ist. Er kombiniert zwei Strategien: eine, die es mehreren Vorhersagen ermöglicht, vom selben Objekt zu lernen (One-to-Many), und eine andere, die sich auf die Auswahl der besten einzelnen Vorhersage konzentriert (One-to-One). Da beide Strategien denselben Matching-Regeln folgen, lernt das Modell, Duplikate selbstständig zu vermeiden, sodass NMS nicht erforderlich ist.
Die Architektur von YOLOv10 verwendet auch ein verbessertes CSPNet-Backbone, um Features effektiver zu erlernen, und ein PAN (Path Aggregation Network)-Neck, das Informationen aus verschiedenen Schichten kombiniert, wodurch es sowohl kleine als auch große Objekte besser erkennen kann. Diese Verbesserungen ermöglichen den Einsatz von YOLOv10 für reale Anwendungen in der Fertigung, im Einzelhandel und beim autonomen Fahren.
Hier sind einige der anderen herausragenden Merkmale von YOLOv10:
In diesem Jahr, am 30. September, hat Ultralytics auf seiner jährlichen Hybridveranstaltung YOLO Vision 2024 (YV24) offiziell YOLO11 vorgestellt - eines der neuesten Modelle der YOLO-Serie.
Diese Version brachte bedeutende Verbesserungen gegenüber früheren Versionen. YOLO11 ist schneller, genauer und hocheffizient. Es unterstützt die gesamte Bandbreite der Computer-Vision-Aufgaben, mit denen YOLOv8-Benutzer vertraut sind, einschließlich Objekterkennung, Instanzsegmentierung und Bildklassifizierung. Es behält auch die Kompatibilität mit YOLOv8-Workflows bei, was es den Benutzern erleichtert, reibungslos auf die neue Version umzusteigen.
Darüber hinaus ist YOLO11 so konzipiert, dass es eine breite Palette von Rechenanforderungen erfüllt - von leichten Edge-Geräten bis hin zu leistungsstarken Cloud-Systemen. Das Modell ist sowohl als Open-Source- als auch als Enterprise-Version erhältlich, wodurch es an verschiedene Anwendungsfälle angepasst werden kann.
Es ist eine gute Option für Präzisionsaufgaben wie medizinische Bildgebung und Satellitenerkennung sowie für breitere Anwendungen in autonomen Fahrzeugen, der Landwirtschaft und dem Gesundheitswesen.
Hier sind einige der anderen einzigartigen Merkmale von YOLO11:
Wenn man verschiedene Modelle untersucht, ist es nicht immer einfach, sie allein anhand ihrer Eigenschaften zu vergleichen. Hier kommt das Benchmarking ins Spiel. Indem wir alle Modelle auf demselben Datensatz ausführen, können wir ihre Leistung objektiv messen und vergleichen. Werfen wir einen Blick darauf, wie jedes Modell auf dem COCO-Datensatz abschneidet.
Beim Vergleich von YOLO-Modellen bringt jede neue Version bemerkenswerte Verbesserungen in Bezug auf Genauigkeit, Geschwindigkeit und Flexibilität. Insbesondere YOLO11m macht hier einen Sprung, da es 22 % weniger Parameter als YOLOv8m verwendet, was bedeutet, dass es leichter und schneller ausgeführt werden kann. Trotz seiner geringeren Größe erreicht es auch eine höhere mittlere durchschnittliche Präzision (mAP) auf dem COCO-Datensatz. Diese Metrik misst, wie gut das Modell Objekte erkennt und lokalisiert, sodass eine höhere mAP genauere Vorhersagen bedeutet.
Lassen Sie uns untersuchen, wie diese Modelle in einer realen Situation funktionieren.
Um YOLOv8, YOLOv9, YOLOv10 und YOLO11 zu vergleichen, wurden alle vier mit einem Konfidenzwert von 0,3 (das Modell zeigt nur Erkennungen an, wenn es zu mindestens 30 % sicher ist, dass es ein Objekt korrekt identifiziert hat) und einer Bildgröße von 640 für eine faire Bewertung auf demselben Verkehrsvideo ausgeführt. Die Ergebnisse der Objekterkennung und -verfolgung hoben wichtige Unterschiede in Bezug auf Erkennungsgenauigkeit, Geschwindigkeit und Präzision hervor.
Vom ersten Frame an erkannte YOLO11 große Fahrzeuge wie LKWs, die YOLOv10 verpasst hatte. YOLOv8 und YOLOv9 zeigten eine ordentliche Leistung, die jedoch je nach Lichtverhältnissen und Objektgröße variierte. Kleinere, entfernte Fahrzeuge blieben bei allen Modellen eine Herausforderung, obwohl YOLO11 auch bei diesen Erkennungen deutliche Verbesserungen zeigte.
In Bezug auf die Geschwindigkeit arbeiteten alle Modelle zwischen 10 und 20 Millisekunden pro Frame, was schnell genug ist, um Echtzeitaufgaben mit über 50 FPS zu bewältigen. Einerseits lieferten YOLOv8 und YOLOv9 während des gesamten Videos stabile und zuverlässige Erkennungen. Interessanterweise war YOLOv10, das für geringere Latenzzeiten entwickelt wurde, schneller, zeigte aber einige Inkonsistenzen bei der Erkennung bestimmter Objekttypen.
YOLO11 hingegen zeichnete sich durch seine Präzision aus und bot ein starkes Gleichgewicht zwischen Geschwindigkeit und Genauigkeit. Obwohl keines der Modelle in jedem Frame perfekt abschnitt, zeigte der direkte Vergleich deutlich, dass YOLO11 die beste Gesamtleistung lieferte.
Die Auswahl eines Modells für ein Projekt hängt von dessen spezifischen Anforderungen ab. Beispielsweise können einige Anwendungen Geschwindigkeit priorisieren, während andere eine höhere Genauigkeit erfordern oder mit Einsatzbeschränkungen konfrontiert sind, die die Entscheidung beeinflussen.
Ein weiterer wichtiger Faktor ist die Art der Computer-Vision-Aufgaben, die Sie angehen müssen. Wenn Sie eine größere Flexibilität bei verschiedenen Aufgaben suchen, sind YOLOv8 und YOLO11 gute Optionen.
Ob Sie sich für YOLOv8 oder YOLO11 entscheiden, hängt wirklich von Ihren Bedürfnissen ab. YOLOv8 ist eine gute Wahl, wenn Sie neu im Bereich Computer Vision sind und Wert auf eine größere Community, mehr Tutorials und umfangreiche Integrationen von Drittanbietern legen.
Wenn Sie andererseits eine hochmoderne Performance mit besserer Genauigkeit und Geschwindigkeit suchen, ist YOLO11 die bessere Wahl, obwohl es aufgrund der neueren Version eine kleinere Community und weniger Integrationen bietet.
Von Ultralytics YOLOv8 bis Ultralytics YOLO11 spiegelt die Entwicklung der YOLO-Modellreihe ein konsequentes Streben nach intelligenteren Computer-Vision-Modellen wider. Jede Version von YOLO bringt sinnvolle Verbesserungen in Bezug auf Geschwindigkeit, Genauigkeit und Präzision.
Da die Fortschritte im Bereich Computer Vision stetig zunehmen, bieten diese Modelle zuverlässige Lösungen für reale Herausforderungen, von der Objekterkennung bis hin zu autonomen Systemen. Die fortlaufende Entwicklung von YOLO-Modellen zeigt, wie weit das Feld bereits gekommen ist und was wir in Zukunft noch erwarten können.
Um mehr über KI zu erfahren, besuchen Sie unser GitHub-Repository und interagieren Sie mit unserer Community. Entdecken Sie Fortschritte in verschiedenen Branchen, von Vision AI in der Fertigung bis hin zu Computer Vision im Gesundheitswesen. Sehen Sie sich unsere Lizenzoptionen an, um noch heute mit Ihren Vision-AI-Projekten zu beginnen.