Wenn Sie auf "Alle Cookies akzeptieren" klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Navigation auf der Website zu verbessern, die Nutzung der Website zu analysieren und unsere Marketingaktivitäten zu unterstützen. Mehr Infos
Cookie-Einstellungen
Wenn Sie auf "Alle Cookies akzeptieren" klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Navigation auf der Website zu verbessern, die Nutzung der Website zu analysieren und unsere Marketingaktivitäten zu unterstützen. Mehr Infos
Erfahren Sie alles über das neue Ultralytics YOLO11-Modell, seine Funktionen und Echtzeitanwendungen in verschiedenen Branchen. Wir führen Sie durch alles, was Sie wissen müssen.
Am Montag, dem 30. September, stellte Ultralytics offiziell Ultralytics YOLO11 vor, die neueste Entwicklung im Bereich der Computer Vision, nachdem sie auf der YOLO Vision 2024 (YV24), der jährlichen Hybrid-Veranstaltung von Ultralytics, erstmals präsentiert wurde. Die KI-Gemeinschaft ist in heller Aufregung und erkundet eifrig die Fähigkeiten des Modells. Mit schnellerer Verarbeitung, höherer Genauigkeit und Modellen, die sowohl für Edge-Geräte als auch für den Einsatz in der Cloud optimiert sind, definiert YOLO11 neu, was bei Echtzeit-Computer-Vision-Anwendungen möglich ist.
In einem Interview sagte Ultralytics-Gründer und CEO Glenn Jocher: "Die Welt bewegt sich auf saubere Energie zu, aber nicht schnell genug. Wir wollen, dass unsere Modelle in weniger Epochen, mit weniger Erweiterungen und weniger Daten trainiert werden können, also arbeiten wir hart daran. Das kleinste Objekterkennungsmodell, YOLO11n, hat nur 2,6 Millionen Parameter - etwa so groß wie ein JPEG, was wirklich verrückt ist. Das größte Objekterkennungsmodell, YOLO11x, hat etwa 56 Millionen Parameter, und selbst das ist im Vergleich zu anderen Modellen unglaublich klein. Man kann sie auf einem billigen Grafikprozessor trainieren, z. B. einem fünf Jahre alten Nvidia-Grafikprozessor, mit ein bisschen Aufregung und ein bisschen Kaffee."
In diesem Artikel werden wir YOLO11 genauer unter die Lupe nehmen und seine Funktionen, Verbesserungen, Leistungsbenchmarks und realen Anwendungen untersuchen, damit Sie verstehen, was dieses Modell leisten kann. Fangen wir an!
YOLO11 verstehen: Verbesserungen gegenüber früheren Versionen
YOLO11 ist die jüngste Weiterentwicklung der YOLO (You Only Look Once)-Serie von Computer-Vision-Modellen und bietet erhebliche Verbesserungen gegenüber früheren Versionen wie YOLOv5 und YOLOv8. Das Ultralytics-Team hat das Feedback der Gemeinschaft und die neuesten Forschungsergebnisse berücksichtigt, um YOLO11 schneller, genauer und effizienter zu machen. YOLO11 unterstützt dieselben Computer-Vision-Aufgaben wie YOLOv8, einschließlich Objekterkennung, Instanzsegmentierung und Bildklassifizierung. Anwender können problemlos zu YOLO11 wechseln, ohne bestehende Arbeitsabläufe ändern zu müssen.
Eines der wichtigsten Highlights von YOLO11 ist die im Vergleich zu seinen Vorgängern überlegene Leistung in Bezug auf Genauigkeit und Geschwindigkeit. Mit 22 % weniger Parametern als YOLOv8m erreicht YOLO11m eine höhere durchschnittliche Genauigkeit (mAP) auf dem COCO-Datensatz, was bedeutet, dass es Objekte präziser und effizienter erkennen kann. In Bezug auf die Verarbeitungsgeschwindigkeit übertrifft YOLO11 frühere Modelle und ist damit ideal für Echtzeitanwendungen, bei denen eine schnelle Erkennung und Reaktion entscheidend sind und jede Millisekunde zählt.
Das nachstehende Benchmarking-Diagramm zeigt, wie sich YOLO11 von früheren Modellen abhebt. Auf der horizontalen Achse wird die durchschnittliche Präzision (AP) der COCO-Box angezeigt, die die Genauigkeit der Objekterkennung misst. Die vertikale Achse zeigt die Latenzzeit unter Verwendung von TensorRT10 FP16 auf einem NVIDIA T4-Grafikprozessor, die angibt, wie schnell das Modell Daten verarbeitet.
Abb. 1. YOLO11 bietet modernste Fähigkeiten zur Objekterkennung in Echtzeit.
Einführung des YOLO11-Modells: Open-Source- und Unternehmensoptionen
Ultralytics führt zum ersten Mal Unternehmensmodelle ein, was einen wichtigen Meilenstein in unserem Produktangebot darstellt, und wir freuen uns, diese neuen Innovationen mit unseren Benutzern zu teilen. YOLO11 führt fünf proprietäre Modelle ein, die speziell für kommerzielle Anwendungsfälle entwickelt wurden. Diese Unternehmensmodelle, die ab nächstem Monat verfügbar sein werden, werden auf Ultralytics' neuem proprietären Datensatz trainiert, der aus über 1 Million Bildern besteht und robustere vortrainierte Modelle bietet. Sie wurden für anspruchsvolle, reale Anwendungen entwickelt, wie z. B. die Analyse medizinischer Bilder und die Verarbeitung von Satellitenbildern, bei denen eine präzise Objekterkennung entscheidend ist.
Erkundung der YOLO11-Funktionen der nächsten Generation
Nachdem wir nun besprochen haben, was YOLO11 bietet, wollen wir einen Blick darauf werfen, was YOLO11 so besonders macht.
Eine der größten Herausforderungen bei der Entwicklung von YOLO11 war es, das richtige Gleichgewicht zwischen konkurrierenden Prioritäten zu finden: die Modelle kleiner, schneller und genauer zu machen. Glenn Jocher, Gründer und CEO von Ultralytics, erklärte: "DieArbeit an der YOLO-Forschung und -Entwicklung ist eine echte Herausforderung, weil man in drei verschiedene Richtungen gehen will: Man will die Modelle kleiner machen, man will, dass sie genauer werden, aber man will auch, dass sie auf verschiedenen Plattformen wie CPU und GPU schneller sind. All das sind konkurrierende Interessen, also muss man Kompromisse eingehen und entscheiden, wo man Änderungen vornimmt." Trotz dieser Herausforderungen erreicht YOLO11 ein beeindruckendes Gleichgewicht und bietet sowohl Geschwindigkeits- als auch Genauigkeitsverbesserungen gegenüber früheren Versionen wie YOLOv8.
Abb. 3. Ein Beispiel für die Verwendung von YOLO11 zur Objekterkennung.
YOLO11 bringt wesentliche Verbesserungen wie eine verbesserte Merkmalsextraktion mit einer neu gestalteten Backbone- und Neck-Architektur, die zu einer präziseren Objekterkennung führt. Das Modell ist außerdem für Geschwindigkeit und Effizienz optimiert und bietet schnellere Verarbeitungszeiten bei gleichbleibend hoher Genauigkeit. Zusätzlich zu diesen Vorteilen ist YOLO11 in hohem Maße anpassungsfähig an verschiedene Umgebungen und arbeitet nahtlos auf Edge-Geräten, Cloud-Plattformen und Systemen mit NVIDIA-GPUs. Diese Anpassungsfähigkeit macht es zu einer idealen Wahl für Benutzer, die flexible Einsatzoptionen für verschiedene Hardwarekonfigurationen benötigen, von mobilen Geräten bis hin zu großen Servern.
YOLO11-Echtzeitanwendungen
Die Vielseitigkeit von YOLO11 macht es zu einem zuverlässigen Werkzeug in vielen Branchen, insbesondere bei komplexen Anwendungsfällen. So funktioniert es beispielsweise nahtlos auf Edge-Geräten und kann für Anwendungen eingesetzt werden, die Echtzeitanalysen in Umgebungen mit begrenzter Rechenleistung erfordern. Ein hervorragendes Beispiel hierfür ist das autonome Fahren, bei dem Fahrzeuge in Sekundenbruchteilen Entscheidungen treffen müssen, um die Sicherheit aller zu gewährleisten. YOLO11 hilft dabei durch die Erkennung und Analyse von Objekten auf der Straße, wie Fußgängern oder anderen Autos, selbst unter schwierigen Bedingungen wie schlechten Lichtverhältnissen oder wenn Dinge teilweise verdeckt sind. Die schnelle und präzise Erkennung hilft, Unfälle zu vermeiden und sorgt dafür, dass selbstfahrende Fahrzeuge sicher navigieren können.
Abbildung 4. Glenn Jocher auf der Bühne bei YV24, wo er über YOLO11-Anwendungen spricht.
Ein weiteres interessantes Beispiel für die Reichweite von YOLO11 ist seine Fähigkeit, orientierte Bounding Boxes (OBB) zu verarbeiten. Dies ist wichtig für die Erkennung von Objekten, die nicht perfekt ausgerichtet sind. Die OBB-Objekterkennung ist eine Funktion, die besonders in Branchen wie Landwirtschaft, Kartierung und Überwachung nützlich ist, wo Bilder oft gedrehte Objekte wie Pflanzen oder Gebäude in Luft- oder Satellitenbildern enthalten. Im Gegensatz zu herkömmlichen Modellen kann YOLO11 Objekte in jedem Winkel erkennen und liefert viel genauere Ergebnisse für Aufgaben, die Präzision erfordern.
YOLO11 für KI-Entwickler: Probieren Sie es selbst aus
Der Einstieg in YOLO11 ist einfach und leicht zugänglich, unabhängig davon, ob Sie die Codierung oder die Option ohne Code bevorzugen. Um mit YOLO11 durch Code zu arbeiten, können Sie das Ultralytics Python-Paket verwenden, um Modelle einfach zu trainieren und einzusetzen. Wenn Sie einen Ansatz ohne Code bevorzugen, können Sie mit Ultralytics HUB YOLO11 mit nur wenigen Klicks ausprobieren.
YOLO11 Code-Durchsicht
Um YOLO11 mit Python zu verwenden, müssen Sie zunächst das Ultralytics-Paket installieren. Je nach Ihren Präferenzen können Sie dies mit pip, conda oder Docker tun. Detaillierte Anweisungen und Best Practices für den Installationsprozess finden Sie in unserem Ultralytics-Installationshandbuch. Sollten Sie bei der Installation der für YOLO11 erforderlichen Pakete auf Schwierigkeiten stoßen, finden Sie in unserem Leitfaden für häufige Probleme Lösungen und Tipps.
Abb. 5. Verwendung von YOLO11 über das Ultralytics-Paket.
Für Benutzer, die einen codefreien Ansatz bevorzugen, bietet Ultralytics HUB eine einfache Möglichkeit, YOLO11-Modelle mit nur wenigen Klicks zu trainieren und einzusetzen. Um mit HUB zu beginnen, erstellen Sie einfach ein Konto auf der Ultralytics HUB-Plattform, und Sie können mit dem Training und der Verwaltung Ihrer Modelle über eine intuitive Schnittstelle beginnen.
YOLO11: Die Zukunft der künstlichen Intelligenz gestalten
Die KI-Gemeinschaft treibt den Bereich der Computer Vision ständig voran, indem sie sich bemüht, schnellere und genauere Modelle für reale Anwendungen zu entwickeln. Ultralytics YOLO11 ist ein wichtiger Meilenstein in diesem Bestreben und bietet verbesserte Geschwindigkeit, Genauigkeit und Flexibilität. Es wurde für Echtzeit- und Randanwendungen entwickelt und ist damit ideal für Branchen wie das Gesundheitswesen und autonomes Fahren. Ganz gleich, ob Sie das Ultralytics Python-Paket oder den codefreien Ultralytics Hub verwenden, YOLO11 vereinfacht komplexe Vision AI-Aufgaben. Es bietet leistungsstarke Computer-Vision-Funktionen und ist damit eine gute Wahl für Entwickler und Unternehmen.