Indem Sie auf „Alle Cookies akzeptieren“ klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Website-Navigation zu verbessern, die Website-Nutzung zu analysieren und unsere Marketingbemühungen zu unterstützen. Mehr Infos
Cookie-Einstellungen
Indem Sie auf „Alle Cookies akzeptieren“ klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Website-Navigation zu verbessern, die Website-Nutzung zu analysieren und unsere Marketingbemühungen zu unterstützen. Mehr Infos
Erfahren Sie alles über das neue Ultralytics YOLO11-Modell, seine Funktionen und Echtzeitanwendungen in verschiedenen Branchen. Wir führen Sie durch alles, was Sie wissen müssen.
Am Montag, dem 30. September, hat Ultralytics offiziell Ultralytics YOLO11 auf den Markt gebracht, die neueste Weiterentwicklung im Bereich Computer Vision, im Anschluss an die Premiere auf der YOLO Vision 2024 (YV24), der jährlichen Hybridveranstaltung von Ultralytics. Die KI-Community ist begeistert und erkundet eifrig die Fähigkeiten des Modells. Mit schnellerer Verarbeitung, höherer Genauigkeit und Modellen, die sowohl für Edge-Geräte als auch für die Cloud-Bereitstellung optimiert sind, definiert YOLO11 die Möglichkeiten in Echtzeit-Computer-Vision-Anwendungen neu.
In einem Interview sagte der Gründer und CEO von Ultralytics, Glenn Jocher: “Die Welt bewegt sich in Richtung saubere Energie, aber nicht schnell genug. Wir möchten, dass unsere Modelle in weniger Epochen, mit weniger Augmentierungen und weniger Daten trainierbar sind, deshalb arbeiten wir hart daran. Das kleinste Objekterkennungsmodell, YOLO11n, hat nur 2,6 Millionen Parameter - etwa die Größe eines JPEG, was wirklich verrückt ist. Das größte Objekterkennungsmodell, YOLO11x, hat etwa 56 Millionen Parameter, und selbst das ist im Vergleich zu anderen Modellen unglaublich klein. Sie können sie auf einer billigen GPU trainieren, wie z. B. einer fünf Jahre alten Nvidia-GPU, mit etwas Begeisterung und etwas Kaffee.”
In diesem Artikel werden wir YOLO11 genauer unter die Lupe nehmen und seine Funktionen, Verbesserungen, Performance-Benchmarks und realen Anwendungen untersuchen, um Ihnen zu helfen, zu verstehen, was dieses Modell leisten kann. Los geht's!
YOLO11 verstehen: Verbesserungen gegenüber früheren Versionen
YOLO11 ist die neueste Weiterentwicklung in der YOLO-Serie (You Only Look Once) von Computer Vision Modellen und bietet erhebliche Verbesserungen gegenüber früheren Versionen wie YOLOv5 und YOLOv8. Das Team von Ultralytics hat Community-Feedback und modernste Forschungsergebnisse integriert, um YOLO11 schneller, genauer und effizienter zu machen. YOLO11 unterstützt auch die gleichen Computer Vision Aufgaben wie YOLOv8, einschließlich Objekterkennung, Instanzsegmentierung und Bildklassifizierung. Tatsächlich können Benutzer problemlos zu YOLO11 wechseln, ohne bestehende Arbeitsabläufe ändern zu müssen.
Eines der wichtigsten Highlights von YOLO11 ist seine überlegene Leistung in Bezug auf Genauigkeit und Geschwindigkeit im Vergleich zu seinen Vorgängern. Mit 22 % weniger Parametern als YOLOv8m erreicht YOLO11m eine höhere mittlere durchschnittliche Präzision (mAP) auf dem COCO-Datensatz, was bedeutet, dass es Objekte präziser und effizienter erkennen kann. In Bezug auf die Verarbeitungsgeschwindigkeit übertrifft YOLO11 frühere Modelle und ist somit ideal für Echtzeitanwendungen, bei denen eine schnelle Erkennung und Reaktion entscheidend sind und jede Millisekunde zählt.
Die folgende Benchmark-Grafik veranschaulicht, wie sich YOLO11 von früheren Modellen abhebt. Auf der horizontalen Achse wird die COCO Box Average Precision (AP) angezeigt, die die Genauigkeit der Objekterkennung misst. Die vertikale Achse zeigt die Latenzzeit unter Verwendung von TensorRT10 FP16 auf einer NVIDIA T4 GPU an, die angibt, wie schnell das Modell Daten verarbeitet.
Abb. 2. Mit dieser Einführung bietet Ultralytics 30 neue Modelle an.
YOLO11 bietet fünf verschiedene Modellgrößen: Nano, Small, Medium, Large und X. Benutzer können das beste Modell je nach den spezifischen Anforderungen ihrer Computer-Vision-Anwendung auswählen. Die fünf Größen bieten Flexibilität bei Aufgaben wie Bildklassifizierung, Objekterkennung, Instanzsegmentierung, Tracking, Pose-Schätzung und Objekterkennung mit orientierten Bounding Boxes (OBB). Für jede Größe ist ein Modell für jede Aufgabe verfügbar, was zu insgesamt 25 Open-Source-Modellen führt, die den Kern des Angebots von Ultralytics bilden. Diese Modelle sind ideal für eine Vielzahl von Anwendungen, von einfachen Aufgaben auf Edge-Geräten, bei denen das YOLO11n-Modell eine beeindruckende Effizienz bietet, bis hin zu größeren Anwendungen, die die Modelle YOLO11l und YOLO11x erfordern.
Zum ersten Mal führt Ultralytics Enterprise-Modelle ein, was einen wichtigen Meilenstein in unserem Produktangebot darstellt, und wir freuen uns, diese neuen Innovationen mit unseren Nutzern zu teilen. YOLO11 führt fünf proprietäre Modelle ein, die speziell für kommerzielle Anwendungsfälle entwickelt wurden. Diese Enterprise-Modelle, die nächsten Monat erhältlich sein werden, werden mit dem neuen proprietären Datensatz von Ultralytics trainiert, der aus über 1 Million Bildern besteht und robustere vortrainierte Modelle bietet. Sie sind für anspruchsvolle Anwendungen in der realen Welt konzipiert, wie z. B. medizinische Bildanalyse und Satellitenbildverarbeitung, bei denen eine präzise Objekterkennung entscheidend ist.
Erkundung der YOLO11-Funktionen der nächsten Generation
Nachdem wir nun erörtert haben, was YOLO11 bietet, wollen wir uns ansehen, was YOLO11 so besonders macht.
Eine der größten Herausforderungen bei der Entwicklung von YOLO11 bestand darin, das richtige Gleichgewicht zwischen konkurrierenden Prioritäten zu finden: die Modelle kleiner, schneller und genauer zu machen. Wie Glenn Jocher, Gründer und CEO von Ultralytics, erklärte: „Die Arbeit an YOLO-Forschung und -Entwicklung ist wirklich herausfordernd, weil man in drei verschiedene Richtungen gehen möchte: Man möchte die Modelle kleiner machen, man möchte, dass sie genauer werden, aber man möchte auch, dass sie auf verschiedenen Plattformen wie CPU und GPU schneller sind. All dies sind konkurrierende Interessen, daher muss man Kompromisse eingehen und wählen, wo man Änderungen vornimmt.“ Trotz dieser Herausforderungen erreicht YOLO11 ein beeindruckendes Gleichgewicht und bietet sowohl Geschwindigkeits- als auch Genauigkeitsverbesserungen gegenüber früheren Versionen wie YOLOv8.
Abb. 3. Ein Beispiel für die Verwendung von YOLO11 zur Objekterkennung.
YOLO11 bringt wesentliche Verbesserungen wie eine verbesserte Merkmalsextraktion mit einer neu gestalteten Backbone- und Neck-Architektur, was zu einer präziseren Objekterkennung führt. Das Modell ist außerdem auf Geschwindigkeit und Effizienz optimiert und bietet schnellere Verarbeitungszeiten bei gleichbleibend hoher Genauigkeit. Zusätzlich zu diesen Vorteilen ist YOLO11 in verschiedenen Umgebungen sehr anpassungsfähig und funktioniert nahtlos auf Edge-Geräten, Cloud-Plattformen und Systemen mit NVIDIA-GPUs. Diese Anpassungsfähigkeit macht es zu einer idealen Wahl für Benutzer, die flexible Bereitstellungsoptionen für verschiedene Hardware-Konfigurationen benötigen, von mobilen Geräten bis hin zu großen Servern.
Echtzeit-YOLO11-Anwendungen
Die Vielseitigkeit von YOLO11 macht es zu einem zuverlässigen Werkzeug in vielen Branchen, insbesondere bei komplexen Anwendungsfällen. Beispielsweise funktioniert es nahtlos auf Edge-Geräten und kann für Anwendungen verwendet werden, die Echtzeitanalysen in Umgebungen mit begrenzter Rechenleistung erfordern. Ein hervorragendes Beispiel hierfür ist das autonome Fahren, bei dem Fahrzeuge in Sekundenbruchteilen Entscheidungen treffen müssen, um die Sicherheit aller zu gewährleisten. YOLO11 hilft dabei, indem es Objekte auf der Straße erkennt und analysiert, wie z. B. Fußgänger oder andere Autos, selbst unter schwierigen Bedingungen wie schlechten Lichtverhältnissen oder wenn Dinge teilweise verdeckt sind. Eine schnelle und genaue Erkennung hilft, Unfälle zu vermeiden und stellt sicher, dass selbstfahrende Fahrzeuge sicher navigieren können.
Abb. 4. Glenn Jocher auf der Bühne bei YV24, spricht über YOLO11-Anwendungen.
Ein weiteres interessantes Beispiel für die Bandbreite von YOLO11 ist seine Fähigkeit, mit Oriented Bounding Boxes (OBB) umzugehen. Dies ist wichtig für die Erkennung von Objekten, die nicht perfekt ausgerichtet sind. Die OBB-Objekterkennung ist eine Funktion, die besonders in Branchen wie Landwirtschaft, Kartierung und Überwachung nützlich ist, wo Bilder oft gedrehte Objekte enthalten, wie z. B. Feldfrüchte oder Gebäude in Luft- oder Satellitenbildern. Im Gegensatz zu herkömmlichen Modellen kann YOLO11 Objekte in jedem Winkel identifizieren und viel genauere Ergebnisse für Aufgaben liefern, die Präzision erfordern.
YOLO11 für KI-Entwickler: Probieren Sie es selbst aus
Der Einstieg in YOLO11 ist einfach und zugänglich, egal ob Sie das Programmieren oder eine No-Code-Option bevorzugen. Um mit YOLO11 über Code zu arbeiten, können Sie das Ultralytics Python-Paket verwenden, um Modelle einfach zu trainieren und bereitzustellen. Wenn Sie einen No-Code-Ansatz bevorzugen, können Sie mit Ultralytics HUB YOLO11 mit nur wenigen Klicks ausprobieren.
YOLO11 Code Walk-Through
Um YOLO11 mit Python zu verwenden, müssen Sie zunächst das Ultralytics-Paket installieren. Je nach Ihren Präferenzen können Sie dies mit pip, conda oder Docker tun. Detaillierte Anweisungen und Best Practices zum Installationsprozess finden Sie in unserem Ultralytics Installationshandbuch. Wenn Sie bei der Installation der erforderlichen Pakete für YOLO11 auf Schwierigkeiten stoßen, finden Sie in unserem Leitfaden zu häufigen Problemen Lösungen und Tipps.
Abb. 5. Verwendung von YOLO11 über das Ultralytics-Paket.
Für Nutzer, die einen No-Code-Ansatz bevorzugen, bietet Ultralytics HUB eine einfache Möglichkeit, YOLO11-Modelle mit nur wenigen Klicks zu trainieren und bereitzustellen. Um mit HUB zu beginnen, erstellen Sie einfach ein Konto auf der Ultralytics HUB-Plattform, und Sie können mit dem Trainieren und Verwalten Ihrer Modelle über eine intuitive Benutzeroberfläche beginnen.
YOLO11: Die Zukunft der Vision AI gestalten
Die KI-Community treibt den Bereich Computer Vision ständig voran, indem sie bestrebt ist, schnellere und genauere Modelle für reale Anwendungen zu entwickeln. Ultralytics YOLO11 ist ein wichtiger Meilenstein in diesem Bestreben und bringt verbesserte Geschwindigkeit, Genauigkeit und Flexibilität. Es wurde für Echtzeit- und Edge-Anwendungen entwickelt und ist somit ideal für Branchen wie das Gesundheitswesen und das autonome Fahren. Egal, ob Sie das Ultralytics Python-Paket oder den No-Code Ultralytics Hub verwenden, YOLO11 vereinfacht komplexe Vision-KI-Aufgaben. Es bietet leistungsstarke Computer-Vision-Funktionen und ist somit eine gute Wahl für Entwickler und Unternehmen.