Alles, was Sie über Ultralytics YOLO11 und seine Anwendungen wissen müssen
Erfahren Sie alles über das neue Ultralytics YOLO11 , seine Funktionen und Echtzeitanwendungen in verschiedenen Branchen. Wir führen Sie durch alles, was Sie wissen müssen.
Erfahren Sie alles über das neue Ultralytics YOLO11 , seine Funktionen und Echtzeitanwendungen in verschiedenen Branchen. Wir führen Sie durch alles, was Sie wissen müssen.
Am Montag, dem 30. September, startete Ultralytics offiziell die Ultralytics YOLO11die neueste Entwicklung im Bereich der Computer Vision, nach seinem Debüt auf der YOLO Vision 2024 (YV24), der jährlichen Hybrid-Veranstaltung von Ultralytics. Die KI-Gemeinschaft ist in heller Aufregung und erkundet eifrig die Fähigkeiten des Modells. Mit schnellerer Verarbeitung, höherer Genauigkeit und Modellen, die sowohl für Edge-Geräte als auch für den Einsatz in der Cloud optimiert sind, definiertYOLO11 neu, was bei Echtzeit-Computer-Vision-Anwendungen möglich ist.
In einem Interview sagte Ultralytics und CEO Glenn Jocher: "Die Welt bewegt sich auf saubere Energie zu, aber nicht schnell genug. Wir wollen, dass unsere Modelle in weniger Epochen, mit weniger Erweiterungen und weniger Daten trainiert werden können, also arbeiten wir hart daran. Das kleinste Objekterkennungsmodell, YOLO11n, hat nur 2,6 Millionen Parameter - etwa so groß wie ein JPEG, was wirklich verrückt ist. Das größte Objekterkennungsmodell, YOLO11x, hat etwa 56 Millionen Parameter, und selbst das ist im Vergleich zu anderen Modellen unglaublich klein. Man kann sie auf einem billigen GPU trainieren, z. B. einem fünf Jahre altenGPU, mit ein bisschen Aufregung und ein bisschen Kaffee."
In diesem Artikel werden wir YOLO11 genauer unter die Lupe nehmen und seine Funktionen, Verbesserungen, Leistungsbenchmarks und realen Anwendungen untersuchen, damit Sie verstehen, was dieses Modell leisten kann. Fangen wir an!
YOLO11 ist die jüngste Weiterentwicklung der YOLO (You Only Look Once)-Serie von Computer-Vision-Modellen und bietet erhebliche Verbesserungen gegenüber früheren Versionen wie YOLOv5 und YOLOv8. Das Team von Ultralytics hat das Feedback der Community und die neuesten Forschungsergebnisse berücksichtigt, um YOLO11 schneller, genauer und effizienter zu machen. YOLO11 unterstützt dieselben Computer-Vision-Aufgaben wie YOLOv8, einschließlich Objekterkennung, Instanzsegmentierung und Bildklassifizierung. Anwender können problemlos auf YOLO11 umsteigen, ohne bestehende Arbeitsabläufe ändern zu müssen.
Eines der wichtigsten Highlights von YOLO11 ist die im Vergleich zu seinen Vorgängern überlegene Leistung in Bezug auf Genauigkeit und Geschwindigkeit. Mit 22 % weniger Parametern als YOLOv8m erreicht YOLO11m eine höhere durchschnittliche Genauigkeit (mAP) auf dem COCO , was bedeutet, dass es Objekte präziser und effizienter detect kann. In Bezug auf die Verarbeitungsgeschwindigkeit übertrifft YOLO11 frühere Modelle und ist damit ideal für Echtzeitanwendungen, bei denen eine schnelle Erkennung und Reaktion entscheidend sind und jede Millisekunde zählt.
Das nachstehende Benchmarking-Diagramm zeigt, wie sich YOLO11 von früheren Modellen abhebt. Auf der horizontalen Achse wird die durchschnittliche Präzision (AP)COCO angezeigt, die die Genauigkeit der Objekterkennung misst. Die vertikale Achse zeigt die Latenzzeit unter Verwendung von TensorRT10 FP16 auf einem NVIDIA GPU, die angibt, wie schnell das Modell Daten verarbeitet.

Mit der Einführung von Ultralytics YOLO11 erweitert Ultralytics die YOLO , indem es sowohl Open-Source- als auch Unternehmensmodelle anbietet, um der wachsenden Nachfrage in allen Branchen gerecht zu werden.

YOLO11 bietet fünf verschiedene Modellgrößen - Nano, Small, Medium, Large und X. Benutzer können das beste Modell je nach den spezifischen Anforderungen ihrer Computer-Vision-Anwendung wählen. Die fünf Größen bieten Flexibilität bei Aufgaben wie Bildklassifizierung, Objekterkennung, Instanzsegmentierung, Verfolgung, Posenschätzung und OBB-Objekterkennung (Oriented Bounding Boxes). Für jede Größe ist ein Modell für jede Aufgabe verfügbar, so dass insgesamt 25 Open-Source-Modelle den Kern des Ultralytics bilden. Diese Modelle eignen sich ideal für ein breites Spektrum von Anwendungen, von leichten Aufgaben auf Edge-Geräten, bei denen das Modell YOLO11n eine beeindruckende Effizienz bietet, bis hin zu größeren Anwendungen, die die Modelle YOLO11l und YOLO11x erfordern.
Ultralytics führt zum ersten Mal Unternehmensmodelle ein, was einen wichtigen Meilenstein in unserem Produktangebot darstellt, und wir freuen uns, diese neuen Innovationen mit unseren Benutzern zu teilen. YOLO11 führt fünf proprietäre Modelle ein, die speziell für kommerzielle Anwendungsfälle entwickelt wurden. Diese Unternehmensmodelle, die ab nächstem Monat verfügbar sein werden, werden auf Ultralytics' neuem proprietären Datensatz trainiert, der aus über 1 Million Bildern besteht und robustere vortrainierte Modelle bietet. Sie wurden für anspruchsvolle, reale Anwendungen entwickelt, wie z. B. die Analyse medizinischer Bilder und die Verarbeitung von Satellitenbildern, bei denen eine präzise Objekterkennung entscheidend ist.
Nachdem wir nun besprochen haben, was YOLO11 bietet, wollen wir einen Blick darauf werfen, was YOLO11 so besonders macht.
Eine der größten Herausforderungen bei der Entwicklung von YOLO11 war es, das richtige Gleichgewicht zwischen konkurrierenden Prioritäten zu finden: die Modelle kleiner, schneller und genauer zu machen. Glenn Jocher, Gründer und CEO von Ultralytics, erklärte: "DieArbeit an der YOLO und -Entwicklung ist eine echte Herausforderung, weil man in drei verschiedene Richtungen gehen will: Man will die Modelle kleiner machen, man will, dass sie genauer werden, aber man will auch, dass sie auf verschiedenen Plattformen wie CPU und GPU schneller sind. All das sind konkurrierende Interessen, also muss man Kompromisse eingehen und entscheiden, wo man Änderungen vornimmt." Trotz dieser Herausforderungen erreicht YOLO11 ein beeindruckendes Gleichgewicht und bietet sowohl Geschwindigkeits- als auch Genauigkeitsverbesserungen gegenüber früheren Versionen wie YOLOv8.

YOLO11 bringt wesentliche Verbesserungen wie eine verbesserte Merkmalsextraktion mit einer neu gestalteten Backbone- und Neck-Architektur, die zu einer präziseren Objekterkennung führt. Das Modell ist außerdem für Geschwindigkeit und Effizienz optimiert und bietet schnellere Verarbeitungszeiten bei gleichbleibend hoher Genauigkeit. Zusätzlich zu diesen Vorteilen istYOLO11 in hohem Maße anpassungsfähig an verschiedene Umgebungen und arbeitet nahtlos auf Edge-Geräten, Cloud-Plattformen und Systemen mit NVIDIA . Diese Anpassungsfähigkeit macht es zu einer idealen Wahl für Benutzer, die flexible Einsatzoptionen für verschiedene Hardwarekonfigurationen benötigen, von mobilen Geräten bis hin zu großen Servern.
Die Vielseitigkeit von YOLO11macht es zu einem zuverlässigen Werkzeug in vielen Branchen, insbesondere bei komplexen Anwendungsfällen. So funktioniert es beispielsweise nahtlos auf Edge-Geräten und kann für Anwendungen eingesetzt werden, die Echtzeitanalysen in Umgebungen mit begrenzter Rechenleistung erfordern. Ein hervorragendes Beispiel hierfür ist das autonome Fahren, bei dem Fahrzeuge in Sekundenbruchteilen Entscheidungen treffen müssen, um die Sicherheit aller zu gewährleisten. YOLO11 hilft dabei durch die Erkennung und Analyse von Objekten auf der Straße, wie Fußgängern oder anderen Autos, selbst unter schwierigen Bedingungen wie schlechten Lichtverhältnissen oder wenn Dinge teilweise verdeckt sind. Die schnelle und präzise Erkennung hilft, Unfälle zu vermeiden und sorgt dafür, dass selbstfahrende Fahrzeuge sicher navigieren können.

Ein weiteres interessantes Beispiel für die Reichweite von YOLO11ist seine Fähigkeit, orientierte Bounding Boxes (OBB) zu verarbeiten. Dies ist wichtig für die Erkennung von Objekten, die nicht perfekt ausgerichtet sind. Die OBB-Objekterkennung ist eine Funktion, die besonders in Branchen wie Landwirtschaft, Kartierung und Überwachung nützlich ist, wo Bilder oft gedrehte Objekte wie Pflanzen oder Gebäude in Luft- oder Satellitenbildern enthalten. Im Gegensatz zu herkömmlichen Modellen kann YOLO11 Objekte in jedem Winkel erkennen und liefert viel genauere Ergebnisse für Aufgaben, die Präzision erfordern.
Der Einstieg in YOLO11 ist einfach und leicht zugänglich, unabhängig davon, ob Sie die Codierung oder die Option ohne Code bevorzugen. Um mit YOLO11 durch Code zu arbeiten, können Sie das Ultralytics Python verwenden, um Modelle einfach zu trainieren und einzusetzen. Wenn Sie einen Ansatz ohne Code bevorzugen, können Sie mit Ultralytics HUB YOLO11 mit nur wenigen Klicks ausprobieren.
Um YOLO11 mit Python zu verwenden, müssen Sie zunächst das Ultralytics installieren. Je nach Ihren Präferenzen können Sie dies mit pip, conda oder Docker tun. Detaillierte Anweisungen und Best Practices für den Installationsprozess finden Sie in unserem Ultralytics . Sollten Sie bei der Installation der für YOLO11 erforderlichen Pakete auf Schwierigkeiten stoßen, finden Sie in unserem Leitfaden für häufige Probleme Lösungen und Tipps.
Sobald Sie das Ultralytics installiert haben, ist die Verwendung von YOLO11 ganz einfach. Das folgende Codeschnipsel führt Sie durch den Prozess des Ladens eines Modells, des Trainings, des Testens seiner Leistung und des Exports ins ONNX . Ausführlichere Beispiele und fortgeschrittene Anwendungen finden Sie in der offiziellen Ultralytics , wo Sie detaillierte Anleitungen und bewährte Verfahren finden, um das Beste aus YOLO11 herauszuholen.

Für Benutzer, die einen codefreien Ansatz bevorzugen, bietet Ultralytics HUB eine einfache Möglichkeit, YOLO11 mit nur wenigen Klicks zu trainieren und einzusetzen. Um mit HUB zu beginnen, erstellen Sie einfach ein Konto auf der Ultralytics HUB-Plattform, und Sie können mit dem Training und der Verwaltung Ihrer Modelle über eine intuitive Schnittstelle beginnen.
Die KI-Gemeinschaft treibt den Bereich der Computer Vision ständig voran, indem sie sich bemüht, schnellere und genauere Modelle für reale Anwendungen zu entwickeln. Ultralytics YOLO11 ist ein wichtiger Meilenstein in diesem Bestreben und bietet verbesserte Geschwindigkeit, Genauigkeit und Flexibilität. Es wurde für Echtzeit- und Randanwendungen entwickelt und ist damit ideal für Branchen wie das Gesundheitswesen und autonomes Fahren. Ganz gleich, ob Sie das Ultralytics Python oder den codefreien Ultralytics Hub verwenden, YOLO11 vereinfacht komplexe Vision AI-Aufgaben. Es bietet leistungsstarke Computer-Vision-Funktionen und ist damit eine gute Wahl für Entwickler und Unternehmen.
Besuchen Sie unser GitHub-Repository und treten Sie unserer aktiven Community bei, um mehr über KI zu erfahren. Entdecken Sie, wie Vision AI Innovationen in Branchen wie dem Gesundheitswesen und der Landwirtschaft vorantreibt.