Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024

Wie man Ultralytics YOLO11 für Objekterkennung verwendet

Abirami Vina

3 Minuten Lesezeit

29. November 2024

Erfahren Sie, wie das neue Ultralytics YOLO11-Modell für die Objekterkennung verwendet werden kann, um in verschiedenen Anwendungen in einer Reihe von Branchen eine höhere Präzision zu erzielen.

Computer Vision ist ein Bereich der künstlichen Intelligenz (KI), der Maschinen hilft, visuelle Informationen zu interpretieren und zu verstehen, um wichtige Aufgaben wie die Objekterkennung zu ermöglichen. Im Gegensatz zur Bildklassifizierung identifiziert die Objekterkennung nicht nur, welche Objekte sich in einem Bild befinden, sondern lokalisiert auch ihre genauen Positionen. Dies macht sie zu einem wichtigen Werkzeug für Vision-KI-Anwendungen wie selbstfahrende Autos, Echtzeit-Sicherheitssysteme und Lagerautomatisierung.

Im Laufe der Zeit ist die Technologie zur Objekterkennung fortschrittlicher und einfacher zu bedienen geworden. Ein wichtiger Schritt nach vorn wurde auf der jährlichen Hybridveranstaltung von Ultralytics, YOLO Vision 2024 (YV24), mit der Einführung des Ultralytics YOLO11-Modells bekannt gegeben. YOLO11 verbessert die Genauigkeit und Leistung und unterstützt gleichzeitig die gleichen Aufgaben wie YOLOv8, wodurch der Übergang für Benutzer früherer Modelle nahtlos erfolgt.

Abb. 1. Ein Beispiel für die Verwendung des Ultralytics YOLO11-Modells zur Objekterkennung.

In diesem Artikel werden wir aufschlüsseln, was Objekterkennung ist, wie sie sich von anderen Computer-Vision-Aufgaben unterscheidet, und ihre realen Anwendungen untersuchen. Wir werden Sie auch durch die Verwendung des YOLO11-Modells mit dem Ultralytics Python-Paket und der Ultralytics HUB-Plattform führen. Los geht's!

​​Was ist Objekterkennung?

Objekterkennung ist eine Kernaufgabe in der Computer Vision, die mehr leistet, als nur Objekte in einem Bild zu identifizieren. Im Gegensatz zur Bildklassifizierung, die nur feststellt, ob ein bestimmtes Objekt vorhanden ist, erkennt die Objekterkennung mehrere Objekte und lokalisiert ihre genauen Positionen mithilfe von Bounding Boxes. 

Es kann beispielsweise Gesichter in einem Gruppenfoto identifizieren und lokalisieren, Autos auf einer belebten Straße oder Produkte in einem Verkaufsregal. Die Kombination aus Objekterkennung und Lokalisierung macht es besonders nützlich für Anwendungen wie Überwachung, Crowd-Monitoring und automatisierte Bestandsverwaltung.

Abb. 2. Verwendung von YOLO11 zur Gesichtserkennung.

Was Objekterkennung von anderen Aufgaben wie semantischer oder Instanzsegmentierung unterscheidet, ist ihr Fokus und ihre Effizienz. 

Die semantische Segmentierung kennzeichnet jedes Pixel in einem Bild, unterscheidet aber nicht zwischen einzelnen Objekten desselben Typs (z. B. würden alle Gesichter auf einem Foto als „Gesicht“ gruppiert). Die Instanzsegmentierung geht noch weiter, indem sie jedes Objekt trennt und seine genaue Form umreißt, selbst bei Objekten derselben Klasse. 

Die Objekterkennung bietet jedoch einen schlankeren Ansatz, indem sie Objekte identifiziert und klassifiziert und gleichzeitig ihre Positionen markiert. Dies macht sie ideal für Echtzeitaufgaben wie die Erkennung von Gesichtern in Überwachungsvideos oder die Identifizierung von Hindernissen für autonome Fahrzeuge.

Anwendungsbereiche von YOLO11 und Objekterkennung

Die fortschrittlichen Objekterkennungsfunktionen von YOLO11 machen es in vielen Branchen nützlich. Werfen wir einen Blick auf einige Beispiele.

Verwendung von YOLO11 für Einzelhandelsanalysen

YOLO11 und Objekterkennung definieren die Einzelhandelsanalyse neu, indem sie Bestandsverwaltung und Regalüberwachung effizienter und genauer gestalten. Die Fähigkeit des Modells, Objekte schnell und zuverlässig zu erkennen, hilft Einzelhändlern, Lagerbestände zu verfolgen, Regale zu organisieren und Fehler bei der Inventur zu reduzieren.

Beispielsweise kann YOLO11 bestimmte Artikel wie Sonnenbrillen in einem Verkaufsregal erkennen. Aber warum sollte ein Einzelhändler ein Regal überwachen wollen? Die Bestückung und Organisation der Regale ist entscheidend, um sicherzustellen, dass die Kunden finden, was sie brauchen, was sich direkt auf den Umsatz auswirkt. Durch die Überwachung der Regale in Echtzeit können Einzelhändler schnell erkennen, wann Artikel zur Neige gehen, verlegt oder überfüllt sind, was ihnen hilft, eine organisierte und attraktive Auslage zu erhalten, die das Einkaufserlebnis verbessert.

Abb. 3. Ein Beispiel für die Verwendung von YOLO11 zur Erkennung von Produkten in Regalen.

YOLO11 in Smart-City-Anwendungen

Eine pulsierende Stadt ist auf einen reibungslosen Verkehrsfluss und sichere Straßen angewiesen, um effizient zu funktionieren, und YOLO11 kann dazu beitragen, dies zu ermöglichen. Tatsächlich können viele Smart-City-Anwendungen in YOLO11 integriert werden. 

Ein interessanter Fall ist die Verwendung von Objekterkennung zur Identifizierung von Nummernschildern an fahrenden Fahrzeugen. Auf diese Weise kann YOLO11 eine schnellere Mauterhebung, ein besseres Verkehrsmanagement und eine schnellere Durchsetzung von Vorschriften unterstützen. 

Abb. 4. Verwendung von Objekterkennung und YOLO11 zur Erkennung von Nummernschildern.

Erkenntnisse von Vision-AI-Systemen, die Straßen überwachen, können Behörden auf Verkehrsverstöße oder Staus aufmerksam machen, bevor diese sich zu größeren Problemen ausweiten. YOLO11 kann auch Fußgänger und Radfahrer erkennen, wodurch Straßen für alle sicherer und effizienter werden. 

Tatsächlich ist YOLO11 aufgrund seiner Fähigkeit, visuelle Daten zu verarbeiten, ein leistungsstarkes Werkzeug zur Verbesserung der städtischen Infrastruktur. So kann es beispielsweise dazu beitragen, die Ampelschaltung durch die Analyse von Fahrzeug- und Fußgängerbewegungen zu optimieren. Es kann auch die Sicherheit in Schulzonen erhöhen, indem es Kinder erkennt und Autofahrer auffordert, langsamer zu fahren. Mit YOLO11 können Städte proaktive Maßnahmen ergreifen, um Herausforderungen zu bewältigen und eine effizientere Umgebung für alle zu schaffen.

Echtzeit-Videoerkennung mit YOLO11: Erhöhung der Barrierefreiheit

Echtzeit-Objekterkennung bezieht sich auf die Fähigkeit eines Systems, Objekte in einem Live-Video-Feed zu identifizieren und zu klassifizieren, sobald sie erscheinen. YOLO11 ist auf überlegene Echtzeit-Performance ausgelegt und zeichnet sich durch die Unterstützung dieser Fähigkeit aus. Seine Anwendungen gehen über die reine Rationalisierung von Prozessen hinaus - es kann auch dazu beitragen, eine integrativere und zugänglichere Welt zu schaffen.

Beispielsweise kann YOLO11 sehbehinderten Menschen helfen, indem es Objekte in Echtzeit identifiziert. Basierend auf den Erkennungen können Audiobeschreibungen bereitgestellt werden, die den Benutzern helfen, sich selbstständiger in ihrer Umgebung zu bewegen.

Stellen Sie sich eine sehbehinderte Person vor, die Lebensmittel einkauft. Die Auswahl der richtigen Artikel kann eine Herausforderung sein, aber YOLO11 kann helfen. Wenn sie Artikel in ihren Einkaufswagen legen, könnte ein mit YOLO11 integriertes System verwendet werden, um jeden Artikel zu identifizieren – wie Bananen, Avocados oder eine Milchpackung – und Audiobeschreibungen in Echtzeit bereitzustellen. Dies ermöglicht es ihnen, ihre Auswahl zu bestätigen und sicherzustellen, dass sie alles haben, was sie brauchen. Durch das Erkennen alltäglicher Gegenstände kann YOLO11 das Einkaufen vereinfachen.

Abb. 5. Objekterkennung kann dazu beitragen, die Welt für Sehbehinderte zugänglicher zu machen.

Schritt-für-Schritt-Anleitung zur Objekterkennung mit YOLO11 

Nachdem wir nun die Grundlagen der Objekterkennung und ihre vielfältigen Anwendungen behandelt haben, wollen wir uns ansehen, wie Sie mit dem Ultralytics YOLO11-Modell für Aufgaben wie die Objekterkennung beginnen können.

Es gibt zwei einfache Möglichkeiten, YOLO11 zu verwenden: über das Ultralytics Python-Paket oder den Ultralytics HUB. Wir werden beide Methoden untersuchen, beginnend mit dem Python-Paket.

Inferenzläufe mit YOLO11 durchführen

Inferenz bedeutet, dass ein KI-Modell neue, unbekannte Daten analysiert, um Vorhersagen zu treffen, Informationen zu klassifizieren oder Erkenntnisse zu liefern, die auf dem basieren, was es während des Trainings gelernt hat. In Bezug auf die Objekterkennung bedeutet dies, bestimmte Objekte innerhalb eines Bildes oder Videos zu identifizieren und zu lokalisieren, Begrenzungsrahmen um sie herum zu zeichnen und sie basierend auf dem Training des Modells zu beschriften.

Um mit dem YOLO11-Objekterkennungsmodell Inferenz zu betreiben, müssen Sie zunächst das Ultralytics Python-Paket über pip, conda oder Docker installieren. Wenn Sie auf Installationsprobleme stoßen, lesen Sie den Leitfaden zur Fehlerbehebung für Tipps und Tricks, die Ihnen bei der Lösung helfen. Nach der Installation können Sie den folgenden Code verwenden, um das YOLO11-Objekterkennungsmodell zu laden und Vorhersagen für ein Bild zu treffen.

Abb. 6. Ausführen einer Inferenz auf einem Bild mit YOLO11n.

Training eines benutzerdefinierten YOLO11-Modells

YOLO11 unterstützt auch benutzerdefiniertes Training, um Ihre spezifischen Anwendungsfälle besser zu erfüllen. Durch die Feinabstimmung des Modells können Sie es so anpassen, dass es Objekte erkennt, die für Ihr Projekt relevant sind. Wenn Sie beispielsweise Computer Vision im Gesundheitswesen einsetzen, könnte ein benutzerdefiniert trainiertes YOLO11-Modell verwendet werden, um spezifische Anomalien in medizinischen Bildern zu erkennen, wie z. B. Tumore in MRT-Scans oder Frakturen in Röntgenaufnahmen, wodurch Ärzte schnellere und genauere Diagnosen stellen können.

Der folgende Code-Schnipsel zeigt, wie man ein YOLO11-Modell für die Objekterkennung lädt und trainiert. Sie können mit einer YAML-Konfigurationsdatei oder einem vortrainierten Modell beginnen, Gewichte übertragen und auf Datensätzen wie COCO trainieren, um eine verfeinerte Objekterkennung zu erzielen.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.yaml")  # build a new model from YAML
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Nach dem Trainieren eines Modells können Sie das trainierte Modell auch in verschiedenen Formaten exportieren, um es in unterschiedlichen Umgebungen bereitzustellen.

YOLO11 Objekterkennung auf Ultralytics HUB

Für diejenigen, die eine No-Code-Alternative suchen, bietet Ultralytics HUB eine benutzerfreundliche Vision-KI-Plattform zum Trainieren und Bereitstellen von YOLO-Modellen, einschließlich YOLO11.

Um die Objekterkennung auf Bildern auszuführen, erstellen Sie einfach ein Konto, navigieren Sie zum Abschnitt „Modelle“ und wählen Sie die YOLO11-Objekterkennungsvariante aus. Laden Sie Ihr Bild hoch, und die Plattform zeigt die erkannten Objekte in einem Vorschaubereich an.

Abb. 7. Ausführen von Inferenz auf Ultralytics HUB.

Durch die Kombination der Flexibilität des Python-Pakets mit der Benutzerfreundlichkeit des HUB macht es YOLO11 Entwicklern und Unternehmen gleichermaßen leicht, die Leistungsfähigkeit fortschrittlicher Objekterkennungstechnologie zu nutzen.

Wesentliche Erkenntnisse

YOLO11 setzt einen neuen Standard in der Objekterkennung und kombiniert hohe Genauigkeit mit Vielseitigkeit, um die Anforderungen verschiedener Branchen zu erfüllen. Von der Verbesserung der Einzelhandelsanalyse bis hin zur Verwaltung der Infrastruktur intelligenter Städte ist YOLO11 auf zuverlässige Echtzeitleistung in unzähligen Anwendungen ausgelegt.

Mit Optionen für benutzerdefiniertes Training und einer einfach zu bedienenden Oberfläche über Ultralytics HUB war die Integration von YOLO11 in Ihre Arbeitsabläufe noch nie so einfach. Egal, ob Sie ein Entwickler sind, der Computer Vision erforscht, oder ein Unternehmen, das mit KI Innovationen entwickeln möchte, YOLO11 bietet Ihnen die Werkzeuge, die Sie für den Erfolg benötigen.

Um mehr zu erfahren, besuchen Sie unser GitHub-Repository und treten Sie mit unserer Community in Kontakt. Entdecken Sie KI-Anwendungen in selbstfahrenden Autos und Computer Vision für die Landwirtschaft auf unseren Lösungsseiten. 🚀

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens

Kostenlos starten
Link in die Zwischenablage kopiert