So verwenden Sie Ultralytics YOLO11 zur Objekterkennung

Abirami Vina

3 Minuten lesen

29. November 2024

Erfahren Sie, wie das neue Ultralytics YOLO11-Modell für die Objekterkennung eingesetzt werden kann, um eine höhere Präzision bei verschiedenen Anwendungen in unterschiedlichen Branchen zu erreichen.

Computer Vision ist ein Bereich der künstlichen Intelligenz (AI), der Maschinen hilft, visuelle Informationen zu interpretieren und zu verstehen, um wichtige Aufgaben wie die Objekterkennung zu ermöglichen. Anders als bei der Bildklassifizierung wird bei der Objekterkennung nicht nur festgestellt, welche Objekte sich in einem Bild befinden, sondern auch deren genaue Position ermittelt. Dies macht sie zu einem wichtigen Werkzeug für KI-Anwendungen wie selbstfahrende Autos, Echtzeit-Sicherheitssysteme und Lagerautomatisierung.

Die Technologie zur Objekterkennung ist im Laufe der Zeit immer fortschrittlicher und benutzerfreundlicher geworden. Auf der jährlichen Hybrid-Veranstaltung von Ultralytics, der YOLO Vision 2024 (YV24), wurde mit der Einführung des Ultralytics YOLO11-Modells ein großer Schritt nach vorn angekündigt. YOLO11 verbessert die Genauigkeit und Leistung und unterstützt dabei dieselben Aufgaben wie YOLOv8, so dass die Benutzer früherer Modelle nahtlos umsteigen können.

Abb. 1. Ein Beispiel für die Verwendung des Ultralytics YOLO11-Modells zur Objekterkennung.

In diesem Artikel werden wir aufschlüsseln, was Objekterkennung ist, wie sie sich von anderen Computer-Vision-Aufgaben unterscheidet, und ihre realen Anwendungen untersuchen. Wir zeigen Ihnen auch, wie Sie das YOLO11-Modell mit dem Ultralytics Python-Paket und der Ultralytics HUB-Plattform verwenden können. Legen wir los!

Was ist Objekterkennung?

Die Objekterkennung ist eine Kernaufgabe der Computer Vision, die mehr als nur die Identifizierung von Objekten in einem Bild umfasst. Anders als bei der Bildklassifizierung, bei der nur festgestellt wird, ob ein bestimmtes Objekt vorhanden ist, werden bei der Objekterkennung mehrere Objekte erkannt und ihre genaue Position mithilfe von Begrenzungsrahmen bestimmt. 

So können beispielsweise Gesichter auf einem Gruppenfoto, Autos auf einer belebten Straße oder Produkte in einem Ladenregal erkannt und lokalisiert werden. Die Kombination von Objekterkennung und Lokalisierung macht sie besonders nützlich für Anwendungen wie Überwachung, Beobachtung von Menschenmengen und automatisierte Bestandsverwaltung.

Abb. 2. Verwendung von YOLO11 zur Erkennung von Gesichtern.

Was die Objekterkennung von anderen Aufgaben wie der semantischen oder der Instanzensegmentierung unterscheidet, ist ihr Fokus und ihre Effizienz. 

Die semantische Segmentierung kennzeichnet jedes Pixel in einem Bild, unterscheidet aber nicht zwischen einzelnen Objekten desselben Typs (z. B. würden alle Gesichter in einem Foto als "Gesicht" gruppiert werden). Die Instanzsegmentierung geht noch einen Schritt weiter, indem sie jedes Objekt trennt und seine genaue Form beschreibt, selbst bei Objekten der gleichen Klasse. 

Die Objekterkennung hingegen bietet einen effizienteren Ansatz, indem sie Objekte identifiziert und klassifiziert und gleichzeitig ihre Position markiert. Dies macht sie ideal für Echtzeitaufgaben wie die Erkennung von Gesichtern in Sicherheitsvideos oder die Identifizierung von Hindernissen für autonome Fahrzeuge.

Anwendungen von YOLO11 und Objekterkennung

Die fortschrittlichen Objekterkennungsfunktionen von YOLO11 machen es in vielen Branchen nützlich. Werfen wir einen Blick auf einige Beispiele.

Verwendung von YOLO11 für die Einzelhandelsanalytik

YOLO11 und die Objekterkennung definieren die Einzelhandelsanalytik neu, indem sie die Bestandsverwaltung und Regalüberwachung effizienter und genauer machen. Die Fähigkeit des Modells, Objekte schnell und zuverlässig zu erkennen, hilft Einzelhändlern dabei, Lagerbestände zu verfolgen, Regale zu organisieren und Fehler bei der Bestandszählung zu reduzieren.

YOLO11 kann zum Beispiel bestimmte Artikel wie Sonnenbrillen in einem Regal erkennen. Aber warum sollte ein Einzelhändler ein Regal überwachen wollen? Ein gut gefülltes und organisiertes Regal ist entscheidend dafür, dass die Kunden finden, was sie brauchen, was sich direkt auf den Umsatz auswirkt. Durch die Überwachung von Regalen in Echtzeit können Einzelhändler schnell erkennen, wenn Artikel zur Neige gehen, verlegt werden oder überfüllt sind. Das hilft ihnen, eine geordnete und attraktive Auslage aufrechtzuerhalten, die das Einkaufserlebnis verbessert.

Abb. 3. Ein Beispiel für die Verwendung von YOLO11 zur Erkennung von Produkten in Regalen.

YOLO11 in Smart-City-Anwendungen

Eine belebte Stadt ist auf einen reibungslosen Verkehrsfluss und sichere Straßen angewiesen, um effizient zu funktionieren, und YOLO11 kann dazu beitragen, dies zu ermöglichen. Tatsächlich können viele Smart-City-Anwendungen mit YOLO11 integriert werden. 

Ein interessanter Fall ist die Verwendung der Objekterkennung zur Erkennung von Nummernschildern an fahrenden Fahrzeugen. Auf diese Weise kann YOLO11 eine schnellere Mauterhebung, ein besseres Verkehrsmanagement und eine schnellere Durchsetzung von Vorschriften unterstützen. 

Abb. 4. Verwendung von Objekterkennung und YOLO11 zur Erkennung von Nummernschildern.

Erkenntnisse aus Vision AI-Systemen, die Straßen überwachen, können Behörden auf Verkehrsverstöße oder Staus aufmerksam machen, bevor diese zu größeren Problemen eskalieren. YOLO11 kann auch Fußgänger und Radfahrer erkennen und so die Straßen für alle sicherer und effizienter machen. 

Die Fähigkeit von YOLO11, visuelle Daten zu verarbeiten, macht es zu einem leistungsstarken Werkzeug zur Verbesserung der städtischen Infrastruktur. Zum Beispiel kann es helfen, die Ampelschaltung zu optimieren, indem es die Bewegungen von Fahrzeugen und Fußgängern analysiert. Es kann auch die Sicherheit in Schulzonen erhöhen, indem es Kinder erkennt und die Fahrer warnt, langsamer zu fahren. Mit YOLO11 können Städte proaktive Maßnahmen ergreifen, um Herausforderungen anzugehen und eine effizientere Umgebung für alle zu schaffen.

Videodetektion in Echtzeit mit YOLO11: Verbesserung der Zugänglichkeit

Unter Objekterkennung in Echtzeit versteht man die Fähigkeit eines Systems, Objekte in einem Live-Video-Feed zu identifizieren und zu klassifizieren, sobald sie erscheinen. YOLO11 wurde für eine überragende Echtzeitleistung entwickelt und unterstützt diese Fähigkeit in hervorragender Weise. Seine Anwendungen gehen über die reine Rationalisierung von Prozessen hinaus - es kann auch dazu beitragen, eine integrativere und zugänglichere Welt zu schaffen.

So kann YOLO11 beispielsweise sehbehinderte Personen durch die Erkennung von Objekten in Echtzeit unterstützen. Auf der Grundlage der Erkennungen können Audiobeschreibungen bereitgestellt werden, die den Nutzern helfen, sich in ihrer Umgebung unabhängiger zu bewegen.

Stellen Sie sich vor, eine sehbehinderte Person kauft Lebensmittel ein. Die richtigen Artikel auszusuchen, kann eine Herausforderung sein, aber YOLO11 kann dabei helfen. Während sie Artikel in ihren Einkaufswagen legen, könnte ein in YOLO11 integriertes System jeden Artikel identifizieren - wie Bananen, Avocados oder eine Packung Milch - und in Echtzeit Audiobeschreibungen liefern. So können sie ihre Auswahl bestätigen und sicherstellen, dass sie alles haben, was sie brauchen. Durch die Erkennung von Alltagsgegenständen kann YOLO11 das Einkaufen einfacher machen.

Abb. 5. Die Objekterkennung kann dazu beitragen, die Welt für sehbehinderte Menschen zugänglicher zu machen.

Schritt-für-Schritt-Anleitung zur Objekterkennung mit YOLO11 

Nachdem wir nun die Grundlagen der Objekterkennung und ihre vielfältigen Anwendungsmöglichkeiten behandelt haben, wollen wir uns nun damit beschäftigen, wie Sie das Ultralytics YOLO11-Modell für Aufgaben wie die Objekterkennung einsetzen können.

Es gibt zwei einfache Möglichkeiten, YOLO11 zu verwenden: über das Ultralytics Python-Paket oder den Ultralytics HUB. Beginnen wir mit dem Python-Paket, um beide Methoden kennenzulernen.

Inferenzen mit YOLO11 durchführen

Inferencing bedeutet, dass ein KI-Modell neue, ungesehene Daten analysiert, um Vorhersagen zu treffen, Informationen zu klassifizieren oder Erkenntnisse zu gewinnen, die auf dem basieren, was es beim Training gelernt hat. In Bezug auf die Objekterkennung bedeutet dies, dass bestimmte Objekte in einem Bild oder Video identifiziert und lokalisiert werden, dass Begrenzungsrahmen um sie herum gezeichnet werden und dass sie auf der Grundlage des Trainings des Modells gekennzeichnet werden.

Um mit dem YOLO11-Objekterkennungsmodell Rückschlüsse ziehen zu können, müssen Sie zunächst das Ultralytics-Python-Paket über pip, conda oder Docker installieren. Sollten bei der Installation Probleme auftreten, finden Sie in der Anleitung zur Fehlerbehebung Tipps und Tricks, die Ihnen bei der Lösung dieser Probleme helfen. Nach der Installation können Sie den folgenden Code verwenden, um das YOLO11-Objekterkennungsmodell zu laden und Vorhersagen für ein Bild zu treffen.

Abb. 6. Durchführung einer Inferenz auf ein Bild mit YOLO11n.

Training eines benutzerdefinierten YOLO11-Modells

YOLO11 unterstützt auch benutzerdefiniertes Training, um Ihren spezifischen Anwendungsfällen besser gerecht zu werden. Durch Feinabstimmung des Modells können Sie es so anpassen, dass es für Ihr Projekt relevante Objekte erkennt. Bei der Verwendung von Computer Vision im Gesundheitswesen könnte ein individuell trainiertes YOLO11-Modell beispielsweise dazu verwendet werden, bestimmte Anomalien in medizinischen Bildern zu erkennen, wie z. B. Tumore in MRT-Scans oder Frakturen in Röntgenbildern, und Ärzten helfen, schnellere und genauere Diagnosen zu stellen.

Das folgende Code-Snippet zeigt, wie Sie ein YOLO11-Modell für die Objekterkennung laden und trainieren. Sie können von einer YAML-Konfigurationsdatei oder einem vortrainierten Modell ausgehen, Gewichte übertragen und auf Datensätzen wie COCO trainieren, um die Objekterkennung zu verfeinern.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.yaml")  # build a new model from YAML
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Nachdem Sie ein Modell trainiert haben, können Sie das trainierte Modell auch in verschiedenen Formaten exportieren, um es in unterschiedlichen Umgebungen einzusetzen.

YOLO11-Objekterkennung auf Ultralytics HUB

Für diejenigen, die eine Alternative ohne Code suchen, bietet Ultralytics HUB eine einfach zu bedienende Vision AI-Plattform für das Training und den Einsatz von YOLO-Modellen, einschließlich YOLO11.

Um die Objekterkennung auf Bildern durchzuführen, erstellen Sie einfach ein Konto, navigieren Sie zum Abschnitt "Modelle" und wählen Sie die YOLO11-Objekterkennungsmodellvariante. Laden Sie Ihr Bild hoch, und die Plattform zeigt die erkannten Objekte in einem Vorschaubereich an.

Abb. 7. Durchführung von Schlussfolgerungen auf Ultralytics HUB.

Durch die Kombination der Flexibilität des Python-Pakets mit der Einfachheit des HUBs macht YOLO11 es Entwicklern und Unternehmen gleichermaßen leicht, die Leistungsfähigkeit der fortschrittlichen Objekterkennungstechnologie zu nutzen.

Die wichtigsten Erkenntnisse

YOLO11 setzt einen neuen Standard in der Objekterkennung und kombiniert hohe Genauigkeit mit Vielseitigkeit, um die Anforderungen verschiedener Branchen zu erfüllen. Von der Verbesserung der Einzelhandelsanalyse bis hin zur Verwaltung von Smart-City-Infrastrukturen - YOLO11 ist für eine zuverlässige Leistung in Echtzeit bei unzähligen Anwendungen ausgelegt.

Mit Optionen für benutzerdefinierte Schulungen und einer benutzerfreundlichen Schnittstelle über Ultralytics HUB war die Integration von YOLO11 in Ihre Arbeitsabläufe noch nie so einfach. Ganz gleich, ob Sie ein Entwickler sind, der sich mit Computer Vision beschäftigt, oder ein Unternehmen, das mit KI innovieren möchte, YOLO11 bietet Ihnen die Werkzeuge, die Sie für Ihren Erfolg benötigen.

Wenn Sie mehr erfahren möchten, besuchen Sie unser GitHub-Repository und beteiligen Sie sich an unserer Community. Entdecken Sie KI-Anwendungen für selbstfahrende Autos und Computer Vision für die Landwirtschaft auf unseren Lösungsseiten. 🚀

Lassen Sie uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise in die Zukunft des maschinellen Lernens

Kostenloser Start
Link in die Zwischenablage kopiert