Objekterkennung mit YOLO11: Ultralytics Tutorial

Computer Vision ist ein Bereich der künstlichen Intelligenz (KI), der Maschinen hilft, visuelle Informationen zu interpretieren und zu verstehen, um wichtige Aufgaben wie die Objekterkennung zu ermöglichen. Im Gegensatz zur Bildklassifizierung identifiziert die Objekterkennung nicht nur, welche Objekte sich in einem Bild befinden, sondern lokalisiert auch ihre genauen Positionen. Dies macht sie zu einem wichtigen Werkzeug für Vision-KI-Anwendungen wie selbstfahrende Autos, Echtzeit-Sicherheitssysteme und Lagerautomatisierung.

Die Technologie zur Objekterkennung ist im Laufe der Zeit immer fortschrittlicher und benutzerfreundlicher geworden. Auf der jährlichen Hybrid-Veranstaltung von Ultralytics, der YOLO Vision 2024 (YV24), wurde mit der Einführung des Ultralytics YOLO11 ein großer Schritt nach vorn angekündigt. YOLO11 verbessert die Genauigkeit und Leistung und unterstützt die gleichen Aufgaben wie YOLOv8und erleichtert den Nutzern der Vorgängermodelle den nahtlosen Umstieg.

Abb. 1. Ein Beispiel für die Verwendung des Ultralytics YOLO11 zur Objekterkennung.

‍

In diesem Artikel werden wir aufschlüsseln, was Objekterkennung ist, wie sie sich von anderen Computer-Vision-Aufgaben unterscheidet, und ihre realen Anwendungen untersuchen. Wir zeigen Ihnen auch, wie Sie das YOLO11 mit dem Ultralytics Python und der Ultralytics HUB-Plattform verwenden können. Legen wir los!

Was ist Objekterkennung?

Objekterkennung ist eine Kernaufgabe in der Computer Vision, die mehr leistet, als nur Objekte in einem Bild zu identifizieren. Im Gegensatz zur Bildklassifizierung, die nur feststellt, ob ein bestimmtes Objekt vorhanden ist, erkennt die Objekterkennung mehrere Objekte und lokalisiert ihre genauen Positionen mithilfe von Bounding Boxes.

Es kann beispielsweise Gesichter in einem Gruppenfoto identifizieren und lokalisieren, Autos auf einer belebten Straße oder Produkte in einem Verkaufsregal. Die Kombination aus Objekterkennung und Lokalisierung macht es besonders nützlich für Anwendungen wie Überwachung, Crowd-Monitoring und automatisierte Bestandsverwaltung.

Abb. 2. Verwendung von YOLO11 zur detect Gesichtern.

‍

Was Objekterkennung von anderen Aufgaben wie semantischer oder Instanzsegmentierung unterscheidet, ist ihr Fokus und ihre Effizienz.

Die semantische Segmentierung kennzeichnet jedes Pixel in einem Bild, unterscheidet aber nicht zwischen einzelnen Objekten desselben Typs (z. B. würden alle Gesichter auf einem Foto als „Gesicht“ gruppiert). Die Instanzsegmentierung geht noch weiter, indem sie jedes Objekt trennt und seine genaue Form umreißt, selbst bei Objekten derselben Klasse.

Die Objekterkennung bietet jedoch einen schlankeren Ansatz, indem sie Objekte identifiziert und klassifiziert und gleichzeitig ihre Positionen markiert. Dies macht sie ideal für Echtzeitaufgaben wie die Erkennung von Gesichtern in Überwachungsvideos oder die Identifizierung von Hindernissen für autonome Fahrzeuge.

Anwendungen von YOLO11 und Objekterkennung

Die fortschrittlichen Objekterkennungsfunktionen von YOLO11 machen es in vielen Branchen nützlich. Werfen wir einen Blick auf einige Beispiele.

Verwendung von YOLO11 für die Einzelhandelsanalytik

YOLO11 und die Objekterkennung definieren die Einzelhandelsanalytik neu, indem sie die Bestandsverwaltung und Regalüberwachung effizienter und genauer machen. Die Fähigkeit des Modells, Objekte schnell und zuverlässig detect , hilft Einzelhändlern dabei, Lagerbestände track , Regale zu organisieren und Fehler bei der Bestandszählung zu reduzieren.

Zum Beispiel, YOLO11 bestimmte Artikel wie Sonnenbrillen in einem Ladenregal detect . Aber warum sollte ein Einzelhändler ein Regal überwachen wollen? Ein gut gefülltes und organisiertes Regal ist entscheidend dafür, dass die Kunden finden, was sie brauchen, was sich direkt auf den Umsatz auswirkt. Durch die Überwachung von Regalen in Echtzeit können Einzelhändler schnell erkennen, wenn Artikel zur Neige gehen, verlegt werden oder überfüllt sind. Das hilft ihnen, eine geordnete und attraktive Auslage aufrechtzuerhalten, die das Einkaufserlebnis verbessert.

Abb. 3. Ein Beispiel für die Verwendung von YOLO11 zur detect Produkten in Regalen.

‍

YOLO11 in Smart-City-Anwendungen

Eine belebte Stadt ist auf einen reibungslosen Verkehrsfluss und sichere Straßen angewiesen, um effizient zu funktionieren, und YOLO11 kann dazu beitragen, dies zu ermöglichen. Tatsächlich können viele Smart-City-Anwendungen mit YOLO11 integriert werden.

Ein interessanter Fall ist die Verwendung der Objekterkennung zur Erkennung von Nummernschildern an fahrenden Fahrzeugen. Auf diese Weise kann YOLO11 eine schnellere Mauterhebung, ein besseres Verkehrsmanagement und eine schnellere Durchsetzung von Vorschriften unterstützen.

Abb. 4. Verwendung von Objekterkennung und YOLO11 zur detect Nummernschildern.

‍

Erkenntnisse aus Vision AI-Systemen, die Straßen überwachen, können die Behörden auf Verkehrsverstöße oder Staus aufmerksam machen, bevor diese zu größeren Problemen eskalieren. YOLO11 kann auch Fußgänger und Radfahrer detect und so die Straßen für alle sicherer und effizienter machen.

Die Fähigkeit von YOLO11, visuelle Daten zu verarbeiten, macht es zu einem leistungsstarken Werkzeug zur Verbesserung der städtischen Infrastruktur. Zum Beispiel kann es helfen, die Ampelschaltung zu optimieren, indem es die Bewegungen von Fahrzeugen und Fußgängern analysiert. Es kann auch die Sicherheit in Schulzonen erhöhen, indem es Kinder erkennt und die Fahrer warnt, langsamer zu fahren. Mit YOLO11 können Städte proaktive Maßnahmen ergreifen, um Herausforderungen anzugehen und eine effizientere Umgebung für alle zu schaffen.

Videodetektion in Echtzeit mit YOLO11: Verbesserung der Zugänglichkeit

Unter Objekterkennung in Echtzeit versteht man die Fähigkeit eines Systems, Objekte in einem Live-Video-Feed zu identifizieren und zu classify , sobald sie erscheinen. YOLO11 wurde für eine überragende Echtzeitleistung entwickelt und unterstützt diese Fähigkeit in hervorragender Weise. Seine Anwendungen gehen über die bloße Rationalisierung von Prozessen hinaus - es kann auch dazu beitragen, eine integrativere und zugänglichere Welt zu schaffen.

Zum Beispiel, YOLO11 sehbehinderte Personen durch die Erkennung von Objekten in Echtzeit unterstützen. Auf der Grundlage der Erkennungen können Audiobeschreibungen bereitgestellt werden, die den Nutzern helfen, sich in ihrer Umgebung unabhängiger zu bewegen.

Stellen Sie sich vor, eine sehbehinderte Person kauft Lebensmittel ein. Die richtigen Artikel auszusuchen, kann eine Herausforderung sein, aber YOLO11 kann dabei helfen. Während sie Artikel in ihren Einkaufswagen legen, könnte ein in YOLO11 integriertes System jeden Artikel identifizieren - wie Bananen, Avocados oder eine Packung Milch - und in Echtzeit Audiobeschreibungen liefern. So können sie ihre Auswahl bestätigen und sicherstellen, dass sie alles haben, was sie brauchen. Durch die Erkennung von Alltagsgegenständen kann YOLO11 das Einkaufen einfacher machen.

Abb. 5. Objekterkennung kann dazu beitragen, die Welt für Sehbehinderte zugänglicher zu machen.

‍

Schritt-für-Schritt-Anleitung zur Objekterkennung mit YOLO11

Nachdem wir nun die Grundlagen der Objekterkennung und ihre vielfältigen Anwendungsmöglichkeiten behandelt haben, wollen wir uns nun damit beschäftigen, wie Sie das Ultralytics YOLO11 für Aufgaben wie die Objekterkennung einsetzen können.

Es gibt zwei einfache Möglichkeiten, YOLO11 zu verwenden: über das Ultralytics Python oder den Ultralytics HUB. Beginnen wir mit dem Python , um beide Methoden kennenzulernen.

Inferenzen mit YOLO11 durchführen

Inferencing bedeutet, dass ein KI-Modell neue, ungesehene Daten analysiert, um Vorhersagen zu treffen, Informationen classify oder Erkenntnisse zu liefern, die auf dem basieren, was es beim Training gelernt hat. In Bezug auf die Objekterkennung bedeutet dies, dass bestimmte Objekte in einem Bild oder Video identifiziert und lokalisiert werden, dass Begrenzungsrahmen um sie herum gezeichnet werden und dass sie auf der Grundlage des Trainings des Modells gekennzeichnet werden.

Um das YOLO11 zu verwenden, müssen Sie zunächst das Ultralytics Python über pip, conda oder Docker installieren. Sollten bei der Installation Probleme auftreten, finden Sie in der Anleitung zur Fehlerbehebung Tipps und Tricks, die Ihnen bei der Lösung dieser Probleme helfen. Nach der Installation können Sie den folgenden Code verwenden, um das YOLO11 zu laden und Vorhersagen für ein Bild zu treffen.

Abb. 6. Ausführen einer Inferenz auf einem Bild mit YOLO11n.

‍

Training eines benutzerdefinierten YOLO11

YOLO11 unterstützt auch benutzerdefiniertes Training, um Ihren spezifischen Anwendungsfällen besser gerecht zu werden. Durch Feinabstimmung des Modells können Sie es so anpassen, dass es für Ihr Projekt relevante Objekte detect . Bei der Verwendung von Computer Vision im Gesundheitswesen könnte ein individuell trainiertes YOLO11 beispielsweise dazu verwendet werden, bestimmte Anomalien in medizinischen Bildern detect , wie z. B. Tumore in MRT-Scans oder Frakturen in Röntgenbildern, und Ärzten helfen, schnellere und genauere Diagnosen zu stellen.

Das folgende Code-Snippet zeigt, wie Sie ein YOLO11 zur Objekterkennung laden und trainieren. Sie können von einer YAML-Konfigurationsdatei oder einem vortrainierten Modell ausgehen, Gewichte übertragen und auf Datensätzen wie COCO trainieren, um die Objekterkennung zu verfeinern.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.yaml")  # build a new model from YAML
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Nach dem Trainieren eines Modells können Sie das trainierte Modell auch in verschiedenen Formaten exportieren, um es in unterschiedlichen Umgebungen bereitzustellen.

YOLO11 auf Ultralytics HUB

Für diejenigen, die eine codefreie Alternative suchen, bietet Ultralytics HUB eine einfach zu bedienende Vision AI-Plattform für das Training und die Bereitstellung von YOLO , einschließlich YOLO11.

Um die Objekterkennung auf Bildern durchzuführen, erstellen Sie einfach ein Konto, navigieren Sie zum Abschnitt "Modelle" und wählen Sie die YOLO11 . Laden Sie Ihr Bild hoch, und die Plattform zeigt die erkannten Objekte in einem Vorschaubereich an.

Abb. 7. Durchführung von Schlussfolgerungen auf Ultralytics HUB.

‍

Durch die Kombination der Flexibilität des Python mit der Einfachheit des HUBs macht YOLO11 es Entwicklern und Unternehmen gleichermaßen leicht, die Leistungsfähigkeit der fortschrittlichen Objekterkennungstechnologie zu nutzen.

Wesentliche Erkenntnisse

YOLO11 setzt einen neuen Standard in der Objekterkennung und kombiniert hohe Genauigkeit mit Vielseitigkeit, um die Anforderungen verschiedener Branchen zu erfüllen. Von der Verbesserung der Einzelhandelsanalyse bis hin zur Verwaltung von Smart-City-Infrastrukturen - YOLO11 ist für eine zuverlässige Leistung in Echtzeit bei unzähligen Anwendungen ausgelegt.

Mit Optionen für benutzerdefinierte Schulungen und einer benutzerfreundlichen Schnittstelle durch Ultralytics HUB war die Integration von YOLO11 in Ihre Arbeitsabläufe noch nie so einfach. Ganz gleich, ob Sie ein Entwickler sind, der sich mit Computer Vision beschäftigt, oder ein Unternehmen, das mit KI innovieren möchte, YOLO11 bietet Ihnen die Werkzeuge, die Sie für Ihren Erfolg benötigen.

Um mehr zu erfahren, besuchen Sie unser GitHub-Repository und treten Sie mit unserer Community in Kontakt. Entdecken Sie KI-Anwendungen in selbstfahrenden Autos und Computer Vision für die Landwirtschaft auf unseren Lösungsseiten. 🚀

So verwenden Sie Ultralytics YOLO11 zur Objekterkennung

Was ist Objekterkennung?

Anwendungen von YOLO11 und Objekterkennung