Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Objekterkennung

Entdecken Sie die Leistungsfähigkeit der Objekterkennung – identifizieren und lokalisieren Sie Objekte in Bildern oder Videos mit modernsten Modellen wie YOLO. Erkunden Sie reale Anwendungen!

Die Objekterkennung ist eine grundlegende Aufgabe im Bereich Computer Vision (CV), bei der ein oder mehrere Objekte innerhalb eines Bildes oder Videos identifiziert und lokalisiert werden. Ziel ist es nicht nur, die Objekte zu klassifizieren, sondern auch ihre Position zu bestimmen, typischerweise durch Zeichnen eines Begrenzungsrahmens um jedes Objekt. Diese Technologie dient als Eckpfeiler für viele fortschrittliche Anwendungen der Künstlichen Intelligenz (KI) und ermöglicht es Maschinen, ihre physische Umgebung mit einem hohen Maß an Verständnis wahrzunehmen und zu interpretieren.

Wie funktioniert Objekterkennung?

Objekterkennungsmodelle werden typischerweise mit Deep Learning (DL), insbesondere mit Convolutional Neural Networks (CNNs), erstellt. Der Prozess umfasst das Einspeisen eines Bildes in das Netzwerk, das dann eine Liste der erkannten Objekte ausgibt, jedes mit einer Klassenbezeichnung (z. B. "Person", "Auto", "Hund"), einem Konfidenzwert und den Koordinaten seiner Bounding Box.

Moderne Objekterkennungsarchitekturen bestehen aus zwei Hauptteilen: einem Backbone zum Extrahieren von Merkmalen aus dem Eingabebild und einem Detection Head zum Vorhersagen der Bounding Boxes und Klassen. Diese Architekturen werden oft entweder als One-Stage- oder Two-Stage-Detektoren kategorisiert.

  • One-Stage Objektdetektoren: Modelle wie die Ultralytics YOLO-Familie führen die Erkennung in einem einzigen Durchgang durch, wodurch sie sehr schnell und für Echtzeit-Inferenz geeignet sind. Sie sagen alle Bounding Boxes und Klassenwahrscheinlichkeiten gleichzeitig voraus.
  • Two-Stage Object Detectors: Architekturen wie R-CNN und seine Varianten schlagen zuerst Regionen von Interesse vor und klassifizieren dann Objekte innerhalb dieser Regionen. Obwohl sie oft sehr genau sind, können sie langsamer sein als One-Stage-Detektoren.

Objekterkennung vs. andere CV-Aufgaben

Es ist wichtig, Objekterkennung von anderen verwandten Computer-Vision-Aufgaben zu unterscheiden:

  • Bildklassifizierung: Weist einem gesamten Bild eine einzelne Bezeichnung zu (z. B. "dies ist ein Bild von einer Katze"). Sie lokalisiert das Objekt nicht.
  • Bildsegmentierung: Klassifiziert jedes Pixel in einem Bild und liefert so einen präzisen Umriss von Objekten. Die Instanzsegmentierung unterscheidet zwischen verschiedenen Instanzen derselben Objektklasse, während die semantische Segmentierung alle Instanzen einer Klasse als eine Einheit behandelt.
  • Objektverfolgung: Eine Erweiterung der Objekterkennung, die ein bestimmtes Objekt über mehrere Frames in einem Video verfolgt und seine Identität im Laufe der Zeit beibehält. Sie können mehr in unserem Leitfaden zur Verfolgung bewegter Objekte in Videos erfahren.

Anwendungsfälle in der Praxis

Objekterkennung ist eine transformative Technologie, die in vielen Branchen eingesetzt wird.

  1. Autonome Fahrzeuge: In selbstfahrenden Autos ist die Objekterkennung von entscheidender Bedeutung, um Fußgänger, Radfahrer, andere Fahrzeuge und Verkehrssignale zu identifizieren, damit sicher navigiert werden kann. Unternehmen wie Waymo und Tesla haben stark in diese Technologie investiert, um ihre autonomen Systeme anzutreiben.
  2. KI in der Fertigung: In Montagelinien erkennen Detektionsmodelle automatisch Defekte oder überprüfen, ob Komponenten korrekt montiert sind. Dies verbessert die Qualitätskontrolle und steigert die Produktionseffizienz.
  3. Sicherheit und Überwachung: Automatisierte Systeme nutzen Objekterkennung, um unbefugte Personen, abgestellte Pakete oder ungewöhnliche Aktivitäten in Echtzeit zu identifizieren, wie in unserem Leitfaden zum Aufbau eines Sicherheitsalarmsystems beschrieben.
  4. KI im Gesundheitswesen: In der medizinischen Bildanalyse unterstützen Modelle Radiologen, indem sie Anomalien wie Tumore oder Frakturen in Röntgenaufnahmen und CT-Scans erkennen und hervorheben. In unserem Blog können Sie mehr über die Verwendung von YOLO11 zur Tumorerfassung lesen.
  5. KI in der Landwirtschaft: Drohnen und bodengestützte Roboter, die mit Objekterkennung ausgestattet sind, können die Gesundheit der Pflanzen überwachen, Schädlinge identifizieren und Erträge mit hoher Präzision schätzen.

Tools und Training

Die Entwicklung und Bereitstellung von Objekterkennungsmodellen umfasst ein reichhaltiges Ökosystem von Tools und Techniken.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert