Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Ultralytics YOLO

Erkundung der Datenkennzeichnung für Computer-Vision-Projekte

Lies unsere umfassende Analyse zur Datenkennzeichnung (Data Labeling) für Computer-Vision-Projekte und lerne, wie du visuelle Daten markierst und warum dies so wichtig ist.

ABAbirami Vina4 min read
Datenkennzeichnung für Computer-Vision-Projekte

Künstliche Intelligenz (KI) konzentriert sich darauf, Maschinen menschenähnliche Fähigkeiten zu verleihen. Eine der beliebtesten Methoden hierfür ist das überwachte Lernen. Mit anderen Worten: Wenn du KI-Modelle durch das Zeigen von gelabelten Beispielen unterrichtest, können sie aus Mustern lernen und bei Aufgaben besser werden. Das ist sehr ähnlich dazu, wie Menschen aus Erfahrung lernen. Wie werden diese gelabelten Beispiele also erstellt?

Datenannotation umfasst das Labeln oder Markieren von Daten, um Algorithmen des maschinellen Lernens beim Verständnis dieser Daten zu unterstützen. Im Bereich Computer Vision bedeutet dies, Bilder oder Videos zu markieren, um Objekte, Aktionen oder Szenen präzise zu erkennen und zu kategorisieren. Datenlabelierung ist entscheidend, da der Erfolg eines KI-Modells stark von der Qualität der gelabelten Daten abhängt, mit denen es trainiert wird.

Studien zeigen, dass über 80 % der Zeit bei KI-Projekten mit der Verwaltung von Daten verbracht wird – vom Sammeln und Aggregieren bis hin zum Bereinigen und Labeln. Dies zeigt, wie wichtig Datenannotation bei der Entwicklung von KI-Modellen ist. Die Verwendung von qualitativ hochwertigen, annotierten Daten ermöglicht es KI-Modellen, Aufgaben wie Gesichtserkennung und Objekterkennung in realen Situationen mit größerer Genauigkeit und Zuverlässigkeit durchzuführen.

Link to this sectionWarum Datenannotation notwendig ist#

Datenannotation bildet die Grundlage für die Leistung eines Computer-Vision-Modells. Gelabelte Daten sind die "Ground Truth" (Grundwahrheit), die das Modell zum Lernen und für Vorhersagen nutzt. Diese Ground-Truth-Daten sind entscheidend, da sie die reale Welt repräsentieren, die das Modell zu verstehen versucht. Ohne diese zuverlässige Basis wäre das KI-Modell wie ein Schiff, das ohne Kompass navigiert.

Ground Truth versus Vorhersage

Abb. 1. Ground Truth vs. Vorhersage.

Präzises Labeln hilft diesen Modellen, zu verstehen, was sie sehen, und führt zu einer besseren Entscheidungsfindung. Wenn Daten schlecht gelabelt oder inkonsistent sind, wird das Modell Schwierigkeiten haben, korrekte Vorhersagen und Entscheidungen zu treffen – genau wie ein Schüler, der mit falschen Lehrbüchern lernt. Dank annotierter Daten kann ein Modell Aufgaben wie Bildklassifizierung, Instanzsegmentierung und Pose Estimation von Objekten in Bildern und Videos erlernen.

Link to this sectionDie besten Ressourcen für Datensätze#

Bevor du einen völlig neuen Datensatz erstellst und mühsam Bilder und Videos labelst, ist es eine gute Idee zu prüfen, ob du vorhandene Datensätze für dein Projekt verwenden kannst. Es gibt mehrere fantastische Open-Source-Repositories, in denen du kostenlos auf hochwertige Datensätze zugreifen kannst. Einige der beliebtesten sind:

  • ImageNet: Es wird häufig für das Training von Bildklassifizierungsmodellen verwendet.
  • COCO: Dieser Datensatz ist für Objekterkennung, Segmentierung und Bildunterschriften konzipiert.
  • PASCAL VOC: Er unterstützt Objekterkennungs- und Segmentierungsaufgaben.

Beispiele für Daten im COCO-Datensatz

Abb. 2. Beispiele für Daten im COCO-Datensatz.

Bei der Auswahl eines Datensatzes ist es wichtig, Faktoren wie die Eignung für dein Projekt, die Größe des Datensatzes, seine Diversität und die Qualität der Labels zu berücksichtigen. Überprüfe außerdem unbedingt die Lizenzbedingungen des Datensatzes, um rechtliche Konsequenzen zu vermeiden, und prüfe, ob die Daten in einem Format vorliegen, das zu deinem Workflow und deinen Tools passt.

Das Erstellen eines benutzerdefinierten Datensatzes ist eine großartige Option, wenn vorhandene Datensätze nicht ganz deinen Anforderungen entsprechen. Du kannst Bilder mit Tools wie Webcams, Drohnen oder Smartphones sammeln, je nachdem, was dein Projekt erfordert. Idealerweise sollte dein benutzerdefinierter Datensatz vielfältig, ausgeglichen und wirklich repräsentativ für das Problem sein, das du lösen möchtest. Das kann bedeuten, Bilder unter verschiedenen Lichtverhältnissen, aus verschiedenen Winkeln und in unterschiedlichen Umgebungen aufzunehmen.

Wenn du nur eine geringere Anzahl von Bildern oder Videos sammeln kannst, ist Data Augmentation eine hilfreiche Technik. Dabei wird dein Datensatz erweitert, indem Transformationen wie Drehen, Spiegeln oder Farbanpassungen auf vorhandene Bilder angewendet werden. Dies vergrößert deinen Datensatz und macht dein Modell robuster und besser in der Lage, mit Variationen in den Daten umzugehen. Durch die Verwendung einer Mischung aus Open-Source-Datensätzen, benutzerdefinierten Datensätzen und augmentierten Daten kannst du die Leistung deiner Computer-Vision-Modelle erheblich steigern.

Link to this sectionArten von Bildannotationstechniken#

Bevor du mit der Annotation von Bildern beginnst, ist es wichtig, mit den verschiedenen Arten der Annotation vertraut zu sein. Das wird dir helfen, die richtige für dein Projekt auszuwählen. Als Nächstes werfen wir einen Blick auf einige der wichtigsten Annotationsarten.

Link to this sectionBegrenzungsrahmen#

Bounding Boxes sind die häufigste Annotationsart in der Computer Vision. Es handelt sich um rechteckige Rahmen, die verwendet werden, um die Position eines Objekts in einem Bild zu markieren. Diese Rahmen werden durch die Koordinaten ihrer Ecken definiert und helfen KI-Modellen, Objekte zu identifizieren und zu lokalisieren. Bounding Boxes werden hauptsächlich für die Objekterkennung verwendet.

Ein Beispiel für Bounding Boxes

Abb. 3. Ein Beispiel für Bounding Boxes.

Link to this sectionSegmentierungsmasken#

Manchmal muss ein Objekt präziser erkannt werden, als es nur mit einer darum gezeichneten Bounding Box möglich ist. Vielleicht interessierst du dich für die Begrenzung der Objekte in einem Bild. In diesem Fall ermöglichen dir Segmentierungsmasken, komplexe Objekte zu umreißen. Segmentierungsmasken sind eine detailliertere Darstellung auf Pixelebene.

Diese Masken können für semantische Segmentierung und Instanzsegmentierung verwendet werden. Bei der semantischen Segmentierung wird jedes Pixel in einem Bild entsprechend dem Objekt oder Bereich beschriftet, den es darstellt, wie etwa ein Fußgänger, ein Auto, eine Straße oder ein Gehweg. Die Instanzsegmentierung geht jedoch noch einen Schritt weiter, indem sie jedes Objekt einzeln identifiziert und trennt – etwa die Unterscheidung zwischen jedem einzelnen Auto in einem Bild, selbst wenn es sich um den gleichen Typ handelt.

Ein Beispiel für semantische Segmentierung (links) und Instanzsegmentierung (rechts)

Abb. 4. Ein Beispiel für semantische Segmentierung (links) und Instanzsegmentierungsmasken (rechts).

Link to this section3D-Cuboids#

3D-Cuboids (3D-Quader) ähneln Bounding Boxes. Was sie einzigartig macht, ist, dass 3D-Cuboids Tiefeninformationen hinzufügen und eine 3D-Darstellung eines Objekts bieten. Diese zusätzliche Information ermöglicht es Systemen, Form, Volumen und Position von Objekten in einem 3D-Raum zu verstehen. 3D-Cuboids werden häufig beim autonomen Fahren verwendet, um die Entfernung von Objekten zum Fahrzeug zu messen.

Ein Beispiel für 3D-Cuboids

Abb. 5. Ein Beispiel für 3D-Cuboids.

Link to this sectionKey-Points und Landmarks#

Eine weitere interessante Annotationsart sind Key-Points, bei denen spezifische Punkte wie Augen, Nasen oder Gelenke auf Objekten markiert werden. Landmarks gehen noch einen Schritt weiter, indem sie diese Punkte verbinden, um die Struktur und Bewegung komplexerer Formen wie Gesichter oder Körperposen zu erfassen. Diese Annotationsarten werden für Anwendungen wie Gesichtserkennung, Motion Capture und Augmented Reality verwendet. Sie verbessern außerdem die Genauigkeit von KI-Modellen bei Aufgaben wie Gestenerkennung oder der Analyse von sportlicher Leistung.

Ein Beispiel für Key-Points

Abb. 6. Ein Beispiel für Key-Points.

Link to this sectionSo annotierst du Daten mit LabelImg#

Nachdem wir die verschiedenen Annotationsarten besprochen haben, lass uns verstehen, wie du Bilder mit einem beliebten Tool namens LabelImg annotieren kannst. LabelImg ist ein Open-Source-Tool, das die Bildannotation vereinfacht und zur Erstellung von Datensätzen im YOLO-Format (You Only Look Once) verwendet werden kann. Es ist eine großartige Wahl für Anfänger, die an kleinen Ultralytics YOLOv8-Projekten arbeiten.

Die Einrichtung von LabelImg ist unkompliziert. Stelle zunächst sicher, dass Python 3 auf deinem Computer installiert ist. Dann kannst du LabelImg mit einem schnellen Befehl installieren:

pip3 install labelImg

Sobald es installiert ist, kannst du das Tool mit dem folgenden Befehl starten:

labelImg

LabelImg funktioniert auf mehreren Plattformen, darunter Windows, macOS und Linux. Wenn bei der Installation Probleme auftreten, bietet dir das offizielle LabelImg Repository detailliertere Anweisungen.

Verwendung von LabelImg für die Bildannotation

Abb. 7. Verwendung von LabelImg für die Bildannotation.

Sobald du das Tool gestartet hast, befolge diese einfachen Schritte, um mit dem Labeln deiner Bilder zu beginnen:

  • Klassen einrichten: Beginne mit der Definition der Liste der Klassen (Kategorien), die du annotieren möchtest, in einer Datei namens “predefined_classes.txt.” Diese Datei lässt die Software wissen, welche Objekte du in deinen Bildern labeln wirst.
  • Zum YOLO-Format wechseln: Standardmäßig verwendet LabelImg das PASCAL VOC-Format. Wenn du jedoch mit YOLO arbeitest, musst du das Format umstellen. Klicke einfach auf die “PascalVOC”-Schaltfläche in der Toolbar, um zu YOLO zu wechseln.
  • Mit dem Annotieren beginnen: Verwende die Optionen "Open" oder "OpenDIR", um deine Bilder zu laden. Zeichne dann Bounding Boxes um die Objekte, die du annotieren möchtest, und weise das korrekte Klassenlabel zu. Speichere nach dem Labeln jedes Bildes deine Arbeit. LabelImg erstellt eine Textdatei mit demselben Namen wie dein Bild, die die YOLO-Annotationen enthält.
  • Speichern und überprüfen: Die Annotationen werden in einer .txt-Datei im YOLO-Format gespeichert. Die Software speichert außerdem eine “classes.txt”-Datei, die alle deine Klassennamen auflistet.

Link to this sectionEffiziente Strategien zur Datenlabelierung#

Um den Prozess der Datenlabelierung reibungsloser zu gestalten, gibt es ein paar Schlüsselstrategien zu beachten. Zum Beispiel sind klare Annotationsrichtlinien entscheidend. Ohne diese könnten verschiedene Annotatoren eine Aufgabe unterschiedlich interpretieren.

Nehmen wir an, die Aufgabe besteht darin, Vögel in Bildern mit Bounding Boxes zu annotieren. Ein Annotator könnte den gesamten Vogel labeln, während ein anderer vielleicht nur den Kopf oder die Flügel markiert. Diese Art von Inkonsistenz kann das Modell während des Trainings verwirren. Durch die Bereitstellung klarer Definitionen, wie zum Beispiel "label den gesamten Vogel inklusive Flügeln und Schwanz", zusammen mit Beispielen und Anweisungen für knifflige Fälle, kannst du sicherstellen, dass die Daten präzise und konsistent getaggt werden.

Regelmäßige Qualitätskontrollen sind ebenfalls wichtig, um hohe Standards aufrechtzuerhalten. Durch das Festlegen von Benchmarks und die Verwendung spezifischer Metriken zur Überprüfung der Arbeit kannst du die Datengenauigkeit beibehalten und den Prozess durch kontinuierliches Feedback verfeinern.

Link to this sectionDatenlabelierung auf den Punkt gebracht#

Datenannotation ist ein einfaches Konzept, das einen erheblichen Einfluss auf dein Computer-Vision-Modell haben kann. Egal, ob du Tools wie LabelImg zum Annotieren von Bildern verwendest oder Modelle mit Open-Source-Datensätzen trainierst: Das Verständnis der Datenlabelierung ist entscheidend. Strategien zur Datenlabelierung können helfen, den gesamten Prozess zu optimieren und effizienter zu gestalten. Dir die Zeit zu nehmen, deinen Annotationsansatz zu verfeinern, kann zu besseren, zuverlässigeren KI-Ergebnissen führen.

Erkunde weiter und erweitere deine Fähigkeiten! Bleib mit unserer Community in Verbindung, um mehr über KI zu erfahren! Sieh dir unser GitHub-Repository an, um zu entdecken, wie wir KI nutzen, um innovative Lösungen in Branchen wie Fertigung und Gesundheitswesen zu entwickeln. 🚀

Explore solutions

Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Unterstütze Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Mehr erfahren
Real-time AI that works with your operation

KI im Automobilbereich

Wende Computer Vision im Automobilbereich mit Ultralytics YOLO Modellen an. Vision AI verbessert die Straßensicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Mehr erfahren
Real-time AI that works with your team

KI im Gesundheitswesen

Erstelle Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision KI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Mehr erfahren
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO Modellen. Vision KI ermöglicht Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Mehr erfahren
Real-time AI that works with your team

KI in der Robotik

Betreibe intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik ermöglicht autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung.

Mehr erfahren
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien an.

Mehr erfahren
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision-KI ermöglicht Paketinspektion, Sortierung, Fahrzeugverfolgung und Echtzeit-Lagersicherheitsüberwachung.

Mehr erfahren
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Unterstütze Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Mehr erfahren
Real-time AI that works with your operation

KI im Automobilbereich

Wende Computer Vision im Automobilbereich mit Ultralytics YOLO Modellen an. Vision AI verbessert die Straßensicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Mehr erfahren
Real-time AI that works with your team

KI im Gesundheitswesen

Erstelle Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision KI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Mehr erfahren
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO Modellen. Vision KI ermöglicht Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Mehr erfahren
Real-time AI that works with your team

KI in der Robotik

Betreibe intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik ermöglicht autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung.

Mehr erfahren
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien an.

Mehr erfahren
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision-KI ermöglicht Paketinspektion, Sortierung, Fahrzeugverfolgung und Echtzeit-Lagersicherheitsüberwachung.

Mehr erfahren
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Unterstütze Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Mehr erfahren
Real-time AI that works with your operation

KI im Automobilbereich

Wende Computer Vision im Automobilbereich mit Ultralytics YOLO Modellen an. Vision AI verbessert die Straßensicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Mehr erfahren
Real-time AI that works with your team

KI im Gesundheitswesen

Erstelle Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision KI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Mehr erfahren
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO Modellen. Vision KI ermöglicht Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Mehr erfahren
Real-time AI that works with your team

KI in der Robotik

Betreibe intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik ermöglicht autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung.

Mehr erfahren
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien an.

Mehr erfahren
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision-KI ermöglicht Paketinspektion, Sortierung, Fahrzeugverfolgung und Echtzeit-Lagersicherheitsüberwachung.

Mehr erfahren

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens