Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Datenbeschriftung

Entdecken Sie die entscheidende Rolle der Datenkennzeichnung im maschinellen Lernen, ihren Prozess, ihre Herausforderungen und ihre realen Anwendungen in der KI-Entwicklung.

Datenkennzeichnung ist der Prozess der Identifizierung von Rohdaten (wie Bilder, Textdateien oder Videos) und des Hinzufügens von einer oder mehreren informativen Kennzeichnungen oder Anmerkungen, um Kontext bereitzustellen, wodurch ein Machine-Learning-Modell daraus lernen kann. Dieser Prozess ist grundlegend für überwachtes Lernen, bei dem der gekennzeichnete Datensatz als die "Grundwahrheit" dient, die der Algorithmus verwendet, um sich selbst zu trainieren, um genaue Vorhersagen über neue, nicht gekennzeichnete Daten zu treffen. Eine qualitativ hochwertige Datenkennzeichnung ist einer der kritischsten und zeitaufwändigsten Schritte beim Aufbau eines robusten KI-Modells, da die Leistung des Modells direkt von der Qualität und Genauigkeit der Kennzeichnungen abhängt, von denen es lernt.

Warum ist Datenbeschriftung wichtig?

Die Datenkennzeichnung bietet die notwendige Grundlage für Modelle, um die Welt zu verstehen und zu interpretieren. In der Computer Vision (CV) lehren Kennzeichnungen ein Modell, zu erkennen, was ein Objekt ist und wo es sich innerhalb eines Bildes befindet. Ohne genaue Kennzeichnungen kann ein Modell nicht die Muster lernen, die zur Ausführung seiner Aufgabe erforderlich sind, was zu einer schlechten Genauigkeit und Unzuverlässigkeit führt. Die Qualität der Trainingsdaten, die durch die Kennzeichnung erstellt werden, bestimmt direkt die Qualität der resultierenden KI. Dieses Prinzip wird oft als "Garbage in, garbage out" zusammengefasst. Gut gekennzeichnete Benchmark-Datensätze wie COCO und ImageNet haben maßgeblich dazu beigetragen, den Stand der Technik in der Computer Vision voranzutreiben.

Arten der Datenbeschriftung in der Computer Vision

Verschiedene CV-Aufgaben erfordern unterschiedliche Arten von Annotationen. Die gängigsten Methoden sind:

  • Bildklassifizierung: Die einfachste Form, bei der einem gesamten Bild eine einzelne Bezeichnung zugewiesen wird, um seinen Inhalt zu beschreiben (z. B. "Katze", "Hund"). Sie können Datensätze für diese Aufgabe wie CIFAR-100 erkunden.
  • Objekterkennung: Beinhaltet das Zeichnen einer Bounding Box um jedes interessante Objekt in einem Bild und das Zuweisen einer Klassenbezeichnung. Dies teilt dem Modell sowohl mit, was das Objekt ist als auch wo es sich befindet.
  • Bildsegmentierung: Eine detailliertere Methode, die das genaue Umreißen der Form eines Objekts auf Pixelebene beinhaltet. Dies kann weiter unterteilt werden in semantische Segmentierung, bei der alle Objekte derselben Klasse eine Maske gemeinsam nutzen, und Instanzsegmentierung, bei der jede einzelne Objektinstanz separat segmentiert wird.
  • Pose Estimation: Diese Technik identifiziert die Position und Orientierung von Objekten durch die Annotation von Keypoints. Bei der Schätzung der menschlichen Pose würden Keypoints beispielsweise Gelenke wie Ellbogen, Knie und Handgelenke markieren. Der COCO Keypoints Datensatz ist eine beliebte Ressource für diese Aufgabe.

Anwendungsfälle in der Praxis

  1. Autonome Fahrzeuge: Die Datenkennzeichnung ist für das Training der Wahrnehmungssysteme von selbstfahrenden Autos unerlässlich. Menschliche Annotatoren kennzeichnen sorgfältig Millionen von Bildern und Video-Frames, zeichnen Begrenzungsrahmen um Autos, Fußgänger und Radfahrer, segmentieren Fahrbahnmarkierungen und klassifizieren Verkehrsschilder. Diese umfangreichen, gekennzeichneten Daten ermöglichen es Modellen wie Ultralytics YOLO11, das sichere Navigieren in komplexen städtischen Umgebungen zu erlernen. Die Arbeit von Unternehmen wie Waymo stützt sich stark auf riesige, genau gekennzeichnete Datensätze. Sie können mehr über dieses Feld auf unserer KI in Automobillösungen-Seite erfahren.
  2. Medizinische Bildanalyse: In der KI im Gesundheitswesen kennzeichnen Radiologen und medizinische Experten Scans wie MRTs, CTs und Röntgenaufnahmen, um Tumore, Läsionen und andere Anomalien zu identifizieren. Beispielsweise würden Experten in einem Hirntumor-Datensatz die genauen Grenzen eines Tumors umreißen. Diese gekennzeichneten Daten werden verwendet, um Modelle zu trainieren, die bei der Früherkennung helfen können, wodurch potenziell die Arbeitsbelastung von Medizinern verringert und die Patientenergebnisse verbessert werden. Die Radiological Society of North America (RSNA) untersucht aktiv die Rolle der KI in der medizinischen Diagnostik.

Datenkennzeichnung vs. verwandte Konzepte

Die Datenkennzeichnung wird oft zusammen mit anderen Datenaufbereitungsaufgaben durchgeführt, aber es ist wichtig, zwischen ihnen zu unterscheiden:

  • Data Augmentation: Diese Technik erweitert den Trainingsdatensatz künstlich, indem modifizierte Versionen von bereits gelabelten Daten erstellt werden (z. B. Drehen, Spiegeln oder Ändern der Helligkeit eines Bildes). Die Augmentierung erhöht die Datenvielfalt, ist aber von einem anfänglichen Satz gelabelter Daten abhängig. Ein Überblick über die Datenaugmentierung bietet weitere Details.
  • Data Cleaning: Dieser Prozess umfasst das Identifizieren und Korrigieren oder Entfernen von Fehlern, Inkonsistenzen und Ungenauigkeiten in einem Datensatz. Dies kann zwar das Korrigieren falscher Labels beinhalten, aber Data Cleaning ist ein Schritt zur Qualitätssicherung, während Data Labeling der anfängliche Akt des Erstellens der Annotationen ist. Die Datenbereinigung auf Wikipedia bietet weitere Informationen.
  • Data Preprocessing: Dies ist ein umfassenderer Begriff, der Data Labeling, Cleaning und andere Transformationen wie Normalisierung oder Größenänderung von Bildern umfasst, um sie für ein Modell vorzubereiten. Labeling ist ein spezifischer, entscheidender Schritt innerhalb der größeren Vorverarbeitungs-Pipeline.

Herausforderungen und Lösungen

Trotz ihrer Bedeutung ist die Datenannotation mit Herausforderungen verbunden, darunter hohe Kosten, erheblicher Zeitaufwand und das Potenzial für menschliche Fehler oder Subjektivität. Die Sicherstellung der Qualität und Konsistenz der Annotationen über große Teams von Annotatoren hinweg stellt eine große logistische Hürde dar.

Um diesen Prozess zu optimieren, verwenden Teams häufig spezielle Annotationstools wie CVAT oder Plattformen wie Ultralytics HUB, die eine kollaborative Umgebung für die Verwaltung von Datensätzen und die Kennzeichnung von Workflows bieten. Darüber hinaus können fortschrittliche Techniken wie Active Learning helfen, indem sie auf intelligente Weise die informativsten Datenpunkte auswählen, die gekennzeichnet werden sollen, wodurch die Zeit und der Aufwand der menschlichen Annotatoren optimiert werden. Wie in einem Artikel des Stanford AI Lab dargelegt, ist die Fokussierung auf die Datenqualität der Schlüssel zum Erfolg von KI.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert