Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Datenannotation

Was ist Datenannotation? Erfahren Sie, wie das Labeln von Daten mit Begrenzungsrahmen oder Polygonen für das Training genauer KI- und Computer-Vision-Modelle unerlässlich ist.

Datenannotation ist der Prozess des Kennzeichnens oder Markierens von Rohdaten, um Modellen für maschinelles Lernen (ML) zu helfen, diese zu verstehen und daraus zu lernen. Dieser kritische Schritt wandelt unstrukturierte Daten, wie Bilder oder Videos, in strukturierte Informationen um, die Algorithmen interpretieren können. Im Kontext des überwachten Lernens dienen diese Annotationen als die "Ground Truth" - die korrekten Antworten, die das Modell verwendet, um sich selbst zu trainieren. Die Qualität und Genauigkeit der Datenannotation beeinflussen direkt die Leistung und Zuverlässigkeit des resultierenden KI-Modells (Künstliche Intelligenz). Ohne präzise Annotationen werden selbst die fortschrittlichsten Modelle keine Muster effektiv erlernen.

Die Rolle der Annotation in Computer Vision

In der Computer Vision (CV) ist die Datenannotation von grundlegender Bedeutung, um Modelle das "Sehen" und Interpretieren der Welt zu lehren. Dabei identifizieren und markieren menschliche Annotatoren mithilfe spezieller Software Objekte von Interesse in visuellen Daten. Es gibt verschiedene Arten von Annotationen, die jeweils für unterschiedliche CV-Aufgaben geeignet sind:

  • Bounding Box Annotation: Dies ist die gebräuchlichste Form, die für die Objekterkennung verwendet wird. Annotatoren zeichnen rechteckige Kästen um einzelne Objekte und weisen eine Klassenbezeichnung zu (z. B. "Auto", "Person").
  • Polygonale Segmentierung: Für Aufgaben, die eine höhere Präzision erfordern, wie z. B. die Instanzsegmentierung, zeichnen Annotatoren die exakte Kontur jedes Objekts nach. Dies ermöglicht es dem Modell, die spezifische Form und die Grenzen eines Objekts zu verstehen, auch wenn sich Objekte überlappen.
  • Semantische Segmentierung: Diese Methode beinhaltet die Klassifizierung jedes einzelnen Pixels in einem Bild in eine bestimmte Kategorie (z. B. „Himmel“, „Straße“, „Gebäude“). Im Gegensatz zur Instanzsegmentierung unterscheidet sie nicht zwischen verschiedenen Instanzen derselben Objektklasse.
  • Keypoint-Annotation: Diese Technik wird für die Pose-Schätzung verwendet und beinhaltet das Markieren spezifischer interessanter Punkte (Keypoints) auf einem Objekt, wie z. B. die Gelenke eines menschlichen Körpers oder die Ecken eines Gesichts.
  • Klassifizierung: Die einfachste Form, bei der einem gesamten Bild eine einzelne Bezeichnung zugewiesen wird. Dies ist grundlegend für Bildklassifizierungsaufgaben.

Die Wahl der Annotationsmethode hängt von den spezifischen Zielen des CV-Projekts ab, die im Leitfaden zur Definition von Projektzielen beschrieben sind.

Anwendungsfälle in der Praxis

  1. Autonome Fahrzeuge: Selbstfahrende Autos sind auf Modelle angewiesen, die mit umfangreich annotierten Daten trainiert wurden. Annotatoren kennzeichnen alles, von Fußgängern und Radfahrern bis hin zu Ampeln, Fahrbahnmarkierungen und Straßenschildern in Millionen von Bildern und LiDAR-Punktwolken. Diese detaillierten Trainingsdaten ermöglichen es dem Wahrnehmungssystem des Fahrzeugs, seine Umgebung zu verstehen und sichere Fahrentscheidungen zu treffen. Datensätze wie Argoverse sind entscheidend für die Entwicklung robuster KI in Automobil-Lösungen.
  2. Medizinische Bildanalyse: In der KI für das Gesundheitswesen annotieren Radiologen und medizinische Experten medizinische Scans wie MRTs, CTs und Röntgenaufnahmen, um Tumore, Läsionen, Frakturen oder andere Anomalien hervorzuheben. Diese annotierten Datensätze, wie z. B. der öffentliche Brain Tumor dataset, werden verwendet, um Modelle wie Ultralytics YOLO zu trainieren, die bei der Früherkennung und Behandlungsplanung helfen können. Die Radiological Society of North America (RSNA) stellt mehrere solcher Datensätze für die Forschung zur Verfügung.

Datenannotation vs. verwandte Konzepte

Datenannotation wird oft zusammen mit anderen Datenaufbereitungstechniken diskutiert, aber sie dienen unterschiedlichen Zwecken.

  • Datenannotation vs. Data Labeling: Diese beiden Begriffe werden häufig synonym verwendet und beziehen sich auf denselben Kernprozess. "Annotation" wird in der Computer Vision oft bevorzugt, um komplexere Aufgaben wie das Zeichnen von Polygonen oder Keypoints zu beschreiben, während "Labeling" für einfachere Aufgaben wie die Klassifizierung verwendet werden kann. Für alle praktischen Zwecke sind sie jedoch gleichbedeutend. Für einen detaillierten Einblick können Sie mehr in unserer Erklärung zur Datenbeschriftung für Computer Vision lesen.
  • Datenannotation vs. Data Augmentation: Annotation ist der Prozess der Erstellung der anfänglichen Ground-Truth-Labels. Data Augmentation hingegen ist eine Technik, die nach der Annotation verwendet wird, um die Größe des Datensatzes künstlich zu erhöhen, indem modifizierte Versionen der annotierten Bilder erstellt werden (z. B. Drehen, Spiegeln oder Ändern der Helligkeit).
  • Datenannotation vs. Data Cleaning: Data Cleaning umfasst das Korrigieren von Fehlern, das Entfernen von Duplikaten und den Umgang mit fehlenden Werten innerhalb eines Datensatzes, um dessen Gesamtqualität sicherzustellen. Das Bereinigen kann vor der Annotation erfolgen (z. B. das Entfernen unscharfer Bilder) oder danach (z. B. das Korrigieren falscher Labels), ist aber getrennt von der Hinzufügung neuer Labels selbst. Eine hohe Datenqualität ist für eine effektive Annotation unerlässlich.

Der Annotationsprozess kann mit verschiedenen Tools verwaltet werden, von Open-Source-Optionen wie CVAT bis hin zu kommerziellen Plattformen wie Scale AI und Labelbox. Plattformen wie Ultralytics HUB bieten integrierte Lösungen zur Verwaltung von Datensätzen, zum Trainieren von Modellen und zur Straffung des gesamten Workflows von der Datenerfassung und -annotation bis zur Bereitstellung.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert