Glossar

Datenbeschriftung

Entdecken Sie die entscheidende Rolle der Datenbeschriftung beim maschinellen Lernen, den Prozess, die Herausforderungen und die realen Anwendungen in der KI-Entwicklung.

Bei der Datenkennzeichnung werden Rohdaten (z. B. Bilder, Textdateien oder Videos) identifiziert und mit einer oder mehreren informativen Kennzeichnungen oder Anmerkungen versehen, um einen Kontext zu schaffen, aus dem ein maschinelles Lernmodell lernen kann. Dieser Prozess ist von grundlegender Bedeutung für das überwachte Lernen, bei dem der beschriftete Datensatz als "Grundwahrheit" dient, die der Algorithmus verwendet, um sich selbst zu trainieren und genaue Vorhersagen für neue, nicht beschriftete Daten zu treffen. Die qualitativ hochwertige Kennzeichnung von Daten ist einer der wichtigsten und zeitaufwändigsten Schritte beim Aufbau eines robusten KI-Modells, da die Leistung des Modells direkt von der Qualität und Genauigkeit der Kennzeichnungen abhängt, aus denen es lernt.

Warum ist die Kennzeichnung von Daten wichtig?

Die Kennzeichnung von Daten bildet die notwendige Grundlage für Modelle, die die Welt verstehen und interpretieren können. In der Computer Vision (CV) lehren Beschriftungen ein Modell zu erkennen, was ein Objekt ist und wo es sich in einem Bild befindet. Ohne genaue Beschriftungen kann ein Modell nicht die Muster lernen, die es zur Erfüllung seiner Aufgabe benötigt, was zu geringer Genauigkeit und Unzuverlässigkeit führt. Die Qualität der Trainingsdaten, die durch die Beschriftung erzeugt werden, bestimmt direkt die Qualität der resultierenden KI. Dieses Prinzip wird oft als "Garbage in, garbage out" zusammengefasst. Gut beschriftete Benchmark-Datensätze wie COCO und ImageNet haben maßgeblich dazu beigetragen, den Stand der Technik in der Computer Vision voranzutreiben.

Arten der Datenbeschriftung in der Computer Vision

Unterschiedliche Lebenslaufaufgaben erfordern unterschiedliche Arten der Kommentierung. Zu den gängigsten Methoden gehören:

  • Bildklassifizierung: Die einfachste Form, bei der einem ganzen Bild ein einziges Label zugewiesen wird, um seinen Inhalt zu beschreiben (z. B. "Katze", "Hund"). Sie können für diese Aufgabe Datensätze wie CIFAR-100 untersuchen.
  • Objekt-Erkennung: Dabei wird ein Begrenzungsrahmen um jedes interessante Objekt in einem Bild gezeichnet und ihm eine Klassenbezeichnung zugewiesen. Dadurch erfährt das Modell, was das Objekt ist und wo es sich befindet.
  • Bildsegmentierung: Eine detailliertere Methode, bei der die genaue Form eines Objekts auf Pixelebene umrissen wird. Sie kann weiter unterteilt werden in die semantische Segmentierung, bei der alle Objekte der gleichen Klasse eine gemeinsame Maske haben, und die Instanzsegmentierung, bei der jede einzelne Objektinstanz separat segmentiert wird.
  • Schätzung der Körperhaltung: Bei dieser Technik werden die Position und Ausrichtung von Objekten durch die Angabe von Schlüsselpunkten ermittelt. Bei der Schätzung der menschlichen Körperhaltung markieren Keypoints beispielsweise Gelenke wie Ellbogen, Knie und Handgelenke. Der COCO Keypoints-Datensatz ist eine beliebte Ressource für diese Aufgabe.

Anwendungen in der realen Welt

  1. Autonome Fahrzeuge: Die Kennzeichnung von Daten ist für das Training der Wahrnehmungssysteme von selbstfahrenden Autos unerlässlich. Menschliche Kommentatoren beschriften akribisch Millionen von Bildern und Videobildern, zeichnen Begrenzungsrahmen um Autos, Fußgänger und Radfahrer, segmentieren Fahrbahnmarkierungen und klassifizieren Verkehrsschilder. Dank dieser reichhaltigen, beschrifteten Daten können Modelle wie Ultralytics YOLO11 lernen, sicher durch komplexe städtische Umgebungen zu navigieren. Die Arbeit von Unternehmen wie Waymo stützt sich in hohem Maße auf umfangreiche, genau beschriftete Datensätze. Weitere Informationen zu diesem Bereich finden Sie auf unserer Seite zu KI in der Automobilindustrie.
  2. Medizinische Bildanalyse: Bei der KI im Gesundheitswesen kennzeichnen Radiologen und medizinische Experten Scans wie MRTs, CTs und Röntgenaufnahmen, um Tumore, Läsionen und andere Anomalien zu erkennen. Bei einem Hirntumor-Datensatz beispielsweise würden Experten die genauen Grenzen eines Tumors umreißen. Anhand dieser markierten Daten werden Modelle trainiert, die bei der Frühdiagnose helfen können, wodurch die Arbeitsbelastung der Ärzte verringert und die Ergebnisse für die Patienten verbessert werden können. Die Radiological Society of North America (RSNA) beschäftigt sich aktiv mit der Rolle der KI in der medizinischen Diagnostik.

Datenkennzeichnung vs. verwandte Konzepte

Die Beschriftung von Daten wird oft zusammen mit anderen Datenaufbereitungsaufgaben durchgeführt, aber es ist wichtig, zwischen ihnen zu unterscheiden:

  • Datenerweiterung: Bei dieser Technik wird der Trainingsdatensatz künstlich erweitert, indem modifizierte Versionen von bereits markierten Daten erstellt werden (z. B. Drehen, Spiegeln oder Ändern der Helligkeit eines Bildes). Die Datenerweiterung erhöht die Datenvielfalt, hängt jedoch von einem anfänglichen Satz beschrifteter Daten ab. Ein Überblick über die Datenerweiterung liefert weitere Einzelheiten.
  • Datenbereinigung: Dieser Prozess umfasst die Identifizierung und Korrektur bzw. Beseitigung von Fehlern, Inkonsistenzen und Ungenauigkeiten in einem Datensatz. Dies kann zwar auch die Korrektur falscher Beschriftungen umfassen, aber die Datenbereinigung ist ein Schritt der Qualitätssicherung, während die Datenbeschriftung der erste Akt der Erstellung der Anmerkungen ist. Die Datenbereinigung auf Wikipedia bietet weiteren Kontext.
  • Vorverarbeitung von Daten: Dies ist ein weiter gefasster Begriff, der die Kennzeichnung von Daten, die Bereinigung und andere Transformationen wie die Normalisierung oder Größenänderung von Bildern umfasst, um sie für ein Modell vorzubereiten. Die Beschriftung ist ein spezifischer, entscheidender Schritt innerhalb der größeren Vorverarbeitungspipeline.

Herausforderungen und Lösungen

Trotz ihrer Bedeutung ist die Kennzeichnung von Daten mit zahlreichen Herausforderungen verbunden, darunter hohe Kosten, ein erheblicher Zeitaufwand und das Potenzial für menschliche Fehler oder Subjektivität. Die Sicherstellung der Qualität und Konsistenz der Beschriftungen durch große Teams von Annotatoren stellt eine große logistische Hürde dar.

Zur Rationalisierung dieses Prozesses verwenden Teams häufig spezialisierte Annotationstools wie CVAT oder Plattformen wie Ultralytics HUB, die eine kollaborative Umgebung für die Verwaltung von Datensätzen und Beschriftungsworkflows bieten. Darüber hinaus können fortschrittliche Techniken wie Active Learning helfen, indem sie auf intelligente Weise die informativsten zu beschriftenden Datenpunkte auswählen und so die Zeit und den Aufwand der menschlichen Annotatoren optimieren. Wie in einem Artikel des Stanford AI Lab beschrieben, ist der Fokus auf die Datenqualität der Schlüssel zu erfolgreicher KI.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert