Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Datenbeschriftung

Entdecken Sie die entscheidende Rolle der Datenkennzeichnung im maschinellen Lernen, ihren Prozess, ihre Herausforderungen und ihre realen Anwendungen in der KI-Entwicklung.

Die Kennzeichnung von Daten ist ein grundlegender Prozess, bei dem Rohdaten mit sinnvollem Kontext versehen werden, um einen Datensatz zu erstellen für das Training von Modelle des maschinellen Lernens (ML). Im Kontext des überwachten Lernens benötigen Algorithmen Beispiele, die sowohl die Eingabedaten (z. B. ein Bild) als auch die erwartete Ausgabe (die Kennzeichnung) enthalten. Diese beschrifteten Informationen dienen als Basiswahrheit und fungieren als endgültigen Standard, an dem die Vorhersagen des Modells gemessen und verbessert werden. Ohne hochwertige Beschriftung, selbst die ausgefeiltesten Architekturen, wie z. B. Ultralytics YOLO11nicht lernen, Muster genau zu erkennen Muster zu erkennen oder Objekte zu identifizieren.

Die Bedeutung einer präzisen Etikettierung

Die Leistung eines jeden KI-Systems ist untrennbar mit der Qualität seiner Trainingsdaten. Wenn die Beschriftungen inkonsistent sind, ungenau oder falsch sind, lernt das Modell fehlerhafte Assoziationen - ein Problem, das in der Informatik allgemein als "Garbage in, garbage out". Präzise Beschriftungen ermöglichen es den Modellen, gut auf neue, ungesehene Daten zu generalisieren, was entscheidend für den Einsatz robuster Computer Vision (CV) Anwendungen. Wichtige Benchmark-Datensätze wie der COCO und ImageNet wurden gerade deshalb zu Industriestandards aufgrund ihrer umfangreichen und sorgfältigen Beschriftung.

Gängige Arten der Beschriftung in der Computer Vision

Die spezifische Methode der Datenbeschriftung hängt stark von der beabsichtigten Computer Vision Aufgabe ab:

  • Bildklassifizierung: Zuweisung einer einzelnen Kategorie oder Klasse zu einem ganzen Bild (z. B. Kennzeichnung eines Fotos als "sonnig" oder "regnerisch").
  • Objekt-Erkennung: Zeichnen von 2D Bounding Boxes um Objekte von Interesse und Zuweisung einer Klasse zu jeder Box. Dadurch lernt das Modell, was das Objekt ist und wo es sich befindet.
  • Bildsegmentierung: Erstellen von pixel-perfekte Masken. Die semantische Segmentierung kennzeichnet Regionen nach Kategorie (z. B. alle "Straßen"-Pixel), während Instanzsegmentierung unterscheidet zwischen einzelnen Objekten der gleichen Klasse (z. B. "Auto 1", "Auto 2").
  • Schätzung der Körperhaltung: Annotieren bestimmter Schlüsselpunkte eines Objekts, z. B. der Gelenke eines eines menschlichen Körpers (Skelett-Tracking), um Bewegungen und Körperhaltung zu verstehen.

Anwendungsfälle in der Praxis

Die Kennzeichnung von Daten ermöglicht es der KI, in komplexen, realen Umgebungen zu funktionieren. Zwei prominente Beispiele sind:

  1. Autonome Fahrzeuge: Damit ein selbstfahrende Auto sicher navigieren kann, ist es auf Trainingsdaten angewiesen, in denen Menschen akribisch Fahrspuren markiert haben, Verkehrsschilder, Fußgänger und andere Fahrzeuge. Dies ermöglicht es dem Wahrnehmungssystem des Autos, die Straßengeometrie Straßengeometrie und potenzielle Gefahren sofort zu erkennen. Weitere Informationen hierzu finden Sie in unseren Lösungen für KI im Automobilbereich.
  2. Medizinische Bildanalyse: Im Gesundheitswesen kennzeichnen Radiologen medizinische Scans, um Anomalien zu erkennen. Zum Beispiel können Experten bei einem Hirntumor-Datensatz könnten die Experten die genauen die genauen Grenzen einer Läsion. Anhand dieser beschrifteten Daten werden Modelle trainiert, die den Ärzten bei der Frühdiagnose helfen und die Ergebnisse für die Patienten. Lesen Sie mehr über KI im Gesundheitswesen, um diese Modelle in Aktion zu sehen.

Datenkennzeichnung vs. verwandte Konzepte

Es ist hilfreich, die Kennzeichnung von ähnlichen Begriffen zu unterscheiden, die in der Datenvorbereitungspipeline verwendet werden:

  • Vs. Daten-Anmerkung: Diese Begriffe werden oft austauschbar verwendet. Allerdings ist "Beschriftung" manchmal für einfachere Aufgaben wie Klassifizierung (Tagging), während "Annotation" umfangreichere Metadaten wie das Zeichnen von Polygonen oder das Plotten von Keypoints.
  • Vs. Datenerweiterung: Bei der Beschriftung wird der Ausgangsdatensatz erstellt. Die Erweiterung erfolgt im Nachhinein, indem die Software die Software die beschrifteten Bilder mathematisch verändert (Drehen, Spiegeln, Hinzufügen von Rauschen), um die Vielfalt des Datensatzes künstlich zu erhöhen, ohne dass manuelle menschlichen Einsatz.
  • Vs. Datenbereinigung: Dies beinhaltet die Beseitigung von Fehlern im Datensatz, z. B. das Entfernen beschädigter Dateien oder die Korrektur falsch beschrifteter Elemente. Die Bereinigung gewährleistet die Integrität der von den Annotatoren vergebenen Labels.

Tools und Code-Beispiele

Die manuelle Beschriftung ist zwar zeitaufwändig, aber moderne Arbeitsabläufe nutzen oft spezialisierte Software wie CVAT (Computer Vision Annotation Tool) oder nutzen aktives Lernen, um den Prozess zu beschleunigen. Die Ultralytics Plattform ist darauf ausgelegt, diesen gesamten Lebenszyklus, von der Datenbeschaffung bis zur automatischen Beschriftung.

Das folgende Python zeigt, wie man ein YOLO11 mit einem vormarkierten Datensatz trainiert (coco8.yaml). Der Trainingsprozess beruht vollständig auf dem Vorhandensein genauer Bezeichnungen, die in der Konfigurationsdatei des Datensatzes definiert sind.

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
# The dataset YAML file contains paths to images and their corresponding labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

# The model updates its weights based on the labeled data provided

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten