Datenannotation
Was ist Datenannotation? Erfahren Sie, wie das Labeln von Daten mit Begrenzungsrahmen oder Polygonen für das Training genauer KI- und Computer-Vision-Modelle unerlässlich ist.
Datenannotation ist der Prozess der Kennzeichnung, Markierung oder Transkription von Rohdaten, um einen Kontext zu schaffen, den ein
Modell für maschinelles Lernen (ML) verstehen kann.
Dieser Schritt ist grundlegend für
überwachte Lernen, bei dem Algorithmen sich auf
Beispiele angewiesen sind, um Muster zu lernen und Vorhersagen zu treffen. Die beschrifteten Daten dienen als
Grundwahrheit, die die "richtige" Antwort darstellt
die das Modell während des Trainings zu replizieren versucht. Ohne genaue Beschriftung können selbst hochentwickelte Architekturen
wie Ultralytics YOLO11 nicht effektiv funktionieren, da die
die Leistung des Modells untrennbar mit der Qualität seiner
Trainingsdaten gebunden ist.
Die Rolle der Annotation in Computer Vision
Im Bereich der Computer Vision (CV) beinhaltet die Daten
Annotation die Markierung bestimmter Merkmale in Bildern oder Videoframes. Verschiedene Aufgaben erfordern unterschiedliche
unterschiedliche Beschriftungsstile, die dem System jeweils einen besonderen Detaillierungsgrad verleihen.
-
Objekt-Erkennung: Annotatoren
zeichnen 2D Bounding Boxes um Objekte von Interesse,
wie z. B. Autos oder Fußgänger. Dadurch lernt das Modell, was ein Objekt ist und wo es sich befindet.
-
Instanz-Segmentierung:
Bei dieser Technik müssen präzise Polygone um Objekte herum verfolgt werden. Im Gegensatz zu Bounding Boxes wird bei der Segmentierung die genaue
Form und Kontur eines Objekts ab, was für Anwendungen wie
Greifen durch Roboter.
-
Schätzung der Pose: Annotatoren markieren bestimmte
"Schlüsselpunkte" eines Motivs, z. B. die Gelenke eines menschlichen Körpers (Ellbogen, Knie, Schultern). Dies ermöglicht
Modelle Bewegungen und Körperhaltungen track .
-
Oriented Bounding Boxes (OBB): Verwendet für
Objekte, die nicht an der Bildachse ausgerichtet sind, wie z. B. Schiffe in Satellitenbildern oder Pakete auf einem Förderband.
Diese Boxen können gedreht werden, um sich der Ausrichtung des Objekts anzupassen.
-
Bildklassifizierung: Die
einfachste Form der Annotation, bei der ein einziges Label (z. B. "sonnig", "regnerisch") einem
ganzen Bild zugeordnet wird.
Anmerkungen werden normalerweise in strukturierten Formaten wie JSON,
XML oder einfachen Textdateien (z. B. YOLO ) gespeichert, die dann von der Trainingssoftware geparst
Schulungssoftware geparst werden.
Anwendungsfälle in der Praxis
Die Beschriftung von Daten ist die Grundlage zahlreicher moderner Technologien, da sie die Lücke zwischen Rohsensoren und intelligenten Entscheidungen schließt.
Entscheidungsfindung.
-
Autonome Fahrzeuge:
Selbstfahrende Autos sind auf riesige Datensätze angewiesen, in denen jede Fahrbahnmarkierung, jedes Verkehrsschild und jedes Hindernis vermerkt ist. Daten
von Kameras und LiDAR-Sensoren werden beschriftet, um das Wahrnehmungssystem des Fahrzeugs
um das Wahrnehmungssystem des Fahrzeugs zu schulen, damit es sicher navigieren kann. Dieser Detaillierungsgrad ist entscheidend für die Entwicklung robuster
KI-Lösungen für die Automobilindustrie.
-
Medizinische Diagnostik: In
KI im Gesundheitswesen kommentieren Radiologen
MRI-Scans oder
Röntgenbilder, um Tumore und Frakturen hervorzuheben. Diese kommentierten medizinischen Bilder ermöglichen es den Modellen, Ärzte zu unterstützen, indem sie
indem sie potenzielle Anomalien mit hoher Empfindlichkeit markieren.
-
Intelligenter Einzelhandel: Automatisierte Kassensysteme nutzen Beschriftungen, um Produkte zu erkennen. Durch die Kennzeichnung
Tausender von Lebensmitteln können die Systeme ein nahtloses Einkaufserlebnis ermöglichen. Siehe mehr über
KI im Einzelhandel.
Vergleich mit verwandten Konzepten
Es ist hilfreich, die Datenanmerkung von anderen Begriffen zu unterscheiden, die häufig im Arbeitsablauf der Datenaufbereitung verwendet werden.
-
Beschriftung vs. Datenbeschriftung:
Diese Begriffe werden oft synonym verwendet. Allerdings wird "Beschriftung" häufig mit einfachen
Klassifizierungsaufgaben (Zuweisung einer Kategorie) assoziiert, während "Annotation" oft komplexere Metadaten
wie das Zeichnen von Geometrie (Polygone, Boxen) oder das Markieren von Zeitstempeln in Videos.
-
Annotation vs. Datenerweiterung:
Bei der Beschriftung werden die ersten Etiketten für einen Datensatz erstellt. Die Datenerweiterung ist ein separater Prozess, der diesen Datensatz künstlich
diesen Datensatz künstlich erweitert, indem die vorhandenen beschrifteten Bilder verändert werden (z. B. Spiegeln, Drehen oder Ändern der Helligkeit)
um die Robustheit des Modells zu verbessern.
-
Kommentierung vs. Aktives Lernen:
Aktives Lernen ist eine Strategie, bei der das Modell feststellt, welche Datenpunkte es am meisten verwirren und
und nur für diese spezifischen Beispiele menschliche Anmerkungen anfordert, wodurch das Budget für Anmerkungen optimiert wird.
Werkzeuge und Arbeitsablauf
Für die Erstellung qualitativ hochwertiger Anmerkungen sind oft spezielle Werkzeuge erforderlich. Open-Source-Optionen wie
CVAT (Computer Vision Annotation Tool) und
Label Studio bieten Schnittstellen zum Zeichnen von Boxen und Polygonen. Für groß angelegte
können Teams auf integrierte Umgebungen wie die kommende Ultralytics Platform umsteigen, die den Lebenszyklus
Lebenszyklus von der Datenbeschaffung bis zur Modellbereitstellung rationalisiert.
Sobald die Daten mit Anmerkungen versehen sind, können sie zum Trainieren eines Modells verwendet werden. Das folgende Beispiel zeigt, wie man ein YOLO11
Modells anhand eines in einer YAML-Datei definierten Datensatzes, der auf die annotierten Bilder und Labels verweist.
from ultralytics import YOLO
# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")
# Train on the COCO8 dataset, which contains pre-annotated images
# The 'data' argument references a YAML file defining dataset paths and classes
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)