Glossar

Datenannotation

Was ist Datenannotation? Erfahren Sie, wie das Labeln von Daten mit Begrenzungsrahmen oder Polygonen für das Training genauer KI- und Computer-Vision-Modelle unerlässlich ist.

Datenannotation ist der Prozess der Kennzeichnung, Markierung oder Transkription von Rohdaten, um einen Kontext zu schaffen, den ein Modell für maschinelles Lernen (ML) verstehen kann. Dieser Schritt ist grundlegend für überwachte Lernen, bei dem Algorithmen sich auf Beispiele angewiesen sind, um Muster zu lernen und Vorhersagen zu treffen. Die beschrifteten Daten dienen als Grundwahrheit, die die "richtige" Antwort darstellt die das Modell während des Trainings zu replizieren versucht. Ohne genaue Beschriftung können selbst hochentwickelte Architekturen wie Ultralytics YOLO11 nicht effektiv funktionieren, da die die Leistung des Modells untrennbar mit der Qualität seiner Trainingsdaten gebunden ist.

Die Rolle der Annotation in Computer Vision

Im Bereich der Computer Vision (CV) beinhaltet die Daten Annotation die Markierung bestimmter Merkmale in Bildern oder Videoframes. Verschiedene Aufgaben erfordern unterschiedliche unterschiedliche Beschriftungsstile, die dem System jeweils einen besonderen Detaillierungsgrad verleihen.

Objekt-Erkennung: Annotatoren zeichnen 2D Bounding Boxes um Objekte von Interesse, wie z. B. Autos oder Fußgänger. Dadurch lernt das Modell, was ein Objekt ist und wo es sich befindet.
Instanz-Segmentierung: Bei dieser Technik müssen präzise Polygone um Objekte herum verfolgt werden. Im Gegensatz zu Bounding Boxes wird bei der Segmentierung die genaue Form und Kontur eines Objekts ab, was für Anwendungen wie Greifen durch Roboter.
Schätzung der Pose: Annotatoren markieren bestimmte "Schlüsselpunkte" eines Motivs, z. B. die Gelenke eines menschlichen Körpers (Ellbogen, Knie, Schultern). Dies ermöglicht Modelle Bewegungen und Körperhaltungen track .
Oriented Bounding Boxes (OBB): Verwendet für Objekte, die nicht an der Bildachse ausgerichtet sind, wie z. B. Schiffe in Satellitenbildern oder Pakete auf einem Förderband. Diese Boxen können gedreht werden, um sich der Ausrichtung des Objekts anzupassen.
Bildklassifizierung: Die einfachste Form der Annotation, bei der ein einziges Label (z. B. "sonnig", "regnerisch") einem ganzen Bild zugeordnet wird.

Anmerkungen werden normalerweise in strukturierten Formaten wie JSON, XML oder einfachen Textdateien (z. B. YOLO ) gespeichert, die dann von der Trainingssoftware geparst Schulungssoftware geparst werden.

Anwendungsfälle in der Praxis

Die Beschriftung von Daten ist die Grundlage zahlreicher moderner Technologien, da sie die Lücke zwischen Rohsensoren und intelligenten Entscheidungen schließt. Entscheidungsfindung.

Autonome Fahrzeuge: Selbstfahrende Autos sind auf riesige Datensätze angewiesen, in denen jede Fahrbahnmarkierung, jedes Verkehrsschild und jedes Hindernis vermerkt ist. Daten von Kameras und LiDAR-Sensoren werden beschriftet, um das Wahrnehmungssystem des Fahrzeugs um das Wahrnehmungssystem des Fahrzeugs zu schulen, damit es sicher navigieren kann. Dieser Detaillierungsgrad ist entscheidend für die Entwicklung robuster KI-Lösungen für die Automobilindustrie.
Medizinische Diagnostik: In KI im Gesundheitswesen kommentieren Radiologen MRI-Scans oder Röntgenbilder, um Tumore und Frakturen hervorzuheben. Diese kommentierten medizinischen Bilder ermöglichen es den Modellen, Ärzte zu unterstützen, indem sie indem sie potenzielle Anomalien mit hoher Empfindlichkeit markieren.
Intelligenter Einzelhandel: Automatisierte Kassensysteme nutzen Beschriftungen, um Produkte zu erkennen. Durch die Kennzeichnung Tausender von Lebensmitteln können die Systeme ein nahtloses Einkaufserlebnis ermöglichen. Siehe mehr über KI im Einzelhandel.

Vergleich mit verwandten Konzepten

Es ist hilfreich, die Datenanmerkung von anderen Begriffen zu unterscheiden, die häufig im Arbeitsablauf der Datenaufbereitung verwendet werden.

Beschriftung vs. Datenbeschriftung: Diese Begriffe werden oft synonym verwendet. Allerdings wird "Beschriftung" häufig mit einfachen Klassifizierungsaufgaben (Zuweisung einer Kategorie) assoziiert, während "Annotation" oft komplexere Metadaten wie das Zeichnen von Geometrie (Polygone, Boxen) oder das Markieren von Zeitstempeln in Videos.
Annotation vs. Datenerweiterung: Bei der Beschriftung werden die ersten Etiketten für einen Datensatz erstellt. Die Datenerweiterung ist ein separater Prozess, der diesen Datensatz künstlich diesen Datensatz künstlich erweitert, indem die vorhandenen beschrifteten Bilder verändert werden (z. B. Spiegeln, Drehen oder Ändern der Helligkeit) um die Robustheit des Modells zu verbessern.
Kommentierung vs. Aktives Lernen: Aktives Lernen ist eine Strategie, bei der das Modell feststellt, welche Datenpunkte es am meisten verwirren und und nur für diese spezifischen Beispiele menschliche Anmerkungen anfordert, wodurch das Budget für Anmerkungen optimiert wird.

Werkzeuge und Arbeitsablauf

Für die Erstellung qualitativ hochwertiger Anmerkungen sind oft spezielle Werkzeuge erforderlich. Open-Source-Optionen wie CVAT (Computer Vision Annotation Tool) und Label Studio bieten Schnittstellen zum Zeichnen von Boxen und Polygonen. Für groß angelegte können Teams auf integrierte Umgebungen wie die kommende Ultralytics Platform umsteigen, die den Lebenszyklus Lebenszyklus von der Datenbeschaffung bis zur Modellbereitstellung rationalisiert.

Sobald die Daten mit Anmerkungen versehen sind, können sie zum Trainieren eines Modells verwendet werden. Das folgende Beispiel zeigt, wie man ein YOLO11 Modells anhand eines in einer YAML-Datei definierten Datensatzes, der auf die annotierten Bilder und Labels verweist.

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")

# Train on the COCO8 dataset, which contains pre-annotated images
# The 'data' argument references a YAML file defining dataset paths and classes
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Datenannotation

Trainieren Sie Ultralytics YOLO zur Rationalisierung von Arbeitsabläufen in verschiedenen Branchen

Flexible Enterprise-Lizenzlösung zur Förderung Ihrer Innovationen

Trainieren Sie AI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Die Rolle der Annotation in Computer Vision

Anwendungsfälle in der Praxis

Vergleich mit verwandten Konzepten

Werkzeuge und Arbeitsablauf

Mehr in dieser Kategorie lesen

Verstehen, warum Annotationen durch Menschen entscheidend sind

Was ist Datensatzdestillation? Ein kurzer Überblick

Die Oakley Meta AI-Brille definiert mit Vision AI die Welt der Brillen neu.

Werden Sie Mitglied der Ultralytics