Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024
Glossar

Datenerweiterung

Verbessern Sie Ihre Modelle für maschinelles Lernen mit Datenerweiterung. Entdecken Sie Techniken, um die Genauigkeit zu erhöhen, Overfitting zu reduzieren und die Robustheit zu verbessern.

Datenaugmentation ist eine wichtige Technik im maschinellen Lernen (ML), die verwendet wird, um die Größe und Vielfalt eines Trainingsdatensatzes künstlich zu erhöhen. Dies wird erreicht, indem modifizierte, aber realistische Versionen bestehender Datenstichproben erstellt werden. Das Hauptziel ist die Verbesserung der Leistung und Robustheit von KI-Modellen, insbesondere im Bereich Computer Vision (CV), indem diese während des Trainings einer größeren Vielfalt von Bedingungen ausgesetzt werden. Dies hilft, Overfitting zu verhindern, bei dem ein Modell die Trainingsdaten zu gut lernt, aber nicht auf neue, ungesehene Daten verallgemeinern kann, was letztendlich zu einer höheren Modell-Genauigkeit führt.

Wie Data Augmentation funktioniert

In der Computer Vision umfasst die Datenerweiterung die Anwendung einer Reihe von Transformationen auf Bilder. Diese Transformationen sind darauf ausgelegt, reale Variationen zu simulieren, denen ein Modell nach dem Deployment begegnen könnte. Zu den gängigen Techniken gehören:

  • Geometrische Transformationen: Diese verändern die räumliche Ausrichtung eines Bildes. Beispiele hierfür sind zufällige Drehungen, Skalierungen, Translationen (Verschiebungen), Zuschneiden und Spiegeln (horizontal oder vertikal). Diese lehren das Modell, invariant gegenüber der Position und Ausrichtung des Objekts zu sein.
  • Farbraumtransformationen: Diese verändern die Farbeigenschaften eines Bildes. Anpassungen von Helligkeit, Kontrast, Sättigung und Farbton machen das Modell widerstandsfähiger gegen Veränderungen der Lichtverhältnisse.
  • Fortschrittliche Techniken: Komplexere Methoden beinhalten eine stärkere Veränderung des Bildinhalts. Dazu kann das Hinzufügen von zufälligem Rauschen (wie Gaußsches Rauschen), das Anwenden von Unschärfeeffekten oder die Verwendung von Methoden wie Mixup gehören, die neue Bilder durch lineare Kombination von zwei bestehenden Bildern erzeugt, und Cutout, das zufällig Bereiche eines Bildes entfernt. Weitere Informationen zu diesen Methoden finden Sie im The Ultimate Guide to Data Augmentation.

Viele Deep-Learning-Frameworks, wie PyTorch und TensorFlow, bieten Werkzeuge zur Datenaugmentation. Spezialisierte Bibliotheken wie Albumentations bieten eine umfangreiche Sammlung von hochleistungsfähigen Augmentationstechniken und sind in Modelle wie Ultralytics YOLO11 integriert, um Trainingsdaten nahtlos zu diversifizieren.

Anwendungsfälle in der Praxis

Datenaugmentation ist eine Standardpraxis in vielen Bereichen, um zuverlässigere KI-Systeme zu entwickeln.

  1. KI im Gesundheitswesen: In der medizinischen Bildanalyse sind Datensätze aufgrund von Datenschutzbestimmungen und der Seltenheit bestimmter Krankheiten oft klein. Um ein Modell zur Erkennung von Tumoren in Scans zu trainieren, werden Augmentationstechniken wie Rotation, Skalierung und Helligkeitsänderungen verwendet, um einen vielfältigeren Satz von Trainingsbeispielen zu erstellen. Dies hilft dem Modell, Anomalien unabhängig von Variationen in der Bildgebungsausrüstung oder der Patientenpositionierung genau zu identifizieren, wodurch die diagnostische Zuverlässigkeit verbessert wird.
  2. KI für die Automobilindustrie: Die Entwicklung robuster Objekterkennungssysteme für autonome Fahrzeuge erfordert Daten aus unzähligen Fahrszenarien. Anstatt Daten für jede mögliche Bedingung zu sammeln, kann die Augmentierung verschiedene Wetterbedingungen simulieren (z. B. Hinzufügen von synthetischem Regen oder Schnee), Beleuchtung (Tag, Dämmerung, Nacht) und Okklusionen (z. B. ein Fußgänger, der teilweise von einem anderen Auto verdeckt wird). Dies macht das Wahrnehmungssystem des Fahrzeugs in unvorhersehbaren realen Umgebungen zuverlässiger.

Weitere wichtige Anwendungen sind KI in der Fertigung zur Qualitätskontrolle und KI in der Landwirtschaft zur Erkennung von Pflanzenkrankheiten unter verschiedenen Feldbedingungen.

Datenaugmentation vs. verwandte Konzepte

Es ist wichtig, Datenerweiterung von anderen datenbezogenen Techniken zu unterscheiden.

  • Synthetische Daten: Während beide Methoden Datensätze verbessern, arbeiten sie unterschiedlich. Data Augmentation verändert vorhandene reale Daten. Im Gegensatz dazu erzeugt die Generierung synthetischer Daten vollständig neue, künstliche Daten von Grund auf mithilfe von Simulationen oder generativen Modellen wie GANs. Während die Augmentierung die Varianz um beobachtete Daten erweitert, können synthetische Daten neuartige Szenarien erzeugen, die im ursprünglichen Datensatz nicht vorhanden sind, ein Konzept, das in dieser Übersicht über synthetische Daten in der Computer Vision untersucht wird.
  • Datenbereinigung: Die Datenbereinigung ist ein Teil der umfassenderen Datenvorverarbeitungs-Pipeline, die sich auf die Identifizierung und Korrektur von Fehlern, Inkonsistenzen und Ungenauigkeiten in einem Datensatz konzentriert. Ihr Ziel ist die Verbesserung der Datenqualität. Bei der Datenerweiterung hingegen geht es um die Erhöhung der Datenmenge und -vielfalt. Ein bereinigter Datensatz ist der ideale Ausgangspunkt vor der Anwendung der Erweiterung.
  • Transfer Learning: Diese Technik beinhaltet die Verwendung eines Modells, das auf einem großen Benchmark-Datensatz wie ImageNet vortrainiert wurde, und dessen anschließende Feinabstimmung auf einem kleineren, aufgabenspezifischen Datensatz. Data Augmentation wird oft während der Feinabstimmungsphase verwendet, um die Leistung weiter zu verbessern und eine Überanpassung an die neuen Daten zu verhindern.

Plattformen wie Ultralytics HUB rationalisieren den gesamten Modelltrainingsprozess und integrieren Datenerweiterung als einen wichtigen Schritt, um Benutzern beim Aufbau leistungsstarker, hochmoderner Vision-AI-Modelle zu helfen.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert