Glossar

Datenerweiterung

Verbessern Sie Ihre Modelle für maschinelles Lernen durch Datenerweiterung. Entdecken Sie Techniken zur Steigerung der Genauigkeit, zur Verringerung der Überanpassung und zur Verbesserung der Robustheit.

Die Datenerweiterung ist eine wichtige Technik beim maschinellen Lernen (ML), mit der die Größe und Vielfalt eines Trainingsdatensatzes künstlich vergrößert wird. Dies wird durch die Erstellung modifizierter, aber realistischer Versionen bestehender Datenproben erreicht. Das Hauptziel besteht darin, die Leistung und Robustheit von KI-Modellen zu verbessern, insbesondere im Bereich des maschinellen Sehens (CV), indem sie während des Trainings einer größeren Vielfalt von Bedingungen ausgesetzt werden. Dies hilft, eine Überanpassung zu verhindern, bei der ein Modell die Trainingsdaten zu gut lernt, aber nicht auf neue, ungesehene Daten verallgemeinert werden kann, was letztlich zu einer höheren Modellgenauigkeit führt.

Wie die Datenerweiterung funktioniert

In der Computer Vision beinhaltet die Datenerweiterung die Anwendung einer Reihe von Transformationen auf Bilder. Diese Transformationen sollen reale Variationen simulieren, denen ein Modell nach dem Einsatz begegnen könnte. Zu den gängigen Techniken gehören:

  • Geometrische Transformationen: Diese verändern die räumliche Ausrichtung eines Bildes. Beispiele sind zufällige Drehungen, Skalierungen, Übersetzungen (Verschiebungen), Beschneidungen und Spiegelungen (horizontal oder vertikal). Dadurch wird dem Modell beigebracht, dass es gegenüber der Position und Ausrichtung des Objekts unveränderlich ist.
  • Farbraumtransformationen: Diese verändern die Farbeigenschaften eines Bildes. Anpassungen von Helligkeit, Kontrast, Sättigung und Farbton machen das Modell widerstandsfähiger gegenüber Änderungen der Lichtverhältnisse.
  • Fortgeschrittene Techniken: Bei komplexeren Methoden wird der Bildinhalt in größerem Umfang verändert. Dazu gehören das Hinzufügen von Zufallsrauschen (z. B. Gaußsches Rauschen), das Anwenden von Unschärfeeffekten oder die Verwendung von Methoden wie Mixup, das neue Bilder durch die lineare Kombination zweier vorhandener Bilder erzeugt, und Cutout, das zufällig Bereiche eines Bildes entfernt. Mehr über diese Methoden erfahren Sie in The Ultimate Guide to Data Augmentation.

Viele Deep-Learning-Frameworks wie PyTorch und TensorFlow bieten Tools zur Datenerweiterung. Spezialisierte Bibliotheken wie Albumentations bieten eine umfangreiche Sammlung von leistungsstarken Augmentierungstechniken und sind in Modelle wie Ultralytics YOLO11 integriert, um Trainingsdaten nahtlos zu diversifizieren.

Anwendungen in der realen Welt

Die Datenerweiterung ist in vielen Bereichen ein Standardverfahren zur Entwicklung zuverlässigerer KI-Systeme.

  1. AI im Gesundheitswesen: Bei der medizinischen Bildanalyse sind die Datensätze aufgrund von Datenschutzbestimmungen für Patienten und der Seltenheit bestimmter Krankheiten oft klein. Um ein Modell für die Erkennung von Tumoren in Scans zu trainieren, werden durch Augmentierungstechniken wie Rotation, Skalierung und Helligkeitsänderungen vielfältigere Trainingsbeispiele erzeugt. Auf diese Weise kann das Modell Anomalien unabhängig von Variationen der Bildgebungsgeräte oder der Patientenpositionierung genau erkennen und die Diagnosesicherheit verbessern.
  2. AI für die Automobilindustrie: Die Entwicklung robuster Objekterkennungssysteme für autonome Fahrzeuge erfordert Daten aus unzähligen Fahrszenarien. Anstatt Daten für jede mögliche Bedingung zu sammeln, kann eine Erweiterung verschiedene Wetterbedingungen (z. B. Hinzufügen von künstlichem Regen oder Schnee), Beleuchtungen (Tag, Dämmerung, Nacht) und Verdeckungen (z. B. ein Fußgänger, der teilweise von einem anderen Auto verdeckt wird) simulieren. Dies macht das Wahrnehmungssystem des Fahrzeugs in unvorhersehbaren realen Umgebungen zuverlässiger.

Weitere wichtige Anwendungen sind KI in der Fertigung zur Qualitätskontrolle und KI in der Landwirtschaft zur Erkennung von Pflanzenkrankheiten unter unterschiedlichen Feldbedingungen.

Datenerweiterung vs. verwandte Konzepte

Es ist wichtig, die Datenerweiterung von anderen datenbezogenen Techniken zu unterscheiden.

  • Synthetische Daten: Beide Methoden erweitern zwar Datensätze, funktionieren aber unterschiedlich. Bei der Datenerweiterung werden vorhandene reale Daten verändert. Im Gegensatz dazu werden bei der Generierung synthetischer Daten mithilfe von Simulationen oder generativen Modellen wie GANs völlig neue, künstliche Daten von Grund auf geschaffen. Während die Datenerweiterung die Varianz der beobachteten Daten vergrößert, können mit synthetischen Daten neuartige Szenarien geschaffen werden, die im ursprünglichen Datensatz nicht vorhanden sind - ein Konzept, das in diesem Überblick über synthetische Daten in der Computer Vision untersucht wird.
  • Daten Reinigung: Die Datenbereinigung ist ein Teil der breiteren Datenvorverarbeitungspipeline, die sich auf die Identifizierung und Korrektur von Fehlern, Inkonsistenzen und Ungenauigkeiten in einem Datensatz konzentriert. Ihr Ziel ist die Verbesserung der Datenqualität. Bei der Datenerweiterung hingegen geht es um die Erhöhung der Datenmenge und -vielfalt. Ein sauberer Datensatz ist die ideale Ausgangsbasis für die Datenerweiterung.
  • Lernen übertragen: Bei dieser Technik wird ein Modell auf einem großen Benchmark-Datensatz wie ImageNet vortrainiert und dann auf einem kleineren, aufgabenspezifischen Datensatz feinabgestimmt. In der Phase der Feinabstimmung werden häufig Datenerweiterungen verwendet, um die Leistung weiter zu verbessern und eine Überanpassung an die neuen Daten zu verhindern.

Plattformen wie Ultralytics HUB rationalisieren den gesamten Modelltrainingsprozess, indem sie die Datenerweiterung als einen wichtigen Schritt einbeziehen, um den Benutzern zu helfen, leistungsstarke, hochmoderne KI-Modelle zu erstellen.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert