Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Validierungsdaten

Optimieren Sie Modelle des maschinellen Lernens mit Validierungsdaten, um Overfitting zu vermeiden, Hyperparameter abzustimmen und eine robuste Leistung in der realen Welt sicherzustellen.

Validierungsdaten sind eine Stichprobe von Daten, die nicht im Trainingsprozess verwendet werden und zur unvoreingenommenen Bewertung der Anpassung eines Modells während der Optimierung seiner Hyperparameter dienen. Die Hauptaufgabe des Validierungsdatensatzes besteht darin, die Entwicklung eines Machine-Learning (ML)-Modells zu steuern, indem er eine häufige, unabhängige Bewertung seiner Leistung bietet. Dieser Feedback-Loop ist entscheidend für die Erstellung von Modellen, die nicht nur mit den Daten, die sie gesehen haben, gut funktionieren, sondern auch effektiv auf neue, ungesehene Daten generalisieren, ein Konzept, das für die Erstellung robuster Systeme der künstlichen Intelligenz (KI) von zentraler Bedeutung ist.

Die Rolle von Validierungsdaten

Der Hauptzweck von Validierungsdaten ist die Verhinderung von Overfitting. Overfitting tritt auf, wenn ein Modell die Trainingsdaten zu gut lernt und dabei Rauschen und Details erfasst, die nicht für neue Daten gelten, wodurch seine Leistung beeinträchtigt wird. Durch das Testen des Modells anhand des Validierungsdatensatzes in regelmäßigen Abständen (z. B. nach jeder Epoche) können Entwickler seinen Generalisierungsfehler überwachen. Wenn sich die Leistung auf den Trainingsdaten weiter verbessert, während die Leistung auf den Validierungsdaten stagniert oder sich verschlechtert, ist dies ein deutliches Zeichen für Overfitting.

Dieser Evaluierungsprozess ist entscheidend für das Hyperparameter-Tuning. Hyperparameter sind Konfigurationseinstellungen, die außerhalb des Modells liegen, wie z. B. die Lernrate oder die Batch-Größe, die nicht aus den Daten gelernt werden. Der Validierungsdatensatz ermöglicht das Experimentieren mit verschiedenen Hyperparameterkombinationen, um die Kombination zu finden, die die beste Leistung erzielt. Dieser iterative Prozess ist ein Kernbestandteil der Modellauswahl und -optimierung.

Validierungsdaten vs. Trainings- und Testdaten

In einem typischen ML-Projekt wird der Datensatz in drei Teilmengen aufgeteilt, und das Verständnis ihrer unterschiedlichen Rollen ist grundlegend. Ein gängiger Ansatz zur Datenaufteilung ist die Zuweisung von 70 % für das Training, 15 % für die Validierung und 15 % für das Testen.

  • Trainingsdaten: Dies ist der größte Teil der Daten, der verwendet wird, um das Modell zu trainieren. Das Modell lernt iterativ Muster, Merkmale und Beziehungen aus diesem Datensatz, indem es seine internen Modellgewichte anpasst.
  • Validierungsdaten: Diese separate Teilmenge wird verwendet, um während des Trainingsprozesses eine unvoreingenommene Bewertung zu ermöglichen. Sie hilft bei der Feinabstimmung von Hyperparametern und bei wichtigen Entscheidungen, z. B. wann Early Stopping implementiert werden soll, um Overfitting zu verhindern. Im Ultralytics-Ökosystem wird diese Bewertung im Validierungsmodus gehandhabt.
  • Testdaten: Dieser Datensatz wird zurückgehalten, bis das Modell vollständig trainiert und optimiert ist. Er wird nur einmal verwendet, um eine abschließende, unverzerrte Bewertung der Leistung des Modells zu ermöglichen. Die Leistung des Testdatensatzes gibt an, wie sich das Modell voraussichtlich in einem realen Deployment-Szenario verhalten wird.

Die strikte Trennung, insbesondere zwischen den Validierungs- und Testdatensätzen, ist entscheidend, um die Fähigkeiten eines Modells genau zu beurteilen und den Bias-Variance-Tradeoff zu vermeiden.

Beispiele aus der Praxis

  1. Computer Vision Objekterkennung: Beim Training eines Ultralytics YOLO-Modells zur Erkennung von Objekten in Bildern (z. B. mit dem VisDrone-Datensatz) wird ein Teil der beschrifteten Bilder als Validierungsdaten beiseite gelegt. Während des Trainings wird der mAP (Mean Average Precision) des Modells für diesen Validierungssatz nach jeder Epoche berechnet. Dieser Validierungs-mAP hilft zu entscheiden, wann das Training beendet werden soll oder welche Datenaugmentierungs-Techniken am besten funktionieren, bevor eine endgültige Leistungsprüfung am Testdatensatz durchgeführt wird. Effektive Modellbewertungsstrategien stützen sich stark auf diese Aufteilung.
  2. Natural Language Processing Text Classification: Bei der Entwicklung eines Modells zur Klassifizierung von Kundenrezensionen als positiv oder negativ (Sentimentanalyse) wird ein Validierungsset verwendet, um die optimale Architektur (z. B. LSTM vs. Transformer) auszuwählen oder Hyperparameter wie Dropout-Raten abzustimmen. Das Modell, das die höchste F1-Score oder Genauigkeit im Validierungsset erzielt, wird für den endgültigen Test ausgewählt. Ressourcen wie Hugging Face Datasets stellen häufig Datensätze bereit, die für diesen Zweck vorab aufgeteilt wurden.

Kreuzvalidierung

Wenn die Menge der verfügbaren Daten begrenzt ist, wird häufig eine Technik namens Kreuzvalidierung (speziell K-Fold-Kreuzvalidierung) eingesetzt. Hierbei werden die Trainingsdaten in 'K'-Teilmengen (Folds) aufgeteilt. Das Modell wird K-mal trainiert, wobei jedes Mal K-1 Folds für das Training und der verbleibende Fold als Validierungsset verwendet werden. Die Leistung wird dann über alle K-Durchläufe gemittelt. Dies liefert eine robustere Schätzung der Modellleistung und nutzt begrenzte Daten besser, wie in Ressourcen wie der Scikit-Learn-Dokumentation und dem Ultralytics K-Fold-Kreuzvalidierungsleitfaden erläutert.

Zusammenfassend lässt sich sagen, dass Validierungsdaten ein Eckpfeiler für die Entwicklung zuverlässiger und leistungsstarker KI-Modelle mit Frameworks wie PyTorch und TensorFlow sind. Sie ermöglichen eine effektive Hyperparameter-Optimierung, Modellauswahl und Overfitting-Prävention und stellen sicher, dass Modelle über die Daten, mit denen sie trainiert wurden, hinaus gut generalisieren. Plattformen wie Ultralytics HUB bieten integrierte Tools zur effektiven Verwaltung dieser Datensätze.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert