Glossar

Kreuzvalidierung

Erfahren Sie, wie Kreuzvalidierung die Modellgeneralisierung verbessert und Überanpassung verhindert. Entdecken Sie, wie Sie mit Ultralytics eine K-Fold-Bewertung für robustes ML implementieren können.

Die Kreuzvalidierung ist ein robustes statistisches Resampling-Verfahren, das zur Bewertung der Leistung von Modellen des maschinellen Lernens (ML) anhand einer begrenzten Datenstichprobe verwendet wird. Im Gegensatz zu einer Standard-Holdout-Methode, bei der die Daten in einen einzigen Trainings- und Testsatz aufgeteilt werden, umfasst die Kreuzvalidierung die Aufteilung des Datensatzes in mehrere Teilmengen, um sicherzustellen, dass jeder Datenpunkt sowohl für das Training als auch für die Validierung verwendet wird. Diese Technik ist entscheidend für die Beurteilung, wie sich die Ergebnisse einer statistischen Analyse auf einen unabhängigen Datensatz verallgemeinern lassen, und hilft dabei, Überanpassungen detect , bei denen ein Modell möglicherweise Trainingsbeispiele auswendig lernt, anstatt verallgemeinerbare Muster zu erlernen.

Der Mechanismus der K-fachen Kreuzvalidierung

Die am häufigsten verwendete Variante dieser Technik ist die K-Fold-Kreuzvalidierung. Bei diesem Verfahren wird der gesamte Datensatz zufällig in k gleich große Gruppen oder „Folds” unterteilt. Der Trainingsprozess wird dann k-mal wiederholt. Bei jeder Iteration dient ein einzelner Fold als Validierungsdaten zum Testen des Modells, während die verbleibenden k-1 Folds als Trainingsdaten dienen.

Die endgültige Leistungskennzahl wird in der Regel durch Mittelwertbildung der Ergebnisse berechnet, wie z. B. Genauigkeit, Präzision oder mittlere durchschnittliche Präzision (mAP), die aus jeder Schleife gewonnen werden. Dieser Ansatz reduziert die mit einem einzelnen Versuch einer Train-Test-Aufteilung verbundene Varianz erheblich und liefert eine zuverlässigere Schätzung des Generalisierungsfehlers. Er stellt sicher, dass die Bewertung nicht durch eine willkürliche Auswahl der Testdaten verzerrt wird.

Implementierung mit Ultralytics

Die Kreuzvalidierung ist besonders nützlich, wenn mit kleineren Datensätzen gearbeitet wird oder wenn eine strenge Hyperparameteroptimierung durchgeführt wird. Während moderne Deep-Learning-Frameworks wie PyTorch die Trainingsschleife erleichtern , erfordert die Verwaltung der Folds eine sorgfältige Datenvorbereitung.

Das folgende Beispiel zeigt, wie Sie vorab generierte YAML-Konfigurationsdateien für ein 5-faches Kreuzvalidierungsexperiment mit dem YOLO26-Modell durchlaufen können. Dabei wird davon ausgegangen, dass Sie Ihren Datensatz bereits in fünf separate Konfigurationsdateien aufgeteilt haben.

from ultralytics import YOLO

# List of dataset configuration files representing 5 folds
fold_yamls = [f"dataset_fold_{i}.yaml" for i in range(5)]

for i, yaml_file in enumerate(fold_yamls):
    # Load a fresh YOLO26 Nano model for each fold
    model = YOLO("yolo26n.pt")

    # Train the model, saving results to a unique project directory
    results = model.train(data=yaml_file, epochs=20, project="cv_experiment", name=f"fold_{i}")

Weitere Informationen zur Automatisierung der Split-Generierung finden Sie im Leitfaden zu K-Fold-Kreuzvalidierung.

Anwendungsfälle in der Praxis

Die Kreuzvalidierung ist in Branchen unverzichtbar, in denen Daten rar und teuer in der Erhebung sind oder in denen sicherheitskritische Zuverlässigkeit erforderlich ist.

Medizinische Diagnostik: Bei der medizinischen Bildanalyse sind Datensätze für seltene Erkrankungen oft klein. Eine einzelne Validierungsteilung könnte versehentlich schwierige Fälle oder seltene Pathologien ausschließen. Durch die Verwendung von Kreuzvalidierung stellen Forscher, die KI im Gesundheitswesen entwickeln, sicher, dass ihre Diagnosemodelle an allen verfügbaren Patienten-Scans getestet werden, um zu validieren, dass das System über verschiedene Demografien und Gerätetypen hinweg funktioniert.
Präzisionslandwirtschaft: Die Umweltbedingungen im Freien variieren stark. Ein Modell, das für die Erkennung von Pflanzenkrankheiten trainiert wurde, funktioniert möglicherweise gut an sonnigen Tagen, versagt jedoch bei bewölktem Himmel, wenn diese Bilder nur im Trainingssatz enthalten waren. Die Kreuzvalidierung stellt sicher, dass das Modell gegenüber solchen Schwankungen robust ist, sodass Landwirte sich auf automatisierte Machine-Learning-Tools (AutoML) für eine konsistente Überwachung unabhängig von den Wetterbedingungen verlassen können.

Strategische Vorteile bei der Modellentwicklung

Die Integration der Kreuzvalidierung in den Entwicklungszyklus der KI liefert entscheidende Erkenntnisse über den Kompromiss zwischen Verzerrung und Varianz.

Stabilitätsbewertung: Wenn die Leistungskennzahlen zwischen den Folds erheblich variieren, deutet dies darauf hin, dass das Modell sehr empfindlich auf die für das Training verwendeten spezifischen Datenpunkte reagiert, was auf eine hohe Varianz hindeutet.
Dateneffizienz: Sie maximiert den Nutzen begrenzter Daten, da jede Beobachtung letztendlich sowohl für das Training als auch für die Validierung verwendet wird .
Hyperparameter-Optimierung: Sie bietet einen zuverlässigen Maßstab für die Auswahl der besten Lerngeschwindigkeit, Batchgröße oder Datenvergrößerungsstrategien, ohne dass man einen Blick auf den endgültigen Testsatz werfen muss.

Differenzierung verwandter Konzepte

Es ist wichtig, die Kreuzvalidierung von anderen Bewertungsbegriffen zu unterscheiden:

vs. Hold-out-Validierung: Hold-out umfasst eine einzige Aufteilung (z. B. 80/20). Dies ist zwar schneller und eignet sich für riesige Datensätze wie ImageNet, ist sie statistisch weniger robust als die Kreuzvalidierung für kleinere Datensätze.
vs. Bootstrapping: Bootstrapping umfasst eine Zufallsstichprobe mit Ersetzung, während die K-Fold-Kreuzvalidierung die Daten ohne Ersetzung partitioniert (jede Stichprobe befindet sich in genau einer Falte).

Die Verwaltung der Artefakte, Metriken und Modelle aus mehreren Folds kann komplex sein. Ultralytics vereinfacht dies durch zentralisierte Experimentverfolgung , sodass Teams die Leistung verschiedener Folds vergleichen und Erkenntnisse aus der Modellbewertung mühelos visualisieren können .

Kreuzvalidierung

Trainieren Sie Ultralytics YOLO zur Rationalisierung von Arbeitsabläufen in verschiedenen Branchen

Flexible Enterprise-Lizenzlösung zur Förderung Ihrer Innovationen

Trainieren Sie AI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Der Mechanismus der K-fachen Kreuzvalidierung

Implementierung mit Ultralytics

Anwendungsfälle in der Praxis

Strategische Vorteile bei der Modellentwicklung

Differenzierung verwandter Konzepte

Mehr in dieser Kategorie lesen

12 Anwendungsfälle für Luftbildaufnahmen, unterstützt durch Computer Vision

Was ist monokulare Tiefenschätzung? Ein Überblick

Ein Blick auf die Verwendung von Ultralytics YOLO für die KI-Bedrohungserkennung

Werden Sie Mitglied der Ultralytics