Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Validation croisée

Découvrez la puissance de la validation croisée dans l'apprentissage automatique pour améliorer la précision du modèle, éviter le surapprentissage et garantir des performances robustes.

La validation croisée est une méthode statistique robuste utilisée dans l'apprentissage l 'apprentissage machine (ML) pour évaluer la performance d'un performance d'un modèle et d'évaluer sa capacité à se généraliser à un ensemble de données indépendant. Contrairement aux méthodes d'évaluation d'évaluation standard qui s'appuient sur une seule division formation-test, la validation croisée implique la partition des données en sous-ensembles, la formation du modèle sur certains sous-ensembles et la validation du modèle sur d'autres sous-ensembles. le modèle sur certains sous-ensembles et le valider sur d'autres. Ce processus itératif permet d'identifier si un modèle souffre d'un surajustement. souffre d'un surajustement, en s'assurant que les modèles qu'il apprend sont applicables à de nouvelles données. qu'il apprend sont applicables à de nouvelles données inédites plutôt que de simplement mémoriser le bruit dans les données d'apprentissage. données d'apprentissage.

Fonctionnement de la validation croisée K-Fold

La variante la plus utilisée de cette technique est la validation croisée K-Fold. Cette méthode divise l'ensemble des données en k segments de taille égale ou "plis". Le processus de formation et d'évaluation est ensuite répété k fois. Au cours de chaque itération, un pli spécifique est retenu comme données de validation pour les tests, tandis que le reste des données est utilisé comme données de validation pour les tests. données de validation pour les tests, tandis que les k-1 plis restants sont utilisés pour la formation.

  1. Répartition : L'ensemble de données est mélangé de manière aléatoire et divisé en k groupes.
  2. Itération : Pour chaque groupe unique, le modèle est formé à partir de zéro en utilisant les autres groupes.
  3. L'évaluation : La performance du modèle est testée par rapport au groupe retenu à l'aide de paramètres tels que la précision ou la précision moyenne (mAP).
  4. Agrégation : La moyenne des scores des k boucles est calculée pour produire une seule estimation fiable des performances. fiable.

Cette approche garantit que chaque point de données est utilisé exactement une fois pour la formation et la validation, ce qui permet d'obtenir une estimation moins biaisée de l'erreur de généralisation du modèle. moins biaisée de l'erreur de généralisation du modèle.

Différencier la validation croisée des ensembles de validation

Il est important de faire la distinction entre la validation standard et la validation croisée. Dans un flux de travail traditionnel, les données sont divisées de manière statique en données de formation, de validation et de test. données de test. Bien qu'elle soit moins coûteuse en termes de calcul, cette division unique peut être trompeuse si l'ensemble de validation choisi est exceptionnellement facile à utiliser. peut être trompeuse si l'ensemble de validation choisi est exceptionnellement facile ou difficile.

La validation croisée atténue ce risque en calculant la moyenne des performances sur plusieurs splits, ce qui en fait la méthode préférée pour la sélection des modèles. pour la sélection de modèles et l'ajustement d'hyperparamètres l 'ajustement des hyperparamètres, en particulier lorsque l'ensemble lorsque l'ensemble de données disponible est petit. Bien que des frameworks tels que Scikit-Learn fournissent des outils complets de validation croisée pour la ML classique, les flux de travail d'apprentissage profond mettent souvent en œuvre ces boucles manuellement ou via des configurations de jeux de données spécifiques.

from ultralytics import YOLO

# Example: Iterating through pre-prepared K-Fold dataset YAML files
# A fresh model is initialized for each fold to ensure independence
yaml_files = ["fold1.yaml", "fold2.yaml", "fold3.yaml", "fold4.yaml", "fold5.yaml"]

for k, yaml_path in enumerate(yaml_files):
    model = YOLO("yolo11n.pt")  # Load a fresh YOLO11 model
    results = model.train(data=yaml_path, epochs=50, project="kfold_demo", name=f"fold_{k}")

Applications concrètes

La validation croisée est essentielle dans les secteurs où la fiabilité n'est pas négociable et où la rareté des données est un défi.

  • Imagerie médicale : En l 'analyse d'images médicales, les ensembles de données rares sont souvent limités. Lors de l'entraînement d'un modèle permettant d'identifier les anomalies dans un ensemble de données sur les tumeurs cérébrales, les chercheurs utilisent les données de la tumeur cérébrale, les chercheurs utilisent la validation croisée pour s'assurer que l'algorithme fonctionne de manière cohérente sur différents types de patients. Ce test rigoureux rigoureux est souvent exigé pour l'approbation réglementaire des dispositifs médicaux d'IA par la FDA. FDA des dispositifs médicaux d'IA, afin de prouver que l'outil de diagnostic est robuste et qu'il n'est pas biaisé par un sous-ensemble spécifique d'images.
  • Conduite autonome : La mise au point de véhicules sûrs nécessite des systèmes de détection d'objets systèmes de détection d'objets qui fonctionnent correctement dans divers environnements. Les ingénieurs qui utilisent des Ultralytics YOLO11 pour detect piétons ou des panneaux de signalisation peuvent recourir à la validation croisée sur des ensembles de données tels que Argoverse. En validant des plis contenant différentes conditions météorologiques ou scénarios d'éclairage, les développeurs peuvent déployer des modèles en toute confiance. conditions météorologiques ou des scénarios d'éclairage différents, les développeurs peuvent déployer en toute confiance des modèles qui maintiennent des normes de sécurité élevées dans le monde réel. qui maintiennent des normes de sécurité élevées dans le monde réel.

Avantages stratégiques du développement de modèles

La mise en œuvre de la validation croisée offre des avantages significatifs au cours du cycle de développement de l'IA. cycle de développement de l'IA. Elle permet une optimisation plus plus agressive du taux d'apprentissage et d'autres d'autres paramètres sans craindre d'adapter le modèle à un seul ensemble de validation. En outre, elle aide à naviguer le compromis biais-variance, aidant ainsi les les ingénieurs à trouver le point idéal où un modèle est suffisamment complexe pour capturer les modèles de données, mais suffisamment simple pour rester efficace sur de nouvelles entrées. pour rester efficace avec de nouvelles données.

Pour plus de détails sur la mise en œuvre pratique, vous pouvez consulter le guide sur la validation croisée K-Fold avec Ultralytics. La validation croisée K-Fold avec Ultralytics, qui explique comment structurer vos ensembles de données et vos boucles d'entraînement pour une efficacité maximale.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant