Glossaire

Données d'essai

Découvrez l'importance des données de test dans l'IA, leur rôle dans l'évaluation des performances des modèles, la détection du surajustement et la garantie de la fiabilité dans le monde réel.

Les données de test sont un élément crucial du cycle de développement de l'apprentissage automatique. Il s'agit d'un ensemble de données indépendant, distinct des ensembles de formation et de validation, utilisé exclusivement pour l'évaluation finale des performances d'un modèle une fois les phases de formation et de réglage terminées. Cet ensemble de données contient des points de données que le modèle n'a jamais rencontrés auparavant, fournissant une évaluation impartiale de la manière dont le modèle est susceptible de fonctionner sur de nouvelles données du monde réel. L'objectif principal de l'utilisation des données de test est d'estimer la capacité de généralisation du modèle, c'est-à-dire sa capacité à fonctionner avec précision sur des données d'entrée inédites.

Importance des données d'essai

La véritable mesure du succès d'un modèle de ML réside dans sa capacité à traiter des données sur lesquelles il n'a pas été explicitement formé. Les données de test constituent le point de contrôle final, offrant une évaluation objective des performances du modèle. En l'absence d'un ensemble de tests dédié, le risque de surajustement est élevé : un modèle apprend trop bien les données d'apprentissage, y compris le bruit et les modèles spécifiques, mais ne parvient pas à se généraliser aux nouvelles données. L'utilisation de données de test permet de s'assurer que les mesures de performance rapportées reflètent les capacités attendues du modèle dans le monde réel, ce qui renforce la confiance avant le déploiement du modèle. Cette dernière étape d'évaluation est essentielle pour comparer de manière fiable différents modèles ou approches, comme par exemple YOLOv8 par rapport à YOLOv9. Elle s'aligne sur les meilleures pratiques telles que celles décrites dans les règles de Google en matière de ML.

Caractéristiques principales

Pour être efficaces, les données de test doivent posséder certaines caractéristiques :

  • Représentativité : Le modèle doit refléter fidèlement les caractéristiques des données réelles qu'il rencontrera après son déploiement. Cela inclut des distributions similaires de caractéristiques, de classes et de variations potentielles. De bonnes pratiques de collecte et d'annotation des données sont essentielles.
  • Indépendance : Les données de test doivent être strictement séparées des ensembles de formation et de validation. Elles ne doivent jamais être utilisées pour la formation du modèle ou le réglage de ses hyperparamètres. Tout chevauchement ou fuite peut conduire à des estimations de performance trop optimistes.
  • Taille suffisante : L'ensemble de tests doit être suffisamment important pour fournir des résultats statistiquement significatifs et estimer de manière fiable les performances du modèle.

Données de test vs. données de formation et de validation

Il est essentiel de distinguer les données de test des autres divisions de données utilisées en ML :

  • Données de formation: Il s'agit de la plus grande partie de l'ensemble de données, utilisée directement pour former le modèle. Le modèle apprend des modèles et des relations à partir de ces données grâce à des algorithmes tels que l'apprentissage supervisé.
  • Données de validation: Cet ensemble de données distinct est utilisé pendant la phase de formation pour ajuster les hyperparamètres du modèle (comme les choix d'architecture ou les paramètres d'optimisation) et prendre des décisions concernant le processus de formation (par exemple, l'arrêt précoce). Il fournit un retour d'information sur le degré de généralisation du modèle pendant la formation, guidant l'évaluation du modèle et le processus de réglage fin sans utiliser l'ensemble de test final.
  • Données de test : Utilisées une seule fois après l'achèvement de la formation et de la validation, elles fournissent une évaluation finale et impartiale de la performance du modèle sur des données inédites.

Il est essentiel de séparer correctement ces ensembles de données à l'aide de stratégies telles que le fractionnement minutieux des données pour développer des modèles fiables et évaluer avec précision leurs capacités dans le monde réel.

Exemples concrets

  1. Conduite autonome : Un modèle YOLO d'Ultralytics formé à la détection d'objets dans les voitures autonomes serait évalué sur un ensemble de tests contenant divers scénarios de conduite inédits (par exemple, conduite de nuit, forte pluie, intersections inconnues). Cela permet de s'assurer que le modèle détecte de manière fiable les piétons, les cyclistes et les autres véhicules(la technologie de Waymo s'appuie fortement sur ce type de tests) avant d'être déployé dans des véhicules réels.
  2. Diagnostic médical : dans l'analyse d'images médicales, un modèle formé à la détection de tumeurs à l'aide de données telles que le Brain Tumor Detection Dataset doit être évalué sur un ensemble de scans provenant de différents hôpitaux, machines et populations de patients qui n'ont pas fait partie de l'entraînement ou de la validation. Cela permet de confirmer la précision et la robustesse du diagnostic du modèle dans un contexte clinique réel.

Évaluation et gestion

Les performances sur l'ensemble de test sont généralement mesurées à l'aide d'indicateurs pertinents pour la tâche, tels que l'exactitude, la précision moyenne (mAP), ou d'autres indicateurs détaillés dans des guides tels que la documentation sur les indicateurs de performance de YOLO. Souvent, les modèles sont évalués par rapport à des ensembles de données de référence tels que COCO afin de garantir des comparaisons équitables et de promouvoir la reproductibilité. La gestion de ces ensembles de données distincts tout au long du cycle de vie du projet est facilitée par des plateformes comme Ultralytics HUB, qui permet d'organiser les séparations de données et de suivre les expériences de manière efficace.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers