Glossaire

Ensemble de données de référence

Découvre comment les ensembles de données de référence stimulent l'innovation en matière d'IA en permettant une évaluation équitable des modèles, la reproductibilité et le progrès dans l'apprentissage automatique.

Un ensemble de données de référence est une collection normalisée de données utilisée pour évaluer et comparer les performances des modèles d'apprentissage machine (ML). Ces ensembles de données sont cruciaux dans le développement de l'intelligence artificielle (IA), car ils fournissent une base de référence cohérente et objective pour mesurer les performances de différents algorithmes sur des tâches spécifiques. Les chercheurs et les développeurs utilisent largement les ensembles de données de référence pour tester de nouveaux modèles, valider les améliorations apportées aux modèles existants, s'assurer que les modèles répondent à des normes reconnues et suivre les progrès réalisés au sein de la communauté de l'IA, en particulier dans des domaines tels que la vision artificielle (CV).

Importance des ensembles de données de référence

Les ensembles de données de référence sont fondamentaux parce qu'ils établissent des règles du jeu équitables pour l'évaluation des modèles. En utilisant exactement les mêmes données et les mêmes critères d'évaluation, les chercheurs peuvent comparer directement et équitablement les forces et les faiblesses de différents modèles dans des conditions identiques. Cette pratique favorise la reproductibilité de la recherche, ce qui permet à d'autres de vérifier plus facilement les résultats et de s'appuyer sur les travaux existants. Les repères permettent d'identifier les domaines dans lesquels les modèles excellent ou éprouvent des difficultés, ce qui oriente les orientations futures de la recherche et les efforts de développement vers la création de systèmes d'IA plus robustes et plus fiables. Ils servent de jalons, permettant à la communauté de mesurer les progrès réalisés au fil du temps.

Caractéristiques principales des ensembles de données de référence

Les ensembles de données de référence de haute qualité partagent généralement plusieurs caractéristiques clés :

Représentativité : Les données doivent refléter fidèlement les scénarios du monde réel ou le domaine de problèmes spécifiques auquel le modèle est destiné.
Taille et diversité : Ils doivent être suffisamment importants et diversifiés pour permettre une évaluation significative et empêcher les modèles de simplement mémoriser les données(surajustement). Des ensembles de données de vision par ordinateur de haute qualité sont essentiels.
Annotations claires : Les données doivent être étiquetées de façon précise et cohérente(étiquetage des données) selon des directives bien définies.
Mesures d'évaluation normalisées : Les repères sont généralement accompagnés de mesures spécifiques (par exemple, précision, mAP, IoU) et de protocoles d'évaluation afin d'assurer des comparaisons cohérentes.
Accessibilité : Ils doivent être facilement accessibles à la communauté des chercheurs, souvent par le biais de dépôts publics ou de défis.

Applications des ensembles de données de référence

Les ensembles de données de référence sont largement utilisés à travers diverses tâches d'IA et d'apprentissage profond (DL), notamment :

Détection d'objets: Des ensembles de données tels que COCO, PASCAL VOC et Open Images V7 sont standard pour évaluer les modèles qui localisent et classent les objets dans les images.
Classification d'images: ImageNet est peut-être l'indice de référence le plus célèbre, à l'origine d'avancées significatives dans la classification des images en catégories prédéfinies. Parmi les autres, on peut citer CIFAR-10 et MNIST.
Segmentation des instances: Les tâches nécessitant des contours d'objets au niveau du pixel utilisent souvent des repères tels que COCO ou LVIS.
Estimation de la pose: Les ensembles de données tels que COCO-Pose sont utilisés pour évaluer les modèles qui détectent les points clés des personnes ou des objets.
Tâches spécifiques à un domaine : Il existe des références spécialisées dans des domaines tels que l'analyse d'images médicales (par exemple, Brain Tumor Detection Dataset), la conduite autonome(Argoverse, nuScenes) et l'imagerie aérienne(VisDrone). L'ensemble de donnéesRoboflow 100 fournit une référence diversifiée dans de multiples domaines.

Exemples concrets

Comparaison des modèles de détection d'objets : Quand Ultralytics développe un nouveau modèle comme Ultralytics YOLO11ses performances sont rigoureusement testées sur des ensembles de données de référence standard tels que COCO. Les résultats (comme les scores mAP) sont comparés aux versions précédentes (YOLOv8YOLOv8, YOLOv10) et à d'autres modèles de pointe. Ces comparaisons de modèles aident les utilisateurs à choisir le meilleur modèle pour leurs besoins spécifiques, que ce soit pour la recherche universitaire ou les applications commerciales. Des plateformes comme Ultralytics HUB permettent aux utilisateurs de former des modèles et éventuellement de les comparer sur des données personnalisées.
Faire progresser la conduite autonome : Les entreprises qui développent des technologies pour les véhicules autonomes s'appuient fortement sur des référentiels comme Argoverse ou nuScenes. Ces ensembles de données contiennent des scénarios de conduite urbaine complexes avec des annotations détaillées pour les voitures, les piétons, les cyclistes, etc. En évaluant leurs modèles de perception sur ces benchmarks, les entreprises peuvent mesurer les améliorations apportées à la précision de la détection, à la fiabilité du suivi et à la robustesse globale du système, ce qui est essentiel pour garantir la sécurité de l'IA pour les voitures autonomes.

Comparaison avec d'autres ensembles de données

Il est important de distinguer les ensembles de données de référence des autres fractionnements de données utilisés dans le cycle de vie de la ML :

Données d'apprentissage: Utilisées pour enseigner le modèle en ajustant ses paramètres en fonction des exemples d'entrée et des étiquettes correspondantes. Il s'agit généralement de la plus grande partie des données. Des techniques telles que l'augmentation des données sont souvent appliquées ici.
Données de validation: Utilisées pendant la formation pour ajuster les hyperparamètres du modèle (comme le taux d'apprentissage ou les choix d'architecture) et fournir une estimation non biaisée de la compétence du modèle pendant l'ajustement. Elles permettent d'éviter l'ajustement excessif aux données d'apprentissage.
Données de test: Utilisées après que le modèle a été entièrement formé pour fournir une évaluation finale et impartiale de ses performances sur des données inédites. Les ensembles de données de référence servent souvent d'ensembles de test standardisés pour comparer différents modèles développés indépendamment.

Bien qu'un ensemble de données de référence puisse être utilisé comme un ensemble de test, son objectif premier est plus large : fournir une norme commune de comparaison à l'ensemble de la communauté des chercheurs, souvent facilitée par des classements publics associés à des défis tels que le défi de reconnaissance visuelle à grande échelle ImageNet (ILSVRC).

Ensemble de données de référence

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

Solution flexible de licence d'entreprise pour alimenter ton innovation.

Entraîne des modèles d'IA en quelques secondes avec Ultralytics YOLO

Entraîne les modèles YOLO simplement avec Ultralytics HUB

Importance des ensembles de données de référence

Caractéristiques principales des ensembles de données de référence

Applications des ensembles de données de référence

Exemples concrets

Comparaison avec d'autres ensembles de données

Lire plus de blogs

Rejoins la communauté Ultralytics

Ensemble de données de référence

Entraîne les modèles YOLO simplementavec Ultralytics HUB

Solution flexible de licence d'entreprise pour alimenter ton innovation.

Entraîne des modèles d'IA en quelques secondes avec Ultralytics YOLO

Entraîne les modèles YOLO simplement avec Ultralytics HUB

Importance des ensembles de données de référence

Caractéristiques principales des ensembles de données de référence

Applications des ensembles de données de référence

Exemples concrets

Comparaison avec d'autres ensembles de données

Lire plus de blogs

Rejoins la communauté Ultralytics

Entraîne les modèles YOLO simplement
avec Ultralytics HUB