Glossaire

Apprentissage actif

Découvre l'apprentissage actif, une méthode d'apprentissage automatique rentable qui booste la précision avec moins d'étiquettes. Découvre comment elle transforme la formation à l'IA !

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

L'apprentissage actif est un sous-domaine spécialisé de l'apprentissage machine (ML) dans lequel l'algorithme d'apprentissage peut interroger interactivement un utilisateur, souvent appelé "oracle" ou annotateur humain, pour demander des étiquettes pour de nouveaux points de données. Contrairement à l'apprentissage supervisé traditionnel, qui nécessite généralement un grand ensemble de données pré-étiquetées, l'apprentissage actif vise à atteindre des performances de modèle élevées avec beaucoup moins d'efforts d'étiquetage. Pour ce faire, il sélectionne stratégiquement les instances non étiquetées les plus informatives pour l'annotation. Cette approche est particulièrement utile dans les domaines où l'obtention de données étiquetées est coûteuse, prend du temps ou nécessite des connaissances spécialisées, comme l'analyse d'images médicales ou les tâches complexes de traitement du langage naturel (NLP). L'idée de base est de laisser le modèle guider le processus d'étiquetage des données, en concentrant les efforts humains là où ils auront le plus d'impact pour améliorer la précision du modèle.

Comment fonctionne l'apprentissage actif

Le processus d'apprentissage actif suit généralement un cycle itératif, permettant au modèle de s'améliorer progressivement grâce à des données ciblées :

  1. Formation initiale au modèle : Un modèle, tel qu'un Ultralytics YOLO pour la détection d'objets ou la segmentation d'images, est entraîné sur un petit ensemble de données initialement étiquetées.
  2. Interroger les données non étiquetées : Le modèle formé est utilisé pour faire des prédictions(inférence) sur un ensemble de données non étiquetées.
  3. Application de la stratégie d'interrogation : Une stratégie d'interrogation analyse les prédictions du modèle (par exemple, en fonction de la confiance ou de l'incertitude des prédictions) pour sélectionner les points de données non étiquetés les plus informatifs - ceux dont le modèle est le moins certain ou qui sont censés fournir le plus d'informations nouvelles.
  4. Annotation par l'oracle : Les points de données sélectionnés sont présentés à un annotateur humain (l'oracle) pour être étiquetés. Des pratiques efficaces de collecte et d'annotation des données sont ici cruciales.
  5. Réentraînement du modèle : Les données nouvellement étiquetées sont ajoutées à l'ensemble de formation et le modèle est réentraîné (ou affiné) avec cet ensemble de données élargi.
  6. Itération : Le cycle se répète à partir de l'étape 2 jusqu'à ce qu'un niveau de performance souhaité soit atteint, que le budget d'étiquetage soit épuisé ou qu'il ne reste plus d'échantillons significativement informatifs.

Stratégies de recherche

L'efficacité de l'apprentissage actif dépend fortement de sa stratégie d'interrogation - l'algorithme utilisé pour sélectionner les points de données non étiquetés qui doivent être ensuite étiquetés. L'objectif est de choisir des échantillons qui, une fois étiquetés, conduiront probablement à la plus grande amélioration des performances du modèle. Les stratégies courantes comprennent :

  • Échantillonnage d'incertitude : Sélectionne les cas où le modèle est le moins confiant dans sa prédiction. Ceci est souvent mesuré par la probabilité de prédiction, l'entropie ou la marge entre les meilleures prédictions.
  • Requête par comité (QBC) : Utilise un ensemble de modèles. Les instances où les membres du comité sont le plus en désaccord sur la prédiction sont sélectionnées pour l'étiquetage.
  • Changement de modèle attendu : Sélectionne les instances qui provoqueraient le plus grand changement des paramètres ou des gradients du modèle si leurs étiquettes étaient connues.
  • Approches basées sur la densité : Donne la priorité aux instances qui sont non seulement incertaines mais aussi représentatives des distributions de données sous-jacentes.

Un aperçu complet des stratégies peut être trouvé dans des ressources telles que l'étude documentaire sur l'apprentissage actif de Burr Settles.

Pertinence et avantages

L'apprentissage actif réduit considérablement la charge et le coût associés à l'étiquetage des données, qui constitue souvent un goulot d'étranglement majeur dans le développement de modèles robustes de Deep Learning (DL). En concentrant les efforts d'annotation de manière stratégique, il permet aux équipes de :

  • Obtenir une plus grande précision avec moins de données : Obtenir une meilleure performance du modèle par rapport à l'échantillonnage aléatoire, à budget d'étiquetage égal.
  • Réduire les coûts d'étiquetage : Minimise le temps et les ressources consacrés à l'annotation manuelle.
  • Accélère le développement des modèles : Atteins plus rapidement les niveaux de performance souhaités en donnant la priorité aux données les plus impactantes. Explore comment l 'apprentissage actif accélère le développement de la vision par ordinateur.
  • Améliorer la robustesse des modèles : Se concentrer sur des exemples ambigus ou difficiles peut aider les modèles à mieux se généraliser.

Applications dans le monde réel

L'apprentissage actif est appliqué dans divers domaines où les données étiquetées constituent une contrainte :

  • Imagerie médicale : Dans des tâches telles que la détection de tumeurs à l'aide de modèles YOLO , le temps des radiologues experts est précieux. L'apprentissage actif sélectionne les scans les plus ambigus à examiner, optimisant ainsi l'utilisation des ressources des experts. Ce point est crucial pour développer des solutions d'IA efficaces dans le domaine de la santé.
  • Traitement du langage naturel (NLP) : Pour des tâches telles que l'analyse des sentiments ou la reconnaissance des entités nommées (NER), l'identification d'échantillons de texte informatifs (par exemple, ceux avec des sentiments ambigus ou des entités rares) pour l'étiquetage améliore efficacement la précision du modèle. Les outils des plateformes telles que Hugging Face bénéficient souvent de ces techniques.
  • Véhicules autonomes : La sélection de scénarios de conduite difficiles ou rares (par exemple, des conditions météorologiques inhabituelles, des intersections complexes) à partir de vastes quantités de données de conduite non étiquetées pour l'annotation permet d'améliorer la sécurité et la fiabilité des systèmes de conduite autonome.
  • Analyse d'images satellites : L'identification de caractéristiques ou de changements spécifiques dans de vastes ensembles de données d'imagerie satellite peut être accélérée en demandant au modèle d'interroger des régions incertaines pour examen par des experts.

Apprentissage actif et concepts connexes

Il est important de distinguer l'apprentissage actif des autres paradigmes d'apprentissage qui utilisent également des données non étiquetées :

  • Apprentissage semi-supervisé: Utilise simultanément des données étiquetées et non étiquetées pendant la formation du modèle. Contrairement à l'apprentissage actif, il utilise généralement toutes les données non étiquetées disponibles de manière passive, plutôt que d'interroger sélectivement des instances spécifiques pour obtenir des étiquettes.
  • Apprentissage auto-supervisé: Apprend des représentations à partir de données non étiquetées en créant des tâches prétextes (par exemple, prédire une partie masquée d'une image). Il ne nécessite pas d'annotation humaine pendant sa phase de préformation, alors que l'apprentissage actif s'appuie sur un oracle pour les étiquettes.
  • Apprentissage par renforcement: Apprend par essais et erreurs en interagissant avec un environnement, en recevant des récompenses ou des pénalités pour ses actions. Il n'implique pas la recherche d'étiquettes explicites comme l'apprentissage actif.
  • Apprentissage fédéré: Se concentre sur la formation de modèles à travers des appareils décentralisés tout en gardant les données locales, ce qui répond principalement aux préoccupations en matière de confidentialité des données. L'apprentissage actif se concentre sur l'acquisition efficace d'étiquettes. Ces techniques peuvent parfois être combinées.

Outils et mise en oeuvre

La mise en œuvre de l'apprentissage actif implique souvent l'intégration de modèles ML avec des outils d'annotation et la gestion du flux de données. Les cadres et les bibliothèques comme scikit-learn offrent certaines fonctionnalités, tandis qu'il existe des bibliothèques spécialisées pour des tâches spécifiques. Les logiciels d'annotation tels que Label Studio peuvent être intégrés dans les pipelines d'apprentissage actif, permettant aux annotateurs de fournir des étiquettes pour les échantillons interrogés. Des plateformes comme DagsHub proposent des outils pour construire et gérer ces pipelines, comme en témoigne leur conférenceYOLO VISION 2023 sur les pipelines d'apprentissage actif DagsHub . La gestion efficace des ensembles de données évolutifs et des modèles formés est cruciale, et des plateformes comme Ultralytics HUB fournissent une infrastructure pour organiser ces actifs tout au long du cycle de vie du développement. Explore le dépôtUltralytics GitHub et rejoins la communautéUltralytics pour des discussions et des ressources liées à la mise en œuvre de techniques ML avancées.

Tout lire