Apprentissage actif
Découvrez l'apprentissage actif, une méthode d'apprentissage automatique rentable qui améliore la précision avec moins d'étiquettes. Découvrez comment elle transforme la formation à l'IA !
L'apprentissage actif est un sous-domaine spécialisé de l'apprentissage automatique où l'algorithme d'apprentissage peut interroger interactivement un utilisateur, souvent appelé "oracle" ou annotateur humain, pour demander des étiquettes pour de nouveaux points de données. Contrairement à l'apprentissage supervisé traditionnel, qui nécessite généralement un vaste ensemble de données pré-étiquetées, l'apprentissage actif vise à obtenir des performances de modèle élevées avec un effort d'étiquetage nettement moindre. Pour ce faire, il sélectionne stratégiquement les instances non étiquetées les plus informatives pour l'annotation. Cette approche est particulièrement utile dans les domaines où l'obtention de données étiquetées est coûteuse, prend du temps ou nécessite des connaissances spécialisées, comme l'analyse d'images médicales ou les tâches complexes de traitement du langage naturel (NLP). L'idée de base est de laisser le modèle guider le processus d'étiquetage des données, en concentrant l'effort humain là où il aura le plus d'impact sur l'amélioration de la précision du modèle.
Stratégies d'interrogation
L'efficacité de l'apprentissage actif dépend fortement de sa stratégie d'interrogation, c'est-à-dire de l'algorithme utilisé pour sélectionner les points de données non étiquetés à étiqueter ensuite. L'objectif est de choisir des échantillons qui, une fois étiquetés, conduiront probablement à la plus grande amélioration des performances du modèle. Les stratégies les plus courantes sont les suivantes :
- Échantillonnage de l'incertitude : Sélectionne les cas où le modèle est le moins sûr de sa prédiction. Ceci est souvent mesuré par la probabilité de prédiction, l'entropie ou la marge entre les meilleures prédictions.
- Requête par comité (QBC) : Utilise un ensemble de modèles. Les cas où les membres du comité sont le plus en désaccord sur la prédiction sont sélectionnés pour l'étiquetage.
- Changement attendu du modèle : Sélectionne les instances qui entraîneraient la plus grande modification des paramètres ou des gradients du modèle si leurs étiquettes étaient connues.
- Approches basées sur la densité : La priorité est donnée aux instances qui sont non seulement incertaines, mais aussi représentatives des distributions de données sous-jacentes.
Une vue d'ensemble complète des stratégies peut être trouvée dans des ressources telles que l'étude documentaire sur l'apprentissage actif de Burr Settles.
Pertinence et avantages
L'apprentissage actif réduit considérablement la charge et le coût associés à l'étiquetage des données, qui est souvent un goulot d'étranglement majeur dans le développement de modèles robustes d'apprentissage profond (DL). En concentrant les efforts d'annotation de manière stratégique, il permet aux équipes de :
- Obtenir une plus grande précision avec moins de données : Obtenez de meilleures performances du modèle par rapport à l'échantillonnage aléatoire, avec le même budget d'étiquetage.
- Réduire les coûts d'étiquetage : Réduire le temps et les ressources consacrés à l'annotation manuelle.
- Accélérer le développement de modèles : Atteignez plus rapidement les niveaux de performance souhaités en donnant la priorité aux données les plus significatives. Découvrez comment l 'apprentissage actif accélère le développement de la vision par ordinateur.
- Améliorer la robustesse des modèles : Se concentrer sur des exemples ambigus ou difficiles peut aider les modèles à mieux se généraliser.
Applications dans le monde réel
L'apprentissage actif est appliqué dans divers domaines où les données étiquetées constituent une contrainte :
- Imagerie médicale : Dans des tâches telles que la détection de tumeurs à l'aide de modèles YOLO, le temps des radiologues experts est précieux. L'apprentissage actif sélectionne les scans les plus ambigus à examiner, optimisant ainsi l'utilisation des ressources des experts. Cet aspect est crucial pour le développement de solutions d'IA efficaces dans le domaine de la santé.
- Traitement du langage naturel (NLP) : Pour des tâches telles que l'analyse des sentiments ou la reconnaissance des entités nommées (NER), l'identification d'échantillons de texte informatifs (par exemple, ceux avec des sentiments ambigus ou des entités rares) pour l'étiquetage améliore efficacement la précision du modèle. Les outils de plateformes telles que Hugging Face bénéficient souvent de ces techniques.
- Véhicules autonomes : La sélection de scénarios de conduite difficiles ou rares (par exemple, conditions météorologiques inhabituelles, intersections complexes) à partir de vastes quantités de données de conduite non étiquetées pour l'annotation permet d'améliorer la sécurité et la fiabilité des systèmes de conduite autonome.
- Analyse d'images satellites : L'identification de caractéristiques ou de changements spécifiques dans de vastes ensembles de données d'imagerie satellitaire peut être accélérée en demandant au modèle d'interroger des régions incertaines pour examen par des experts.
Apprentissage actif et concepts connexes
Il est important de distinguer l'apprentissage actif des autres paradigmes d'apprentissage qui utilisent également des données non étiquetées :
- Apprentissage semi-supervisé: Il utilise simultanément des données étiquetées et non étiquetées lors de la formation du modèle. Contrairement à l'apprentissage actif, il utilise généralement toutes les données non étiquetées disponibles de manière passive, plutôt que d'interroger sélectivement des instances spécifiques pour obtenir des étiquettes.
- Apprentissage auto-supervisé: Apprend des représentations à partir de données non étiquetées en créant des tâches prétextes (par exemple, prédire une partie masquée d'une image). Il ne nécessite pas d'annotation humaine pendant sa phase de préformation, alors que l'apprentissage actif s'appuie sur un oracle pour les étiquettes.
- Apprentissage par renforcement: Apprentissage par essais et erreurs par le biais d'interactions avec un environnement, en recevant des récompenses ou des pénalités pour ses actions. Il n'implique pas la recherche d'étiquettes explicites comme l'apprentissage actif.
- Apprentissage fédéré: L'apprentissage fédéré se concentre sur la formation de modèles à travers des dispositifs décentralisés tout en gardant les données locales, ce qui répond principalement aux préoccupations en matière de confidentialité des données. L'apprentissage actif se concentre sur l'acquisition efficace d'étiquettes. Ces techniques peuvent parfois être combinées.
Outils et mise en œuvre
La mise en œuvre de l'apprentissage actif implique souvent l'intégration de modèles de ML avec des outils d'annotation et la gestion du flux de données. Des cadres et des bibliothèques comme scikit-learn offrent certaines fonctionnalités, tandis qu'il existe des bibliothèques spécialisées pour des tâches spécifiques. Les logiciels d'annotation tels que Label Studio peuvent être intégrés dans les pipelines d'apprentissage actif, permettant aux annotateurs de fournir des étiquettes pour les échantillons interrogés. Des plateformes comme DagsHub offrent des outils pour construire et gérer ces pipelines, comme indiqué dans leur présentation YOLO VISION 2023 sur les pipelines d'apprentissage actif de DagsHub. La gestion efficace des ensembles de données en évolution et des modèles formés est cruciale, et des plateformes comme Ultralytics HUB fournissent une infrastructure pour organiser ces actifs tout au long du cycle de vie du développement. Explorez le dépôt Ultralytics GitHub et rejoignez la communauté Ultralytics pour des discussions et des ressources liées à la mise en œuvre de techniques avancées de ML.
Comment fonctionne l'apprentissage actif
Le processus d'apprentissage actif suit généralement un cycle itératif, permettant au modèle de s'améliorer progressivement grâce à des données ciblées :