L'apprentissage actif accélère le développement de la vision artificielle

Abirami Vina

3 minutes de lecture

23 janvier 2025

Découvrez comment l'apprentissage actif est utilisé dans la vision artificielle pour minimiser les efforts d'annotation et explorez ses applications réelles dans divers secteurs.

L'apprentissage d'un modèle de vision par ordinateur ressemble beaucoup à l'apprentissage de la reconnaissance des couleurs par un enfant. Tout d'abord, vous avez besoin d'une collection d'objets colorés. Ensuite, vous devez guider l'enfant pour qu'il identifie correctement chaque couleur, une tâche qui prend souvent beaucoup de temps et qui est répétitive.

Tout comme un enfant a besoin de nombreux exemples pour apprendre, un modèle de vision a besoin d'un grand ensemble de données étiquetées pour reconnaître des motifs et des objets dans des images. Cependant, l'étiquetage de vastes quantités de données demande beaucoup de temps et d'efforts, sans parler des ressources. Des techniques comme l'apprentissage actif peuvent contribuer à simplifier ce processus.

L'apprentissage actif est un processus étape par étape au cours duquel les données les plus importantes d'un grand ensemble de données sont sélectionnées et étiquetées. Le modèle apprend à partir de ces données étiquetées, ce qui le rend plus précis et plus efficace. Le fait de se concentrer uniquement sur les données les plus importantes réduit la quantité d'étiquetage nécessaire et accélère le développement du modèle.

Dans cet article, nous verrons comment l'apprentissage actif facilite la formation des modèles, réduit les coûts d'étiquetage et améliore la précision globale du modèle.

Les ensembles de données d'images ne sont pas faciles à constituer

Les ensembles de données constituent la base des modèles de vision artificielle et d'apprentissage profond. Des ensembles de données populaires comme ImageNet offrent des millions d'images avec diverses catégories d'objets. Cependant, la création et la maintenance de tels volumes d'ensembles de données de haute qualité s'accompagnent de plusieurs défis. 

Par exemple, la collecte et l'étiquetage des données nécessitent du temps, des ressources et des annotateurs qualifiés, ce qui rend le processus difficile en fonction de l'application spécifique. Des solutions innovantes et plus efficaces sont nécessaires pour répondre à la demande croissante d'ensembles de données d'images, et c'est exactement ce que l'apprentissage actif vise à résoudre. 

L'apprentissage actif offre une solution parfaite en optimisant le processus d'étiquetage des données. En sélectionnant stratégiquement les points de données les plus informatifs pour l'annotation, l'apprentissage actif maximise la performance du modèle tout en minimisant les efforts d'étiquetage. 

Qu'est-ce que l'apprentissage actif ?

L'apprentissage actif est une technique itérative d'apprentissage automatique dans laquelle le modèle sélectionne les points de données les plus importants à étiqueter à partir d'un grand ensemble de données non étiquetées. Ces points de données sélectionnés sont étiquetés manuellement et ajoutés à l'ensemble de données d'apprentissage. 

Le modèle est ensuite réentraîné sur l'ensemble de données mis à jour et sélectionne l'ensemble suivant de points de données à étiqueter. Ce processus se répète, le modèle s'améliorant continuellement en se concentrant sur les points de données les plus informatifs. Le cycle se poursuit jusqu'à ce que le modèle atteigne la précision souhaitée ou réponde aux critères d'étiquetage définis à l'avance.

__wf_reserved_inherit
Fig. 1. Vue d'ensemble de l'apprentissage actif.

Comprendre le fonctionnement de l'apprentissage actif

Vous vous demandez peut-être comment la technique d'apprentissage actif décide quels points de données doivent être étiquetés manuellement et lesquels doivent l'être ensuite. Pour comprendre le fonctionnement de l'apprentissage actif, comparons-le à l'étude d'un examen : vous vous concentrez sur les sujets dont vous n'êtes pas sûr et vous vous assurez de couvrir une variété de sujets afin d'être bien préparé.

Pour l'ensemble initial des processus de sélection des données, l'apprentissage actif utilise des stratégies telles que l'échantillonnage d'incertitude et l'échantillonnage basé sur la diversité. L'échantillonnage d'incertitude donne la priorité aux points de données pour lesquels le modèle est le moins confiant dans ses prédictions, afin d'améliorer la précision dans les cas difficiles. L'échantillonnage basé sur la diversité sélectionne des points de données qui couvrent un large éventail de caractéristiques, garantissant que le modèle se généralise bien à des données inédites en l'exposant à divers exemples.

__wf_reserved_inherit
Fig. 2. Échantillonnage d'incertitude (à gauche) et échantillonnage basé sur la diversité (à droite).

Après la sélection initiale des données, l'apprentissage actif utilise deux approches principales pour l'étiquetage : l'échantillonnage par bassin et l'échantillonnage par flux, qui sont similaires à la manière dont un enseignant aide un élève à se concentrer sur ce qui est le plus important. 

Dans le cas de l'échantillonnage basé sur le bassin, le modèle analyse un grand bassin de données non étiquetées et sélectionne les exemples les plus difficiles ou les plus instructifs à étiqueter, à l'instar d'un étudiant qui donne la priorité aux flashcards qu'il trouve les plus difficiles. En ce qui concerne l'échantillonnage en flux, le modèle traite les données au fur et à mesure qu'elles arrivent, en décidant de les étiqueter ou de les ignorer, à l'instar d'un étudiant qui ne demande de l'aide que lorsqu'il est bloqué. Dans les deux cas, les données étiquetées sont ajoutées à l'ensemble d'apprentissage et le modèle se réapprend, s'améliorant régulièrement à chaque itération.

Explorer les applications de l'apprentissage actif

L'apprentissage actif joue un rôle clé dans les applications de vision par ordinateur, telles que l'imagerie médicale et la conduite autonome, en améliorant la précision des modèles et en rationalisant le processus d'étiquetage des données. Les modèles de vision par ordinateur utilisés dans les voitures autonomes pour détecter les piétons ou les objets dans des conditions de faible luminosité ou de brouillard en sont un exemple intéressant. L'apprentissage actif peut améliorer la précision en se concentrant sur des scénarios de conduite variés et difficiles. 

Plus précisément, l'apprentissage actif peut être utilisé pour identifier les données ou les images incertaines de ces scénarios en vue d'un étiquetage sélectif. L'ajout de ces exemples étiquetés à l'ensemble de formation permet au modèle de mieux reconnaître les piétons et les objets dans des environnements difficiles, tels que les conditions météorologiques défavorables ou la conduite de nuit.

Par exemple, NVIDIA a utilisé l'apprentissage actif pour améliorer la détection des piétons la nuit dans ses modèles de conduite autonome. En sélectionnant stratégiquement les données les plus informatives pour la formation, en particulier dans les scénarios difficiles, les performances du modèle augmentent considérablement.

__wf_reserved_inherit
Fig. 3. Détection d'un piéton avec un parapluie à l'aide de l'apprentissage actif.

L'apprentissage actif peut réduire les coûts d'étiquetage

Un autre aspect clé de l'apprentissage actif est sa capacité à réduire les coûts d'étiquetage. Pour ce faire, il se concentre uniquement sur les points de données les plus importants, au lieu d'exiger des annotations pour l'ensemble du jeu de données. Cette approche ciblée permet d'économiser du temps, des efforts et de l'argent. En se concentrant sur des échantillons incertains ou divers, l'apprentissage actif réduit le nombre d'annotations nécessaires tout en maintenant une grande précision du modèle.

En fait, la recherche montre que l'apprentissage actif peut réduire les coûts d'étiquetage de 40 à 60 % sans sacrifier les performances. Cela est particulièrement utile dans des secteurs tels que la santé et la fabrication, où l'étiquetage des données est coûteux. En simplifiant le processus d'annotation, l'apprentissage actif aide les entreprises à développer des modèles plus rapidement et à les déployer plus efficacement tout en maintenant la précision.

Avantages de l'apprentissage actif

Voici quelques-uns des autres avantages clés que l'apprentissage actif peut offrir :

  • Traiter le déséquilibre des classes: L'apprentissage actif peut aider à résoudre les problèmes de déséquilibre des classes en étiquetant les instances des classes de données minoritaires. Le modèle peut être plus performant dans des scénarios rares avec des données limitées.
  • Cycles de développement plus rapides: Étiqueter moins de données signifie indirectement accélérer le processus de développement des modèles d'apprentissage automatique et de vision par ordinateur, ce qui permet de disposer de plus de temps et de ressources pour des itérations et des expériences supplémentaires.
  • Adaptabilité: Il peut améliorer continuellement les données d'entraînement en itérant sur des échantillons incertains ou des cas limites, ce qui le rend bien adapté aux ensembles de données dynamiques ou évolutifs.

L'apprentissage actif et AutoML peuvent fonctionner ensemble

Automated Machine Learning (AutoML ) se concentre sur l'automatisation des tâches chronophages et itératives impliquées dans la construction et le déploiement de modèles d'apprentissage automatique. Il simplifie les flux de travail d'apprentissage automatique en automatisant des tâches telles que la sélection des modèles et l'évaluation des performances afin de réduire les efforts manuels. 

Lorsqu'il est intégré à l'apprentissage actif, AutoML peut accélérer et optimiser le cycle de développement du modèle. Le composant d'apprentissage actif sélectionne stratégiquement les points de données les plus informatifs pour l'étiquetage, tandis qu'AutoML affine le modèle en automatisant le choix de l'architecture, des paramètres et de la mise au point.

__wf_reserved_inherit
Fig. 4. Flux de travail AutoML.

Comprenons cette combinaison de technologies à l'aide d'un exemple. 

Supposons que vous essayiez de détecter des maladies rares dans le domaine de l'imagerie médicale (un cas d'utilisation où les ensembles de données étiquetées sont limités et coûteux à obtenir). L'apprentissage actif peut identifier et sélectionner des données incertaines, telles que des changements subtils dans les images radiographiques, que le modèle ne parvient pas à classer. Ensuite, les données incertaines peuvent être priorisées pour une annotation manuelle afin d'améliorer la compréhension du modèle. 

Avec les données annotées, AutoML peut optimiser le modèle en explorant diverses architectures, hyperparamètres et autres techniques d'augmentation des données. Le processus itératif accélère le développement de modèles de vision fiables, comme Ultralytics YOLO11, qui aident les professionnels de la santé à établir des diagnostics précis.

Les défis de l'apprentissage actif

L'apprentissage actif et ses techniques offrent de nombreux avantages, mais il convient de garder à l'esprit certaines considérations lors de la mise en œuvre de ces stratégies :

  • Sélection de la stratégie d'interrogation: L'apprentissage actif fait appel à de nombreuses techniques, et le choix de la meilleure méthode a un impact significatif sur l'efficacité du modèle. La sélection d'une stratégie inappropriée peut réduire les performances du modèle pour une application spécifique.
  • Coûts de recyclage: La nature itérative de l'apprentissage actif nécessite des ressources informatiques coûteuses, en particulier pour les grands ensembles de données. Le modèle est recyclé après chaque cycle d'étiquetage, ce qui accroît sa complexité.
  • Qualité du modèle initial: L'efficacité de l'apprentissage actif dépend de la qualité du modèle initial. Un modèle initial peu performant peut ne pas identifier avec précision les points de données informatifs, ce qui entraîne des demandes d'étiquettes de mauvaise qualité et une baisse des performances globales.

Le chemin à parcourir pour l'apprentissage actif et AutoML

Avec les récentes avancées dans les domaines de l'IA et de la vision artificielle, l'apprentissage actif devrait permettre de relever des défis plus complexes et de rationaliser les flux de travail de l'apprentissage automatique. La combinaison de l'apprentissage actif avec des techniques telles que l'apprentissage fédéré et l'apprentissage auto-supervisé peut encore améliorer l'efficacité et l'évolutivité des modèles de vision. 

L'apprentissage fédéré permet d'entraîner un modèle sur plusieurs appareils ou serveurs à l'aide d'un cadre distribué, sans que les données ne quittent leur emplacement d'origine. Dans des secteurs comme la santé, où la confidentialité des données est importante, l'apprentissage fédéré permet de s'entraîner directement sur des données locales sensibles tout en les sécurisant. Au lieu de partager les données brutes, seules les mises à jour des modèles ou les connaissances sont partagées, ce qui garantit la protection des informations privées tout en contribuant au processus de formation.

Par ailleurs, l'apprentissage auto-supervisé permet de réduire le besoin de données étiquetées en pré-entraînant les modèles sur des données non étiquetées. Ce processus crée une base solide pour le modèle. L'apprentissage actif peut ensuite s'appuyer sur cette base en identifiant et en sélectionnant les points de données les plus importants pour l'annotation humaine, ce qui permet d'affiner encore le modèle.

De l'apprentissage actif à l'impact actif

L'apprentissage actif constitue un moyen pratique de relever les principaux défis de la vision artificielle, tels que le coût élevé de l'annotation des données et la nécessité de disposer de modèles plus précis. En se concentrant sur l'étiquetage des points de données les plus précieux, l'apprentissage actif réduit l'effort requis de la part des humains tout en augmentant les performances du modèle.

Associé à des technologies comme AutoML, l'apprentissage actif rationalise le développement de modèles en automatisant les tâches fastidieuses. Au fur et à mesure des progrès, l'apprentissage actif est appelé à devenir un outil essentiel pour construire des systèmes de vision par ordinateur plus intelligents et plus efficaces.

Explorez notre dépôt GitHub et rejoignez notre communauté pour en savoir plus sur l'IA et les modèles de vision par ordinateur. Découvrez d'autres applications de vision par ordinateur dans les domaines de la fabrication et de la santé sur nos pages de solutions. Vous pouvez également consulter nos options de licence pour vous lancer dès aujourd'hui dans l'aventure Vision AI.

Construisons ensemble le futur
de l'IA !

Commencez votre voyage avec l'avenir de l'apprentissage automatique

Commencer gratuitement
Lien copié dans le presse-papiers