Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024

L'apprentissage actif accélère le développement de la vision par ordinateur

Abirami Vina

3 min de lecture

23 janvier 2025

Découvrez comment l'apprentissage actif est utilisé dans la vision par ordinateur pour minimiser les efforts d'annotation et explorez ses applications concrètes dans divers secteurs.

L'entraînement d'un modèle de vision par ordinateur ressemble beaucoup à l'apprentissage des couleurs à un enfant. Tout d'abord, vous auriez besoin d'une collection d'objets colorés. Ensuite, vous guideriez l'enfant pour qu'il identifie correctement chaque couleur, une tâche qui est souvent à la fois longue et répétitive.

Tout comme un enfant a besoin de nombreux exemples pour apprendre, un modèle de vision a besoin d'un grand ensemble de données étiquetées pour reconnaître les motifs et les objets dans les images. Cependant, l'étiquetage de grandes quantités de données prend beaucoup de temps et d'efforts, sans parler des ressources. Des techniques comme l'apprentissage actif peuvent aider à simplifier ce processus.

L'apprentissage actif est un processus étape par étape où les données les plus importantes d'un grand ensemble de données sont sélectionnées et étiquetées. Le modèle apprend à partir de ces données étiquetées, ce qui le rend plus précis et efficace. En se concentrant uniquement sur les données les plus précieuses, on réduit la quantité d'étiquetage nécessaire et on accélère le développement du modèle.

Dans cet article, nous allons examiner comment l'apprentissage actif aide à l'entraînement des modèles, réduit les coûts d'étiquetage et améliore la précision globale du modèle.

Les jeux de données d'images ne sont pas faciles à constituer

Les jeux de données sont le fondement des modèles de vision par ordinateur et d'apprentissage profond. Les jeux de données populaires comme ImageNet offrent des millions d'images avec diverses catégories d'objets. Cependant, la création et la maintenance de tels volumes énormes de jeux de données de haute qualité posent divers défis. 

Par exemple, la collecte et l'étiquetage des données prennent du temps, des ressources et des annotateurs qualifiés, ce qui rend le processus difficile selon l'application spécifique. Des solutions innovantes et plus efficaces sont nécessaires pour répondre à la demande croissante d'ensembles de données d'images, et c'est exactement ce que l'apprentissage actif vise à résoudre. 

L'apprentissage actif offre une solution parfaite en optimisant le processus d'étiquetage des données. En sélectionnant stratégiquement les points de données les plus informatifs pour l'annotation, l'apprentissage actif maximise la performance du modèle tout en minimisant les efforts d'étiquetage. 

Qu'est-ce que l'apprentissage actif ?

L'apprentissage actif est une technique itérative d'apprentissage automatique où le modèle choisit les points de données les plus importants à étiqueter à partir d'un grand ensemble de données non étiquetées. Ces points de données sélectionnés sont étiquetés manuellement et ajoutés à l'ensemble de données d'entraînement. 

Le modèle est ensuite réentraîné sur l'ensemble de données mis à jour et sélectionne le prochain ensemble de points de données à étiqueter. Ce processus se répète, le modèle s'améliorant continuellement en se concentrant sur les points de données les plus informatifs. Le cycle continue jusqu'à ce que le modèle atteigne la précision souhaitée ou réponde aux critères d'étiquetage définis à l'avance.

__wf_reserved_inherit
Fig. 1. Un aperçu de l'apprentissage actif.

Comprendre le fonctionnement de l'apprentissage actif

Vous vous demandez peut-être comment la technique d'apprentissage actif décide quels points de données nécessitent un étiquetage manuel et lesquels étiqueter ensuite. Comprenons comment fonctionne l'apprentissage actif en le comparant à la préparation d'un test : vous vous concentrez sur les sujets dont vous n'êtes pas sûr et vous vous assurez également de couvrir une variété de sujets pour être bien préparé.

Pour l'ensemble initial des processus de sélection des données, l'apprentissage actif utilise des stratégies telles que l'échantillonnage d'incertitude et l'échantillonnage basé sur la diversité. L'échantillonnage d'incertitude donne la priorité aux points de données où le modèle est le moins confiant dans ses prédictions, dans le but d'améliorer la précision dans les cas difficiles. L'échantillonnage basé sur la diversité sélectionne des points de données qui couvrent un large éventail de caractéristiques, garantissant que le modèle se généralise bien aux données non vues en l'exposant à divers exemples.

__wf_reserved_inherit
Fig. 2. Échantillonnage d'incertitude (à gauche) et échantillonnage basé sur la diversité (à droite).

Après la sélection initiale des données, l'apprentissage actif utilise deux approches principales pour l'étiquetage : l'échantillonnage basé sur un pool et l'échantillonnage basé sur un flux, qui sont similaires à la façon dont un enseignant aide un étudiant à se concentrer sur ce qui est le plus important. 

Dans l'échantillonnage basé sur un pool, le modèle examine un grand pool de données non étiquetées et sélectionne les exemples les plus difficiles ou les plus informatifs à étiqueter, un peu comme un étudiant qui donne la priorité aux cartes flash qu'il trouve les plus difficiles. En ce qui concerne l'échantillonnage basé sur un flux, le modèle traite les données au fur et à mesure de leur arrivée, en décidant s'il faut les étiqueter ou les ignorer, un peu comme un étudiant qui demande de l'aide uniquement lorsqu'il est bloqué. Dans les deux cas, les données étiquetées sont ajoutées à l'ensemble d'entraînement, et le modèle se réentraîne, s'améliorant progressivement à chaque itération.

Exploration des applications de l'apprentissage actif

L'apprentissage actif joue un rôle clé dans les applications de vision par ordinateur, telles que l'imagerie médicale et la conduite autonome, en améliorant la précision du modèle et en rationalisant le processus d'étiquetage des données. Un exemple intéressant est celui des modèles de vision par ordinateur utilisés dans les voitures autonomes pour détecter les piétons ou les objets dans des conditions de faible luminosité ou de brouillard. L'apprentissage actif peut améliorer la précision en se concentrant sur des scénarios de conduite diversifiés et difficiles. 

Plus précisément, l'apprentissage actif peut être utilisé pour identifier les données ou les images incertaines de tels scénarios pour un étiquetage sélectif. L'ajout de ces exemples étiquetés à l'ensemble d'apprentissage permet au modèle de mieux reconnaître les piétons et les objets dans des environnements difficiles, comme par mauvais temps ou de nuit.

Par exemple, NVIDIA a utilisé l'apprentissage actif pour améliorer la détection des piétons la nuit dans ses modèles de conduite autonome. En sélectionnant stratégiquement les données les plus informatives pour l'entraînement, en particulier dans les scénarios difficiles, les performances du modèle augmentent considérablement.

__wf_reserved_inherit
Fig 3. Détection d'un piéton avec un parapluie à l'aide de l'apprentissage actif.

L'apprentissage actif peut réduire les coûts d'étiquetage

Un autre aspect clé de l'apprentissage actif est son potentiel de réduction des coûts d'étiquetage. Il le fait en se concentrant uniquement sur les points de données les plus importants, au lieu d'exiger des annotations pour l'ensemble de l'ensemble de données. Cette approche ciblée permet d'économiser du temps, des efforts et de l'argent. En se concentrant sur les échantillons incertains ou diversifiés, l'apprentissage actif réduit le nombre d'annotations nécessaires tout en maintenant une précision élevée du modèle.

En fait, la recherche montre que l'apprentissage actif peut réduire les coûts d'étiquetage de 40 à 60 % sans sacrifier les performances. Ceci est particulièrement utile dans des secteurs tels que la santé et la fabrication, où l'étiquetage des données est coûteux. En simplifiant le processus d'annotation, l'apprentissage actif aide les entreprises à développer des modèles plus rapidement et à les déployer plus efficacement tout en maintenant la précision.

Avantages de l'apprentissage actif

Voici quelques autres avantages clés que l'apprentissage actif peut offrir :

  • Gérer le déséquilibre des classes : L'apprentissage actif peut aider à résoudre les problèmes de déséquilibre des classes en étiquetant les instances des classes de données minoritaires. Le modèle peut mieux fonctionner dans des scénarios rares avec des données limitées.
  • Cycles de développement plus rapides : Étiqueter moins de données signifie indirectement accélérer le processus de développement des modèles d'apprentissage automatique et de vision par ordinateur, ce qui permet de consacrer plus de temps et de ressources à des itérations et des expériences supplémentaires.
  • Adaptabilité : Il peut continuellement améliorer les données d'entraînement en itérant sur des échantillons incertains ou limites, ce qui le rend bien adapté aux ensembles de données dynamiques ou évolutifs.

L'apprentissage actif et l'AutoML peuvent fonctionner ensemble

L'apprentissage automatique automatisé (AutoML) se concentre sur l'automatisation des tâches itératives et chronophages impliquées dans la construction et le déploiement de modèles d'apprentissage automatique. Il simplifie les flux de travail d'apprentissage automatique en automatisant des tâches telles que la sélection du modèle et l'évaluation des performances afin de réduire le besoin d'efforts manuels. 

Lorsqu'il est intégré à l'apprentissage actif, AutoML peut accélérer et optimiser le cycle de vie du développement de modèles. Le composant d'apprentissage actif sélectionne stratégiquement les points de données les plus informatifs pour l'étiquetage, tandis qu'AutoML affine le modèle en automatisant le choix de l'architecture, des paramètres et du réglage.

__wf_reserved_inherit
Fig. 4. Flux de travail AutoML.

Comprenons cette combinaison de technologies avec un exemple. 

Supposons que vous essayiez de détecter des conditions rares en imagerie médicale (un cas d'utilisation où les ensembles de données étiquetés sont limités et coûteux à obtenir). L'apprentissage actif peut identifier et sélectionner des données incertaines, telles que de subtils changements dans les images radiographiques, que le modèle ne parvient pas à classer. Ensuite, les données incertaines peuvent être priorisées pour l'annotation manuelle afin d'améliorer la compréhension du modèle. 

Avec les données annotées, AutoML peut optimiser le modèle en explorant diverses architectures, hyperparamètres et autres techniques d'augmentation des données. Le processus itératif accélère le développement de modèles de vision fiables comme Ultralytics YOLO11 qui aident les professionnels de la santé à établir des diagnostics précis.

Défis de l'apprentissage actif

L'apprentissage actif et ses techniques offrent de nombreux avantages, mais il y a quelques considérations à garder à l'esprit lors de la mise en œuvre de ces stratégies :

  • Sélection de la stratégie d’interrogation : L’apprentissage actif implique de nombreuses techniques, et le choix de la meilleure méthode a un impact significatif sur l’efficacité du modèle. La sélection d’une stratégie inappropriée peut réduire les performances du modèle pour une application spécifique.
  • Coûts de réentraînement : La nature itérative de l'apprentissage actif nécessite des ressources de calcul coûteuses, en particulier pour les grands ensembles de données. Le modèle est réentraîné après chaque cycle d'étiquetage, ce qui augmente sa complexité.
  • Qualité initiale du modèle : L'efficacité de l'apprentissage actif dépend de la qualité du modèle initial. Un modèle initial peu performant peut ne pas identifier avec précision les points de données informatifs, ce qui entraîne des demandes d'étiquetage de qualité inférieure et une réduction des performances globales.

La voie à suivre pour l'apprentissage actif et l'AutoML

Grâce aux récentes avancées de l'IA et de la vision par ordinateur, l'apprentissage actif est prêt à relever des défis plus complexes et à rationaliser les flux de travail d'apprentissage automatique. La combinaison de l'apprentissage actif avec des techniques telles que l'apprentissage fédéré et l'apprentissage auto-supervisé peut encore améliorer l'efficacité et l'évolutivité des modèles de vision. 

L'apprentissage fédéré permet d'entraîner un modèle sur plusieurs appareils ou serveurs avec un framework distribué sans que les données aient à quitter leur emplacement d'origine. Dans des secteurs comme la santé, où la confidentialité des données est importante, l'apprentissage fédéré permet de s'entraîner directement sur des données locales sensibles tout en les gardant en sécurité. Au lieu de partager des données brutes, seules les mises à jour ou les informations du modèle sont partagées, garantissant ainsi que les informations privées restent protégées tout en contribuant au processus d'entraînement.

Parallèlement, l'apprentissage auto-supervisé contribue à réduire le besoin de données étiquetées en pré-entraînant les modèles sur des données non étiquetées. Ce processus crée une base solide pour le modèle. L'apprentissage actif peut ensuite s'appuyer sur cette base en identifiant et en sélectionnant les points de données les plus importants pour l'annotation humaine, affinant ainsi davantage le modèle.

De l'apprentissage actif à l'impact actif

L'apprentissage actif offre un moyen pratique de relever les principaux défis de la vision par ordinateur, comme le coût élevé de l'annotation des données et le besoin de modèles plus précis. En se concentrant sur l'étiquetage des points de données les plus précieux uniquement, il réduit l'effort requis des humains tout en améliorant la performance du modèle.

Combiné à des technologies comme AutoML, l'apprentissage actif rationalise le développement de modèles en automatisant les tâches chronophages. À mesure que les progrès se poursuivent, l'apprentissage actif est appelé à devenir un outil essentiel pour la construction de systèmes de vision par ordinateur plus intelligents et plus efficaces.

Explorez notre dépôt GitHub et rejoignez notre communauté pour en savoir plus sur l'IA et les modèles de vision par ordinateur. Découvrez d'autres applications de la vision par ordinateur dans la fabrication et les soins de santé sur nos pages de solutions. Vous pouvez également consulter nos options de licence pour démarrer votre parcours Vision AI dès aujourd'hui.

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement
Lien copié dans le presse-papiers