IA de vision

L'apprentissage actif accélère le développement de la vision par ordinateur

Apprends comment l'apprentissage actif est utilisé en vision par ordinateur pour minimiser les efforts d'annotation et explore ses applications concrètes dans divers secteurs.

ABAbirami Vina

3 min readJanuary 23, 2025

L'apprentissage actif accélère le développement de la vision par ordinateur

Entraîner un modèle de vision par ordinateur ressemble beaucoup à apprendre à un enfant à reconnaître les couleurs. D'abord, tu as besoin d'une collection d'objets colorés. Ensuite, tu guides l'enfant pour qu'il identifie correctement chaque couleur, une tâche qui est souvent longue et répétitive.

Tout comme un enfant a besoin de nombreux exemples pour apprendre, un modèle de vision nécessite un vaste ensemble de données étiquetées pour reconnaître les motifs et les objets dans les images. Cependant, l'étiquetage de quantités massives de données demande beaucoup de temps et d'efforts, sans parler des ressources. Des techniques comme l'apprentissage actif peuvent aider à simplifier ce processus.

L'apprentissage actif est un processus étape par étape où les données les plus importantes d'un grand jeu de données sont sélectionnées et étiquetées. Le modèle apprend à partir de ces données étiquetées, ce qui le rend plus précis et efficace. Se concentrer uniquement sur les données les plus utiles réduit la quantité d'étiquetage nécessaire et accélère le développement du modèle.

Dans cet article, nous verrons comment l'apprentissage actif aide à l'entraînement des modèles, réduit les coûts d'étiquetage et améliore la précision globale du modèle.

Link to this sectionLes jeux de données d'images ne sont pas faciles à construire#

Les jeux de données sont la fondation des modèles de vision par ordinateur et d'apprentissage profond. Des jeux de données populaires comme ImageNet offrent des millions d'images avec diverses catégories d'objets. Cependant, créer et maintenir de tels volumes massifs de jeux de données de haute qualité comporte divers défis.

Par exemple, la collecte et l'étiquetage des données demandent du temps, des ressources et des annotateurs qualifiés, ce qui rend le processus difficile selon l'application spécifique. Des solutions innovantes et plus efficaces sont nécessaires pour répondre à la demande croissante en jeux de données d'images, et c'est exactement ce que l'apprentissage actif vise à résoudre.

L'apprentissage actif offre une solution parfaite en optimisant le processus d'étiquetage des données. En sélectionnant stratégiquement les points de données les plus informatifs pour l'annotation, l'apprentissage actif maximise les performances du modèle tout en minimisant les efforts d'étiquetage.

Link to this sectionQu'est-ce que l'apprentissage actif ?#

L'apprentissage actif est une technique d'apprentissage automatique itérative où le modèle choisit les points de données les plus importants à étiqueter à partir d'un grand pool de données non étiquetées. Ces points de données sélectionnés sont étiquetés manuellement et ajoutés au jeu de données d'entraînement.

Le modèle est ensuite réentraîné sur le jeu de données mis à jour et sélectionne le prochain ensemble de points de données à étiqueter. Ce processus se répète, le modèle s'améliorant continuellement en se concentrant sur les points de données les plus informatifs. Le cycle continue jusqu'à ce que le modèle atteigne la précision souhaitée ou remplisse les critères d'étiquetage définis à l'avance.

Un aperçu de l'apprentissage actif

Fig 1. Un aperçu de l'apprentissage actif.

Link to this sectionComprendre comment fonctionne l'apprentissage actif#

Tu te demandes peut-être comment la technique d'apprentissage actif décide quels points de données nécessitent un étiquetage manuel et lesquels étiqueter ensuite. Comprenons comment fonctionne l'apprentissage actif en le comparant à la préparation d'un examen : tu te concentres sur les sujets que tu ne maîtrises pas et tu t'assures aussi de couvrir une variété de sujets pour être bien préparé.

Pour l'ensemble initial du processus de sélection de données, l'apprentissage actif utilise des stratégies comme l'échantillonnage par incertitude et l'échantillonnage basé sur la diversité. L'échantillonnage par incertitude donne la priorité aux points de données pour lesquels le modèle est le moins confiant dans ses prédictions, visant à améliorer la précision dans les cas difficiles. L'échantillonnage basé sur la diversité sélectionne des points de données qui couvrent une large gamme de caractéristiques, garantissant que le modèle se généralise bien aux données non vues en l'exposant à des exemples diversifiés.

Échantillonnage par incertitude à gauche et échantillonnage basé sur la diversité à droite

Fig 2. Échantillonnage par incertitude (à gauche) et échantillonnage basé sur la diversité (à droite).

Après la sélection initiale des données, l'apprentissage actif utilise deux approches principales pour l'étiquetage : l'échantillonnage basé sur un pool (pool-based) et l'échantillonnage basé sur un flux (stream-based). Elles sont similaires à la façon dont un enseignant aide un élève à se concentrer sur ce qui est le plus important.

Dans l'échantillonnage basé sur un pool, le modèle analyse un large pool de données non étiquetées et sélectionne les exemples les plus difficiles ou informatifs à étiqueter, un peu comme un élève qui donne la priorité aux fiches de révision qu'il trouve les plus difficiles. Concernant l'échantillonnage basé sur un flux, le modèle traite les données à mesure qu'elles arrivent, décidant de les étiqueter ou de les ignorer, similaire à un élève qui demande de l'aide seulement lorsqu'il est bloqué. Dans les deux cas, les données étiquetées sont ajoutées à l'ensemble d'entraînement, et le modèle se réentraîne, s'améliorant régulièrement à chaque itération.

Link to this sectionExplorer les applications de l'apprentissage actif#

L'apprentissage actif joue un rôle clé dans les applications de vision par ordinateur, telles que l'imagerie médicale et la conduite autonome, en améliorant la précision des modèles et en rationalisant le processus d'étiquetage des données. Un exemple intéressant est celui des modèles de vision par ordinateur utilisés dans les voitures autonomes pour détecter les piétons ou les objets dans des conditions de faible luminosité ou de brouillard. L'apprentissage actif peut améliorer la précision en se concentrant sur des scénarios de conduite variés et difficiles.

Plus précisément, l'apprentissage actif peut être utilisé pour identifier des données ou des images incertaines issues de tels scénarios pour un étiquetage sélectif. Ajouter ces exemples étiquetés à l'ensemble d'entraînement permet au modèle de mieux reconnaître les piétons et les objets dans des environnements difficiles, comme pendant les intempéries ou la conduite de nuit.

Par exemple, NVIDIA a utilisé l'apprentissage actif pour améliorer la détection des piétons de nuit dans ses modèles de conduite autonome. En sélectionnant stratégiquement les données les plus informatives pour l'entraînement, particulièrement dans les scénarios difficiles, les performances du modèle augmentent considérablement.

Détection d'un piéton avec un parapluie via l'apprentissage actif

Fig 3. Détection d'un piéton avec un parapluie utilisant l'apprentissage actif.

Link to this sectionL'apprentissage actif peut réduire les coûts d'étiquetage#

Un autre aspect clé de l'apprentissage actif est son potentiel à réduire les coûts d'étiquetage. Il le fait en se concentrant uniquement sur les points de données les plus importants, au lieu de nécessiter des annotations pour l'ensemble du jeu de données. Cette approche ciblée permet d'économiser du temps, des efforts et de l'argent. En se concentrant sur des échantillons incertains ou diversifiés, l'apprentissage actif réduit le nombre d'annotations nécessaires tout en maintenant une haute précision du modèle.

En fait, la recherche montre que l'apprentissage actif peut réduire les coûts d'étiquetage de 40 à 60 % sans sacrifier les performances. Cela est particulièrement utile dans des secteurs comme la santé et la fabrication, où l'étiquetage des données est coûteux. En simplifiant le processus d'annotation, l'apprentissage actif aide les entreprises à développer des modèles plus rapidement et à les déployer plus efficacement tout en maintenant la précision.

Link to this sectionAvantages de l'apprentissage actif#

Voici quelques-uns des autres avantages clés que l'apprentissage actif peut offrir :

Gérer le déséquilibre des classes : L'apprentissage actif peut aider à résoudre les problèmes de déséquilibre des classes en étiquetant des instances provenant de classes de données minoritaires. Le modèle peut mieux fonctionner sur des scénarios rares avec des données limitées.
Cycles de développement plus rapides : Étiqueter moins de données signifie indirectement accélérer le processus de développement des modèles d'apprentissage automatique et de vision par ordinateur, laissant plus de temps et de ressources pour des itérations et des expériences supplémentaires.
Adaptabilité : Il peut améliorer continuellement les données d'entraînement en itérant sur des échantillons incertains ou des cas limites, ce qui le rend bien adapté aux jeux de données dynamiques ou évolutifs.

Link to this sectionL'apprentissage actif et AutoML peuvent travailler ensemble#

L'apprentissage automatique automatisé (AutoML) se concentre sur l'automatisation des tâches chronophages et itératives impliquées dans la construction et le déploiement de modèles d'apprentissage automatique. Il simplifie les flux de travail d'apprentissage automatique en automatisant des tâches telles que la sélection de modèles et l'évaluation des performances pour réduire le besoin d'effort manuel.

Lorsqu'il est intégré à l'apprentissage actif, AutoML peut accélérer et optimiser le cycle de vie de développement des modèles. Le composant d'apprentissage actif sélectionne stratégiquement les points de données les plus informatifs pour l'étiquetage, tandis qu'AutoML affine le modèle en automatisant le choix de l'architecture, des paramètres et le réglage.

Workflow AutoML

Fig 4. Flux de travail AutoML.

Comprenons cette combinaison de technologies avec un exemple.

Supposons que tu essaies de détecter des conditions rares en imagerie médicale (un cas d'utilisation où les jeux de données étiquetés sont limités et coûteux à obtenir). L'apprentissage actif peut identifier et sélectionner des données incertaines, telles que des changements subtils dans les images radiographiques, que le modèle ne parvient pas à classer. Ensuite, les données incertaines peuvent être priorisées pour une annotation manuelle afin d'améliorer la compréhension du modèle.

Avec les données annotées, AutoML peut optimiser le modèle en explorant diverses architectures, hyperparamètres et autres techniques d'augmentation de données. Le processus itératif accélère le développement de modèles de vision fiables comme Ultralytics YOLO11 qui aident les professionnels de la santé à poser des diagnostics précis.

Link to this sectionDéfis de l'apprentissage actif#

L'apprentissage actif et ses techniques offrent de nombreux avantages, mais il y a quelques considérations à garder à l'esprit lors de la mise en œuvre de ces stratégies :

Sélection de la stratégie de requête : L'apprentissage actif implique de nombreuses techniques, et choisir la meilleure méthode impacte significativement l'efficacité du modèle. Sélectionner une stratégie inappropriée peut réduire les performances du modèle pour une application spécifique.
Coûts de réentraînement : La nature itérative de l'apprentissage actif nécessite des ressources informatiques coûteuses, surtout pour les grands jeux de données. Le modèle est réentraîné après chaque cycle d'étiquetage, augmentant sa complexité.
Qualité initiale du modèle : L'efficacité de l'apprentissage actif dépend de la qualité du modèle initial. Un modèle initial peu performant peut ne pas identifier avec précision les points de données informatifs, conduisant à des demandes d'étiquetage sous-optimales et à une performance globale réduite.

Link to this sectionLa voie à suivre pour l'apprentissage actif et AutoML#

Avec les avancées récentes en IA et vision par ordinateur, l'apprentissage actif est prêt à relever des défis plus complexes et à rationaliser les flux de travail d'apprentissage automatique. Combiner l'apprentissage actif avec des techniques comme l'apprentissage fédéré et l'apprentissage auto-supervisé peut encore améliorer l'efficacité et l'évolutivité des modèles de vision.

L'apprentissage fédéré permet à un modèle d'être entraîné sur plusieurs appareils ou serveurs avec un cadre distribué sans nécessiter que les données quittent leur emplacement d'origine. Dans des secteurs comme la santé, où la confidentialité des données est importante, l'apprentissage fédéré permet de s'entraîner directement sur des données locales sensibles tout en les gardant sécurisées. Au lieu de partager des données brutes, seules les mises à jour du modèle ou les informations sont partagées, garantissant que les informations privées restent protégées tout en contribuant au processus d'entraînement.

Pendant ce temps, l'apprentissage auto-supervisé aide à réduire le besoin de données étiquetées en pré-entraînant les modèles sur des données non étiquetées. Ce processus crée une base solide pour le modèle. L'apprentissage actif peut ensuite construire sur cette base en identifiant et sélectionnant les points de données les plus importants pour l'annotation humaine, affinant davantage le modèle.

Link to this sectionDe l'apprentissage actif à l'impact actif#

L'apprentissage actif fournit un moyen pratique de s'attaquer aux défis majeurs de la vision par ordinateur, comme le coût élevé de l'annotation des données et le besoin de modèles plus précis. En se concentrant sur l'étiquetage uniquement des points de données les plus précieux, il réduit l'effort requis par les humains tout en boostant les performances du modèle.

Lorsqu'il est combiné avec des technologies comme AutoML, l'apprentissage actif rationalise le développement des modèles en automatisant les tâches chronophages. À mesure que les avancées se poursuivent, l'apprentissage actif est destiné à devenir un outil essentiel pour construire des systèmes de vision par ordinateur plus intelligents et plus efficaces.

Explore notre dépôt GitHub et rejoins notre communauté pour en savoir plus sur les modèles d'IA et de vision par ordinateur. Découvre plus d'applications de la vision par ordinateur dans la fabrication et la santé sur nos pages de solutions. Tu peux aussi consulter nos options de licence pour commencer ton aventure en IA de vision dès aujourd'hui.

Explore solutions

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

L'apprentissage actif accélère le développement de la vision par ordinateur

Link to this sectionLes jeux de données d'images ne sont pas faciles à construire#

Link to this sectionQu'est-ce que l'apprentissage actif ?#

Link to this sectionComprendre comment fonctionne l'apprentissage actif#

Link to this sectionExplorer les applications de l'apprentissage actif#

Link to this sectionL'apprentissage actif peut réduire les coûts d'étiquetage#

Link to this sectionAvantages de l'apprentissage actif#

Link to this sectionL'apprentissage actif et AutoML peuvent travailler ensemble#

Link to this sectionDéfis de l'apprentissage actif#

Link to this sectionLa voie à suivre pour l'apprentissage actif et AutoML#

Link to this sectionDe l'apprentissage actif à l'impact actif#

Explore solutions

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

Construisons ensemble le futur de l'IA !