En cliquant sur "Accepter tous les cookies", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing. Plus d'informations
Paramètres des cookies
En cliquant sur "Accepter tous les cookies", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing. Plus d'informations
Découvrez les différences entre l'apprentissage à quelques coups, l'apprentissage à zéro coup et l'apprentissage par transfert dans le domaine de la vision par ordinateur, ainsi que la manière dont ces paradigmes influencent la formation des modèles d'IA.
Les systèmes d'intelligence artificielle (IA) peuvent effectuer des tâches complexes telles que reconnaître des visages, classer des images et conduire des voitures avec un minimum d'intervention humaine. Pour ce faire, ils étudient les données, reconnaissent des modèles et les utilisent pour faire des prédictions ou prendre des décisions. Au fur et à mesure que l'intelligence artificielle progresse, nous constatons que les modèles d'intelligence artificielle sont de plus en plus sophistiqués et qu'ils peuvent apprendre, s'adapter et accomplir des tâches avec une efficacité remarquable.
Par exemple, la vision par ordinateur est une branche de l'IA qui vise à permettre aux machines d'interpréter et de comprendre les informations visuelles du monde. Le développement traditionnel de modèles de vision par ordinateur s'appuie fortement sur de grands ensembles de données annotées pour la formation. La collecte et l'étiquetage de ces données peuvent être longs et coûteux.
Pour relever ces défis, les chercheurs ont introduit des approches innovantes telles que l'apprentissage à partir de quelques exemples (FSL), qui apprend à partir d'exemples limités, l'apprentissage à partir de zéro (ZSL), qui identifie des objets non vus, et l'apprentissage par transfert (TL), qui applique les connaissances de modèles pré-entraînés à de nouvelles tâches.
Dans cet article, nous allons explorer le fonctionnement de ces paradigmes d'apprentissage, mettre en évidence leurs principales différences et examiner des applications concrètes. Commençons par le commencement !
Aperçu des paradigmes d'apprentissage
Voyons ce que sont l'apprentissage à quelques coups, l'apprentissage à zéro coup et l'apprentissage par transfert dans le domaine de la vision par ordinateur et comment ils fonctionnent.
Apprentissage à quelques coups
L'apprentissage à partir d'un petit nombre d'images est une méthode par laquelle les systèmes apprennent à reconnaître de nouveaux objets à l'aide d'un petit nombre d'exemples. Par exemple, si vous montrez à un modèle quelques photos d'un pingouin, d'un pélican et d'un macareux (ce petit groupe est appelé "ensemble de support"), il apprendra à quoi ressemblent ces oiseaux.
Plus tard, si vous montrez au modèle une nouvelle image, comme un pingouin, il compare cette nouvelle image avec celles de son ensemble de soutien et choisit la correspondance la plus proche. Lorsqu'il est difficile de recueillir une grande quantité de données, cette méthode est avantageuse car le système peut encore apprendre et s'adapter avec seulement quelques exemples.
Fig. 1. Vue d'ensemble du fonctionnement de l'apprentissage en quelques coups.
Apprentissage à partir de zéro
L'apprentissage à partir de zéro est un moyen pour les machines de reconnaître des choses qu'elles n'ont jamais vues auparavant sans avoir besoin d'exemples. Il utilise des informations sémantiques, telles que des descriptions, pour aider à établir des connexions.
Par exemple, si une machine a appris à connaître des animaux comme les chats, les lions et les chevaux en comprenant des caractéristiques telles que "petit et pelucheux", "gros chat sauvage" ou "long visage", elle peut utiliser ces connaissances pour identifier un nouvel animal, comme un tigre. Même s'il n'a jamais vu de tigre auparavant, il peut utiliser une description telle que "un animal ressemblant à un lion avec des rayures sombres" pour l'identifier correctement. Les machines peuvent ainsi apprendre et s'adapter plus facilement, sans avoir besoin de nombreux exemples.
Fig. 2. L'apprentissage à partir de zéro permet d'identifier de nouveaux objets à l'aide de descriptions.
Apprentissage par transfert
L'apprentissage par transfert est un paradigme d'apprentissage dans lequel un modèle utilise ce qu'il a appris lors d'une tâche pour aider à résoudre une nouvelle tâche similaire. Cette technique est particulièrement utile pour les tâches de vision artificielle telles que la détection d'objets, la classification d'images et la reconnaissance de formes.
Par exemple, dans le domaine de la vision artificielle, un modèle pré-entraîné peut reconnaître des objets généraux, comme des animaux, puis être affiné grâce à l'apprentissage par transfert pour identifier des objets spécifiques, comme les différentes races de chiens. En réutilisant les connaissances acquises lors de tâches antérieures, l'apprentissage par transfert facilite la formation de modèles de vision artificielle sur des ensembles de données plus restreints, ce qui permet d'économiser du temps et des efforts.
Fig. 3. Vue d'ensemble du fonctionnement de l'apprentissage par transfert.
Vous vous demandez peut-être quels types de modèles permettent l'apprentissage par transfert. Ultralytics YOLO11 est un excellent exemple de modèle de vision par ordinateur capable de le faire. Il s'agit d'un modèle de détection d'objets de pointe qui est d'abord pré-entraîné sur un grand ensemble de données générales. Ensuite, il peut être affiné et entraîné sur mesure sur un ensemble de données plus petit et spécialisé pour des tâches spécifiques.
Comparaison des paradigmes d'apprentissage
Maintenant que nous avons parlé de l'apprentissage à quelques coups, de l'apprentissage à zéro coup et de l'apprentissage par transfert, comparons-les pour voir en quoi ils diffèrent.
Fig. 4. Principales différences entre l'apprentissage à quelques coups, l'apprentissage à zéro coup et l'apprentissage par transfert Image de l'auteur.
L'apprentissage à partir de quelques exemples est utile lorsque vous ne disposez que d'une petite quantité de données étiquetées. Il permet à un modèle d'IA d'apprendre à partir de quelques exemples seulement. L'apprentissage à partir de zéro, quant à lui, ne nécessite pas de données étiquetées. Au lieu de cela, il utilise des descriptions ou un contexte pour aider le système à gérer de nouvelles tâches. L'apprentissage par transfert adopte une approche différente en utilisant les connaissances de modèles pré-entraînés, ce qui leur permet de s'adapter rapidement à de nouvelles tâches avec un minimum de données supplémentaires. Chaque méthode possède ses propres atouts, en fonction du type de données et de la tâche sur laquelle vous travaillez.
Applications en situation réelle de divers paradigmes d'apprentissage
Ces paradigmes d'apprentissage font déjà la différence dans de nombreux secteurs, en résolvant des problèmes complexes à l'aide de solutions innovantes. Voyons de plus près comment ils peuvent être appliqués dans le monde réel.
Diagnostiquer les maladies rares grâce à l'apprentissage à petite échelle
L'apprentissage à partir de quelques images change la donne dans le secteur des soins de santé, en particulier dans le domaine de l'imagerie médicale. Il peut aider les médecins à diagnostiquer des maladies rares en utilisant seulement quelques exemples ou même des descriptions, sans avoir besoin de grandes quantités de données. C'est particulièrement utile lorsque les données sont limitées, ce qui est souvent le cas, car la collecte de vastes ensembles de données pour les maladies rares peut s'avérer difficile.
Par exemple, SHEPHERD utilise l'apprentissage à court terme et les graphes de connaissances biomédicales pour diagnostiquer des maladies génétiques rares. Il met en correspondance les informations relatives aux patients, telles que les symptômes et les résultats des tests, avec un réseau de gènes et de maladies connus. Cela permet d'identifier la cause génétique probable et de trouver des cas similaires, même lorsque les données sont limitées.
Fig. 5. Le modèle de Shepherd diagnostique les maladies rares en utilisant un minimum de données.
Amélioration de la détection des maladies des plantes grâce à l'apprentissage à partir de zéro
Dans l'agriculture, il est essentiel d'identifier rapidement les maladies des plantes, car les retards de détection peuvent entraîner des dommages importants aux cultures, une baisse des rendements et des pertes financières considérables. Les méthodes traditionnelles s'appuient souvent sur de vastes ensembles de données et des connaissances spécialisées, qui ne sont pas toujours accessibles, en particulier dans les régions éloignées ou à ressources limitées. C'est là que les progrès de l'intelligence artificielle, tels que l'apprentissage à partir de zéro, entrent en jeu.
Supposons qu'un agriculteur cultive des tomates et des pommes de terre et qu'il remarque des symptômes tels que le jaunissement des feuilles ou des taches brunes. L'apprentissage à partir de zéro peut aider à identifier des maladies comme le mildiou sans nécessiter de grands ensembles de données. En utilisant les descriptions des symptômes, le modèle peut classer des maladies qu'il n'a jamais vues auparavant. Cette approche est rapide, évolutive et permet aux agriculteurs de détecter toute une série de problèmes liés aux plantes. Elle les aide à surveiller plus efficacement la santé des cultures, à prendre des mesures opportunes et à réduire les pertes.
Fig. 6. Utilisation de l'apprentissage à partir de zéro pour identifier les maladies des plantes.
Véhicules autonomes et apprentissage par transfert
Les véhicules autonomes doivent souvent s'adapter à des environnements différents pour naviguer en toute sécurité. L'apprentissage par transfert les aide à utiliser leurs connaissances antérieures pour s'adapter rapidement à de nouvelles conditions sans avoir à recommencer leur formation depuis le début. Associées à la vision artificielle, qui aide les véhicules à interpréter les informations visuelles, ces technologies permettent une navigation plus fluide sur différents terrains et dans différentes conditions météorologiques, ce qui rend la conduite autonome plus efficace et plus fiable.
Un système de gestion des parkings qui utilise Ultralytics YOLO11 pour surveiller les places de stationnement en est un bon exemple. YOLO11, un modèle de détection d'objets pré-entraîné, peut être affiné à l'aide de l'apprentissage par transfert pour identifier les places de parking vides et occupées en temps réel. En entraînant le modèle sur un petit ensemble de données d'images de parkings, il apprend à détecter avec précision les places ouvertes, les places occupées et même les zones réservées.
Fig. 7. Gestion du stationnement à l'aide d'Ultralytics YOLO11.
Intégré à d'autres technologies, ce système peut guider les conducteurs vers la place disponible la plus proche, ce qui permet de réduire le temps de recherche et les embouteillages. L'apprentissage par transfert rend cela possible en s'appuyant sur les capacités existantes de YOLO11 en matière de détection d'objets, ce qui lui permet de s'adapter aux besoins spécifiques de la gestion des parkings sans partir de zéro. Cette approche permet d'économiser du temps et des ressources tout en créant une solution hautement efficace et évolutive qui améliore les opérations de stationnement et l'expérience globale de l'utilisateur.
Tendances émergentes dans les paradigmes d'apprentissage
L'avenir des paradigmes d'apprentissage dans le domaine de la vision par ordinateur s'oriente vers le développement de systèmes d'IA plus intelligents et plus durables. En particulier, une tendance croissante est l'utilisation d'approches hybrides qui combinent l'apprentissage à quelques coups, l'apprentissage à zéro coup et l'apprentissage par transfert. En combinant les forces de ces méthodes, les modèles peuvent apprendre de nouvelles tâches avec un minimum de données et appliquer leurs connaissances dans différents domaines.
Un exemple intéressant est l'utilisation de deep embeddings adaptés pour affiner les modèles en utilisant les connaissances des tâches précédentes et une petite quantité de nouvelles données, ce qui facilite le travail avec des ensembles de données limités.
De même, l'apprentissage X-shot est conçu pour gérer des tâches avec différentes quantités de données. Il utilise une supervision faible, où les modèles apprennent à partir d'étiquettes limitées ou bruyantes, et des instructions claires pour les aider à s'adapter rapidement, même avec peu ou pas d'exemples préalables disponibles. Ces approches hybrides montrent comment l'intégration de différentes méthodes d'apprentissage peut aider les systèmes d'IA à relever plus efficacement les défis.
Principaux enseignements
L'apprentissage à partir de quelques images, l'apprentissage à partir de zéro et l'apprentissage par transfert répondent chacun à des défis spécifiques dans le domaine de la vision par ordinateur, ce qui les rend adaptés à différentes tâches. La bonne approche dépend de l'application spécifique et de la quantité de données disponibles. Par exemple, l'apprentissage à quelques coups fonctionne bien avec des données limitées, tandis que l'apprentissage à zéro coup est idéal pour traiter des classes non vues ou non familières.
À l'avenir, il est probable que la combinaison de ces méthodes pour créer des modèles hybrides qui intègrent la vision, le langage et l'audio sera au cœur des préoccupations. Ces progrès visent à rendre les systèmes d'IA plus souples, plus efficaces et plus aptes à résoudre des problèmes complexes, ouvrant ainsi de nouvelles possibilités d'innovation dans ce domaine.