Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Guides

Comprendre l'apprentissage few-shot, zero-shot et par transfert

Explore les différences entre l'apprentissage par quelques exemples (few-shot), l'apprentissage sans exemple (zero-shot) et l'apprentissage par transfert en vision par ordinateur et comment ces paradigmes façonnent l'entraînement des modèles d'IA.

ABAbirami Vina
5 min read
Apprentissage few-shot, zero-shot et par transfert en vision par ordinateur

Les systèmes d'intelligence artificielle (IA) peuvent gérer des tâches complexes telles que la reconnaissance faciale, la classification d'images et la conduite automobile avec un minimum d'intervention humaine. Ils y parviennent en étudiant des données, en identifiant des modèles et en utilisant ces modèles pour prendre des décisions ou faire des prédictions. À mesure que l'IA progresse, nous assistons au développement de méthodes de plus en plus sophistiquées permettant aux modèles d'IA d'apprendre, de s'adapter et d'exécuter des tâches avec une efficacité remarquable.

Par exemple, la vision par ordinateur est une branche de l'IA qui permet aux machines d'interpréter et de comprendre les informations visuelles du monde. Le développement traditionnel de modèles de vision par ordinateur repose largement sur de grands jeux de données annotés pour l'entraînement. La collecte et l'étiquetage de ces données peuvent être coûteux et chronophages.

Pour relever ces défis, les chercheurs ont introduit des approches innovantes telles que l'apprentissage few-shot (FSL), qui apprend à partir d'exemples limités ; l'apprentissage zero-shot (ZSL), qui identifie des objets jamais vus auparavant ; et l'apprentissage par transfert (TL), qui applique les connaissances de modèles pré-entraînés à de nouvelles tâches.

Dans cet article, nous explorerons le fonctionnement de ces paradigmes d'apprentissage, soulignerons leurs différences clés et examinerons des applications concrètes. Commençons !

Link to this sectionUn aperçu des paradigmes d'apprentissage#

Explorons ce que sont l'apprentissage few-shot, l'apprentissage zero-shot et l'apprentissage par transfert dans le contexte de la vision par ordinateur et leur fonctionnement.

Link to this sectionApprentissage few-shot#

L'apprentissage few-shot est une méthode où les systèmes apprennent à reconnaître de nouveaux objets en utilisant seulement un petit nombre d'exemples. Par exemple, si tu montres à un modèle quelques photos d'un manchot, d'un pélican et d'un macareux (ce petit groupe est appelé le "support set"), il apprend à quoi ressemblent ces oiseaux.

Plus tard, si tu présentes au modèle une nouvelle image, comme un manchot, il compare cette image avec celles de son support set et choisit la correspondance la plus proche. Lorsque la collecte d'une grande quantité de données est difficile, cette méthode est avantageuse car le système peut toujours apprendre et s'adapter avec seulement quelques exemples.

Aperçu du fonctionnement de l'apprentissage few-shot

Fig 1. Un aperçu du fonctionnement de l'apprentissage few-shot.

Link to this sectionApprentissage zero-shot#

L'apprentissage zero-shot est un moyen pour les machines de reconnaître des choses qu'elles n'ont jamais vues auparavant, sans avoir besoin d'exemples. Il utilise des informations sémantiques, comme des descriptions, pour aider à établir des connexions.

Par exemple, si une machine a appris à connaître des animaux comme les chats, les lions et les chevaux en comprenant des caractéristiques telles que « petit et poilu », « grand félin sauvage » ou « visage allongé », elle peut utiliser ces connaissances pour identifier un nouvel animal, comme un tigre. Même si elle n'a jamais vu de tigre auparavant, elle peut utiliser une description comme « un animal ressemblant à un lion avec des rayures sombres » pour l'identifier correctement. Cela facilite l'apprentissage et l'adaptation des machines sans nécessiter beaucoup d'exemples.

Apprentissage zero-shot identifiant de nouveaux objets à l'aide de descriptions

Fig 2. L'apprentissage zero-shot identifie de nouveaux objets à l'aide de descriptions.

Link to this sectionApprentissage par transfert#

L'apprentissage par transfert est un paradigme où un modèle utilise ce qu'il a appris d'une tâche pour aider à résoudre une nouvelle tâche similaire. Cette technique est particulièrement utile pour les tâches de vision par ordinateur comme la détection d'objets, la classification d'images et la reconnaissance de formes.

Par exemple, en vision par ordinateur, un modèle pré-entraîné peut reconnaître des objets généraux, comme des animaux, puis être affiné via l'apprentissage par transfert pour identifier des spécimens particuliers, tels que différentes races de chiens. En réutilisant les connaissances issues de tâches antérieures, l'apprentissage par transfert facilite l'entraînement des modèles de vision par ordinateur sur des jeux de données plus petits, économisant ainsi du temps et des efforts.

Aperçu du fonctionnement de l'apprentissage par transfert

Fig 3. Un aperçu du fonctionnement de l'apprentissage par transfert.

Tu te demandes peut-être quels modèles prennent en charge l'apprentissage par transfert. Ultralytics YOLO11 est un excellent exemple de modèle de vision par ordinateur capable de le faire. Il s'agit d'un modèle de détection d'objets à la pointe de la technologie, d'abord pré-entraîné sur un vaste jeu de données général. Ensuite, il peut être affiné et entraîné sur mesure sur un jeu de données plus petit et spécialisé pour des tâches spécifiques.

Link to this sectionComparaison des paradigmes d'apprentissage#

Maintenant que nous avons abordé l'apprentissage few-shot, l'apprentissage zero-shot et l'apprentissage par transfert, comparons-les pour voir en quoi ils diffèrent.

Différences clés entre l'apprentissage few-shot, zero-shot et par transfert

Fig 4. Différences clés entre l'apprentissage few-shot, zero-shot et par transfert. Image de l'auteur.

L'apprentissage few-shot est utile lorsque tu ne possèdes qu'une petite quantité de données étiquetées. Il permet à un modèle d'IA d'apprendre à partir de quelques exemples seulement. L'apprentissage zero-shot, quant à lui, ne nécessite aucune donnée étiquetée. Au lieu de cela, il utilise des descriptions ou du contexte pour aider le système à gérer de nouvelles tâches. Parallèlement, l'apprentissage par transfert adopte une approche différente en utilisant les connaissances de modèles pré-entraînés, leur permettant de s'adapter rapidement à de nouvelles tâches avec un minimum de données supplémentaires. Chaque méthode possède ses propres forces selon le type de données et la tâche sur laquelle tu travailles.

Link to this sectionApplications concrètes de divers paradigmes d'apprentissage#

Ces paradigmes d'apprentissage font déjà la différence dans de nombreux secteurs, résolvant des problèmes complexes avec des solutions innovantes. Examinons de plus près comment ils peuvent être appliqués dans le monde réel.

Link to this sectionDiagnostiquer des maladies rares avec l'apprentissage few-shot#

L'apprentissage few-shot change la donne dans le secteur de la santé, notamment en imagerie médicale. Il peut aider les médecins à diagnostiquer des maladies rares en utilisant seulement quelques exemples, voire des descriptions, sans avoir besoin de grandes quantités de données. Cela s'avère particulièrement utile lorsque les données sont limitées, ce qui est souvent le cas car la collecte de vastes jeux de données pour des pathologies rares peut être complexe.

Par exemple, SHEPHERD utilise l'apprentissage few-shot et des graphes de connaissances biomédicales pour diagnostiquer des troubles génétiques rares. Il cartographie les informations des patients, telles que les symptômes et les résultats d'examens, sur un réseau de gènes et de maladies connus. Cela aide à identifier la cause génétique probable et à trouver des cas similaires, même lorsque les données sont limitées.

Le modèle SHEPHERD diagnostiquant des maladies rares à l'aide de données minimales

Fig 5. Le modèle Shepherd diagnostique des maladies rares avec un minimum de données.

Link to this sectionAméliorer la détection des maladies des plantes avec l'apprentissage zero-shot#

Dans l'agriculture, l'identification rapide des maladies des plantes est essentielle car les retards de détection peuvent entraîner des dommages étendus aux cultures, une baisse des rendements et des pertes financières importantes. Les méthodes traditionnelles reposent souvent sur de grands jeux de données et l'expertise humaine, qui ne sont pas toujours accessibles, notamment dans les zones reculées ou disposant de ressources limitées. C'est là que les avancées de l'IA, comme l'apprentissage zero-shot, entrent en jeu.

Supposons qu'un agriculteur cultive des tomates et des pommes de terre et remarque des symptômes tels que le jaunissement des feuilles ou des taches brunes. L'apprentissage zero-shot peut aider à identifier des maladies comme le mildiou sans nécessiter de grands jeux de données. En utilisant des descriptions des symptômes, le modèle peut classifier des maladies qu'il n'a jamais vues auparavant. Cette approche est rapide, évolutive et permet aux agriculteurs de détecter une variété de problèmes phytosanitaires. Elle les aide à surveiller la santé des cultures plus efficacement, à agir à temps et à réduire les pertes.

Utilisation de l'apprentissage zero-shot pour identifier les maladies des plantes

Fig 6. Utilisation de l'apprentissage zero-shot pour identifier les maladies des plantes.

Link to this sectionVéhicules autonomes et apprentissage par transfert#

Les véhicules autonomes doivent souvent s'adapter à différents environnements pour naviguer en toute sécurité. L'apprentissage par transfert les aide à utiliser des connaissances préalables pour s'ajuster rapidement à de nouvelles conditions sans repartir de zéro. Combinées à la vision par ordinateur, qui aide les véhicules à interpréter les informations visuelles, ces technologies permettent une navigation plus fluide sur différents terrains et dans diverses conditions météorologiques, rendant la conduite autonome plus efficace et fiable.

Un bon exemple concret est un système de gestion de parking utilisant Ultralytics YOLO11 pour surveiller les places de stationnement. YOLO11, un modèle de détection d'objets pré-entraîné, peut être affiné par apprentissage par transfert pour identifier en temps réel les places vides et occupées. En entraînant le modèle sur un jeu de données réduit d'images de parkings, il apprend à détecter avec précision les emplacements libres, complets et même les zones réservées.

Gestion du stationnement à l'aide d'Ultralytics YOLO11

Fig 7. Gestion de parking utilisant Ultralytics YOLO11.

Intégré à d'autres technologies, ce système peut guider les conducteurs vers la place disponible la plus proche, aidant à réduire le temps de recherche et la congestion du trafic. L'apprentissage par transfert rend cela possible en s'appuyant sur les capacités existantes de détection d'objets de YOLO11, lui permettant de s'adapter aux besoins spécifiques de la gestion de parking sans repartir de zéro. Cette approche permet d'économiser du temps et des ressources tout en créant une solution hautement efficace et évolutive qui améliore les opérations de stationnement et enrichit l'expérience globale de l'utilisateur.

Link to this sectionTendances émergentes dans les paradigmes d'apprentissage#

L'avenir des paradigmes d'apprentissage en vision par ordinateur tend vers le développement de systèmes d'IA visuelle plus intelligents et durables. En particulier, une tendance croissante est l'utilisation d'approches hybrides combinant apprentissage few-shot, zero-shot et par transfert. En mélangeant les forces de ces méthodes, les modèles peuvent apprendre de nouvelles tâches avec un minimum de données et appliquer leurs connaissances dans différents domaines.

Un exemple intéressant consiste à utiliser des plongements profonds adaptés pour affiner les modèles en utilisant les connaissances de tâches précédentes et une petite quantité de nouvelles données, facilitant ainsi le travail avec des jeux de données limités.

De même, l'apprentissage X-shot est conçu pour gérer des tâches avec différentes quantités de données. Il utilise une supervision faible, où les modèles apprennent à partir d'étiquettes limitées ou bruitées, ainsi que des instructions claires pour les aider à s'adapter rapidement, même avec peu ou aucun exemple préalable disponible. Ces approches hybrides montrent comment l'intégration de différentes méthodes d'apprentissage peut aider les systèmes d'IA à relever les défis plus efficacement.

Link to this sectionPoints clés#

L'apprentissage few-shot, l'apprentissage zero-shot et l'apprentissage par transfert répondent chacun à des défis spécifiques en vision par ordinateur, ce qui les rend adaptés à des tâches différentes. La bonne approche dépend de l'application spécifique et de la quantité de données disponible. Par exemple, l'apprentissage few-shot fonctionne bien avec des données limitées, tandis que l'apprentissage zero-shot est idéal pour traiter des classes invisibles ou inconnues.

Pour l'avenir, il est probable que la combinaison de ces méthodes pour créer des modèles hybrides intégrant la vision, le langage et l'audio deviendra un axe de recherche clé. Ces avancées visent à rendre les systèmes d'IA plus flexibles, efficaces et capables de résoudre des problèmes complexes, ouvrant de nouvelles possibilités d'innovation dans le domaine.

Découvre plus sur l'IA en rejoignant notre communauté et en consultant notre dépôt GitHub. Apprends comment l'IA dans les voitures autonomes et la vision par ordinateur dans l'agriculture façonnent l'avenir. Consulte les options disponibles pour la licence YOLO pour commencer !

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique