Glossaire

Apprentissage unique

Découvrez la puissance du One-Shot Learning, une technique d'IA révolutionnaire permettant aux modèles de se généraliser à partir de données minimales pour des applications du monde réel.

Le One-Shot Learning (OSL) est une tâche de classification au sein de l'apprentissage automatique (ML) où un modèle est formé pour reconnaître une nouvelle classe d'objets à partir d'un seul exemple. Contrairement aux modèles d'apprentissage profond traditionnels qui nécessitent de grandes quantités de données d'entraînement, l'OSL vise à imiter la capacité humaine à apprendre un nouveau concept à partir d'une seule instance. Cela le rend particulièrement précieux dans les scénarios où la collecte de données est coûteuse, difficile, voire impossible. L'idée centrale n'est pas d'apprendre à classer les objets directement, mais plutôt d'apprendre une fonction de similarité qui peut déterminer si deux images appartiennent à la même classe.

Comment fonctionne l'apprentissage en une seule fois

Au lieu d'entraîner un modèle à identifier des classes spécifiques, les modèles OSL sont généralement entraînés à une tâche différente : déterminer si deux images d'entrée sont identiques ou différentes. Une architecture couramment utilisée à cette fin est le réseau siamois, qui consiste en deux réseaux neuronaux identiques partageant les mêmes poids. Chaque réseau traite l'une des deux images d'entrée pour créer un embedding, c'est-à-dire unereprésentation numérique compacte de l'image.

Le modèle compare ensuite ces deux encastrements pour calculer un score de similarité. Au cours de l'apprentissage du modèle, le réseau apprend à produire des encastrements similaires pour les images de la même classe et des encastrements dissemblables pour les images de classes différentes. Une fois entraîné, le modèle peut classer une nouvelle image en la comparant à l'unique "cliché" ou exemple de chaque classe connue. La nouvelle image est affectée à la classe dont le score de similarité est le plus élevé. Cette approche s'appuie fortement sur une bonne extraction des caractéristiques pour construire des représentations robustes.

Relations avec d'autres paradigmes d'apprentissage

L'OSL fait partie d'une famille plus large de méthodes d'apprentissage conçues pour des scénarios à faible volume de données :

  • Few-Shot Learning (FSL): Une généralisation de l'OSL où le modèle apprend à partir d'un petit nombre d'exemples (par exemple, 2 à 5) par classe, plutôt qu'à partir d'un seul. Le FSL fournit plus d'informations que l'OSL, ce qui se traduit souvent par de meilleures performances.
  • Zero-Shot Learning (ZSL): Un paradigme plus difficile dans lequel le modèle doit reconnaître des classes qu'il n'a jamais vues pendant la formation, généralement en apprenant une correspondance entre les caractéristiques visuelles et les descriptions sémantiques de haut niveau.
  • Méta-apprentissage: Souvent appelée "apprendre à apprendre", cette approche forme un modèle à une grande variété de tâches d'apprentissage pour lui permettre de résoudre de nouvelles tâches plus efficacement. De nombreuses techniques d'OSL et de FSL sont basées sur les principes du méta-apprentissage, tels que décrits par la recherche d'institutions telles que le BAIR de l'UC Berkeley.
  • Apprentissage par transfert: Il s'agit d'utiliser un modèle pré-entraîné sur un grand ensemble de données (comme ImageNet) et de l'affiner ensuite sur un ensemble de données plus petit et spécifique. Bien qu'apparenté, l'apprentissage par transfert se concentre sur l'apprentissage à partir d'un seul exemple, sans ajustement approfondi.

Applications dans le monde réel

L'apprentissage en une seule fois est très efficace dans les situations où les données sont rares.

  1. Reconnaissance faciale : Les systèmes de sécurité peuvent utiliser la LSO pour identifier une personne après lui avoir montré une seule photo. Le système apprend à créer une signature faciale unique (embedding) et peut ensuite reconnaître cette personne sous différents angles et dans différentes conditions d'éclairage. Ce système est utilisé dans des applications allant du déverrouillage des smartphones à la sécurisation de l'accès aux bâtiments. Un article influent, DeepFace by Facebook AI, a démontré la puissance des réseaux profonds pour cette tâche.
  2. Découverte de médicaments : En pharmacologie, l'identification de nouvelles molécules susceptibles de devenir des médicaments efficaces est un processus coûteux. La LSO peut être utilisée pour construire des modèles qui prédisent les propriétés d'une nouvelle molécule sur la base d'un seul exemple connu présentant les caractéristiques souhaitées. Cela permet d'accélérer le processus de sélection, comme le montre la recherche sur l'apprentissage profond basé sur les graphes pour le développement de médicaments.

Défis et orientations futures

Le principal défi de l'OSL est la généralisation. Un modèle doit apprendre l'essence même d'une classe à partir d'un seul exemple sans s'adapter de manière excessive à ses caractéristiques spécifiques. La qualité de l'exemple unique est donc cruciale. Les recherches en cours, telles que celles présentées dans Papers with Code, se concentrent sur le développement de représentations de caractéristiques plus robustes et de stratégies de méta-apprentissage avancées. L'intégration des capacités OSL dans des plates-formes de vision polyvalentes comme Ultralytics HUB pourrait élargir considérablement leur utilisation dans des environnements où les données sont limitées. À mesure que les modèles deviennent plus puissants, leur évaluation à l'aide de mesures de performance appropriées dans ces conditions difficiles constitue également un domaine d'étude clé.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers