Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024
Glossaire

Apprentissage "One-Shot"

Découvrez la puissance de l'apprentissage "One-Shot", une technique d'IA révolutionnaire permettant aux modèles de généraliser à partir de données minimales pour des applications concrètes.

L'apprentissage en un seul essai (One-Shot Learning, OSL) est une tâche de classification au sein de l'apprentissage automatique (ML) où un modèle est entraîné pour reconnaître une nouvelle classe d'objets à partir d'un seul exemple. Contrairement aux modèles d'apprentissage profond traditionnels qui nécessitent de grandes quantités de données d'entraînement, l'OSL vise à imiter la capacité humaine à apprendre un nouveau concept à partir d'une seule instance. Cela le rend particulièrement précieux dans les scénarios où la collecte de données est coûteuse, difficile ou impossible. L'idée centrale n'est pas d'apprendre à classer directement les objets, mais plutôt d'apprendre une fonction de similarité qui peut déterminer si deux images appartiennent à la même classe.

Comment fonctionne l'apprentissage one-shot

Au lieu d'entraîner un modèle à identifier des classes spécifiques, les modèles OSL sont généralement entraînés sur une tâche différente : déterminer si deux images d'entrée sont identiques ou différentes. Une architecture courante utilisée pour cela est le réseau siamois, qui se compose de deux réseaux neuronaux identiques qui partagent les mêmes poids. Chaque réseau traite l'une des deux images d'entrée pour créer un embedding : une représentation numérique compacte de l'image.

Le modèle compare ensuite ces deux embeddings pour calculer un score de similarité. Pendant l'entraînement du modèle, le réseau apprend à produire des embeddings similaires pour les images de la même classe et des embeddings dissemblables pour les images de classes différentes. Une fois entraîné, le modèle peut classer une nouvelle image en la comparant au "shot" unique ou à l'exemple de chaque classe connue. La nouvelle image est attribuée à la classe avec le score de similarité le plus élevé. Cette approche repose fortement sur une bonne extraction de caractéristiques pour construire des représentations robustes.

Relation avec d'autres paradigmes d'apprentissage

OSL fait partie d'une famille plus large de méthodes d'apprentissage conçues pour les scénarios à faible volume de données :

  • Apprentissage avec peu d'exemples (FSL) : Une généralisation de l'OSL où le modèle apprend à partir d'un petit nombre d'exemples (par exemple, 2 à 5) par classe, plutôt que d'un seul. Le FSL fournit plus d'informations que l'OSL, ce qui conduit souvent à de meilleures performances.
  • Apprentissage Zéro-Shot (ZSL) : Un paradigme plus complexe où le modèle doit reconnaître des classes qu'il n'a jamais vues pendant l'entraînement, généralement en apprenant une correspondance entre les caractéristiques visuelles et les descriptions sémantiques de haut niveau.
  • Méta-apprentissage : Souvent appelé "apprendre à apprendre", cette approche consiste à entraîner un modèle sur une grande variété de tâches d'apprentissage afin de lui permettre de résoudre plus efficacement de nouvelles tâches. De nombreuses techniques OSL et FSL sont basées sur les principes du méta-apprentissage, comme le décrivent les recherches d'institutions telles que le BAIR de l'UC Berkeley.
  • Apprentissage par transfert : Cela implique d'utiliser un modèle pré-entraîné sur un grand ensemble de données (comme ImageNet) et de l'affiner ensuite sur un ensemble de données plus petit et spécifique. Bien que lié, OSL se concentre sur l'apprentissage à partir d'un seul exemple sans affinage étendu.

Applications concrètes

L'apprentissage en un seul essai est très efficace dans les situations où les données sont rares.

  1. Reconnaissance faciale : Les systèmes de sécurité peuvent utiliser l’OSL pour identifier une personne après n’avoir vu qu’une seule photo. Le système apprend à créer une signature faciale unique (plongement) et peut ensuite reconnaître cette personne sous différents angles et dans diverses conditions d’éclairage. Ceci est utilisé dans des applications allant du déverrouillage des smartphones à la sécurisation de l’accès aux bâtiments. Un des premiers articles influents, DeepFace de Facebook AI, a démontré la puissance des réseaux profonds pour cette tâche.
  2. Découverte de médicaments : En pharmacologie, l'identification de nouvelles molécules susceptibles de devenir des médicaments efficaces est un processus coûteux. L'OSL peut être utilisé pour construire des modèles qui prédisent les propriétés d'une nouvelle molécule sur la base d'un seul exemple connu présentant les caractéristiques souhaitées. Cela accélère le processus de criblage, comme indiqué dans les recherches sur l'apprentissage profond basé sur les graphes pour le développement de médicaments.

Défis et orientations futures

Le principal défi de l'OSL est la généralisation. Un modèle doit apprendre l'essence même d'une classe à partir d'un seul exemple sans sur-apprentissage de ses caractéristiques spécifiques. La qualité de l'exemple unique est donc essentielle. La recherche en cours, telle que les travaux mis en évidence sur Papers with Code, se concentre sur le développement de représentations de caractéristiques plus robustes et de stratégies avancées de méta-apprentissage. L'intégration des capacités OSL dans des plateformes de vision à usage général comme Ultralytics HUB pourrait considérablement étendre leur utilisation dans des environnements à données limitées. À mesure que les modèles deviennent plus puissants, leur évaluation avec des métriques de performance appropriées dans ces conditions difficiles est également un domaine d'étude clé.

Rejoignez la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant
Lien copié dans le presse-papiers