Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Apprentissage « Few-Shot »

Découvrez comment l'apprentissage « few-shot » permet à l'IA de s'adapter avec un minimum de données, transformant des domaines tels que le diagnostic médical et la conservation de la faune.

Le Few-Shot Learning (FSL) est un sous-domaine spécialisé de l'apprentissage automatique (ML) qui se concentre sur l'entraînement des utilisateurs. l 'apprentissage machine (ML) qui se concentre sur la formation modèles d'intelligence artificielle pour catégoriser, detect ou comprendre de nouveaux concepts en n'utilisant qu'un très petit nombre d'exemples étiquetés. d'exemples étiquetés. Dans l'apprentissage traditionnels, les modèles nécessitent souvent des milliers d'images par classe pour atteindre une grande précision. Cependant, le FLS imite la capacité humaine à généraliser rapidement à partir d'une expérience limitée. expérience limitée, tout comme un enfant peut reconnaître une girafe après avoir vu seulement une ou deux images. Cette capacité est cruciale Cette capacité est cruciale pour les applications où l'acquisition de grandes quantités de données de formation est coûteuse et prend du temps. de données d'apprentissage est coûteuse, longue ou virtuellement impossible.

Mécanismes fondamentaux de l'apprentissage à court terme

L'objectif principal de la FLS est de réduire la dépendance à l'égard des ensembles de données massifs en tirant parti des connaissances préalables. Au lieu d'apprendre de nouveaux modèles à partir de zéro, le modèle utilise les informations apprises à partir d'un ensemble de données de base pour interpréter les quelques exemples disponibles pour une nouvelle tâche. exemples disponibles pour une nouvelle tâche. Cet objectif est souvent atteint grâce à des approches distinctes :

  • Méta-apprentissage : Souvent décrit comme "apprendre à apprendre", le le méta-apprentissage permet de former des modèles qui s'adaptent rapidement à de nouvelles tâches. nouvelles tâches. Des algorithmes tels que le méta-apprentissage agnostique (MAML) optimisent les paramètres internes du modèle afin que quelques pas de gradient sur une nouvelle tâche conduisent à de bonnes performances. les paramètres internes du modèle de sorte que quelques pas de gradient sur une nouvelle tâche conduisent à de bonnes performances.
  • Apprentissage basé sur les métriques : Cette approche permet de cartographier les données d'entrée dans un espace de caractéristiques où les éléments similaires sont proches les uns des autres et les éléments dissemblables sont éloignés les uns des autres. similaires sont proches les uns des autres et les éléments dissemblables sont éloignés les uns des autres. Des techniques telles que Les réseaux prototypiques calculent une représentation moyenne (prototype) pour chaque classe et classent les nouveaux échantillons de la requête en fonction de leur distance par rapport à ces prototypes. pour chaque classe et classify nouveaux échantillons de requête en fonction de leur distance par rapport à ces prototypes. sophistiqué k-Nearest Neighbors (k-NN) sophistiqué.
  • Augmentation des données : Lorsque les échantillons sont rares, les chercheurs élargissent souvent artificiellement l'ensemble de données. Les techniques avancées d'augmentation des données peuvent peuvent générer des variations synthétiques des quelques images disponibles, ce qui permet d'éviter que le modèle ne s'adapte trop aux exemples limités. de s'adapter de manière excessive aux exemples limités.

Mise en œuvre de l'apprentissage en quelques clics avec YOLO11

Dans les scénarios pratiques de vision par ordinateur, le FLS est souvent mis en œuvre par le biais de l'apprentissage par transfert. En prenant un modèle robuste comme YOLO11qui a déjà appris de riches représentations représentations de caractéristiques riches à partir d'ensembles de données massifs comme COCO, les développeurs peuvent affiner le modèle sur un petit ensemble de données personnalisé. Les poids pré-entraînés servent de puissant extracteur de caractéristiques, permettant au modèle de converger vers de nouvelles classes avec très peu d'échantillons. d'un puissant extracteur de caractéristiques, permettant au modèle de converger vers de nouvelles classes avec très peu d'échantillons.

Le code Python suivant montre comment appliquer ce concept à l'aide de la fonction ultralytics paquet. En en chargeant un modèle pré-entraîné et en l'entraînant pendant une courte durée sur un petit ensemble de données, vous effectuez essentiellement une adaptation en quelques coups. d'adaptation.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model to leverage learned feature representations
model = YOLO("yolo11n.pt")

# Fine-tune the model on a small dataset (e.g., 'coco8.yaml' has only 4 images per batch)
# The model adapts its existing knowledge to the new few-shot task
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# The model can now detect objects from the small dataset with high efficiency

Distinguer le tir à faible distance des concepts apparentés

Pour comprendre la place de la FLS dans le paysage de l'IA, il est utile de la différencier des paradigmes d'apprentissage similaires :

  • Apprentissage à partir de zéro (ZSL) : Alors que le FLS nécessite au moins un petit ensemble d'exemples (l'"ensemble de support"), le ZSL ne nécessite aucun exemple visuel pendant la formation à l'inférence pour la classe cible spécifique. d'exemples visuels pendant l'apprentissage de l'inférence pour la classe cible spécifique. Au lieu de cela, ZSL s'appuie sur des descriptions sémantiques ou des attributs (par exemple, des textes ou des images). sémantiques ou sur des attributs (par exemple, des enchâssements de texte) pour reconnaître des catégories inédites.
  • Apprentissage en une seule fois: Il s'agit d'un cas extrême de FLS où le modèle doit apprendre une nouvelle classe à partir d'un seul exemple étiqueté. Il s'agit d'un dans les systèmes de reconnaissance faciale, où un téléphone se déverrouille après avoir vu le visage de l'utilisateur une seule fois. un téléphone se déverrouille après avoir vu le visage de l'utilisateur une seule fois.
  • Apprentissage par transfert: Le FLS est une application spécifique de l'apprentissage par transfert. L'apprentissage par transfert standard peut encore utiliser des centaines d'images pour de centaines d'images pour le réglage fin, alors que l'apprentissage par transfert de données très faibles (par exemple, 5 à 10 images par classe).

Applications concrètes

Le Few-Shot Learning libère un potentiel dans les secteurs où les données sont naturellement rares ou les anomalies distinctes sont rares.

Diagnostic médical

Dans l'analyse d'images médicales, il est souvent impossible d'obtenir des milliers de scans étiquetés pour des pathologies rares. de milliers de scans étiquetés pour des pathologies rares est souvent impossible. Le FLS permet aux modèles d'IA d'identifier des types de tumeurs ou des conditions génétiques rares en utilisant seulement une poignée d'études de cas annotées. Des institutions comme Stanford Medicine explorent activement ces techniques pour démocratiser les outils de diagnostic d'IA pour les maladies sous-représentées.

Contrôle de la qualité de la fabrication

L'IA moderne dans l'industrie manufacturière repose sur la détection défauts pour garantir la qualité. Toutefois, certains défauts peuvent ne se produire qu'une fois sur un million d'unités. Au lieu d'attendre des mois pour collecter un vaste ensemble de données sur les "défauts", les ingénieurs utilisent la FLS pour former des systèmes de détection d'objets sur quelques exemples seulement. systèmes de détection d'objets sur quelques exemples seulement d'un nouveau défaut, ce qui permet de le détecter immédiatement. d'un nouveau défaut, ce qui permet de déployer immédiatement des protocoles d'assurance qualité actualisés.

Robotique et adaptation

Les robots opérant dans des environnements dynamiques rencontrent souvent des objets qu'ils n'ont jamais vus auparavant. Grâce au FLS, les systèmes robotiques peuvent apprendre à saisir ou à manipuler un nouvel un nouvel outil après seulement quelques démonstrations. Cette capacité est essentielle pour une automatisation flexible dans les domaines de l'entreposage et de la logistique. l'entreposage et la logistique, domaine de prédilection d'entreprises telles que Boston Dynamics.

Défis et perspectives d'avenir

Malgré ses promesses, la FLS est confrontée à des problèmes de fiabilité. Les modèles peuvent être sensibles aux quelques exemples spécifiques Si l'ensemble de support n'est pas représentatif, les performances chutent de manière significative. La recherche actuelle se concentre sur sur l'amélioration de la robustesse des encastrements et le développement de de meilleures méthodes d'estimation de l'incertitude. Des cadres tels que PyTorch et TensorFlow continuent d'évoluer, offrant aux chercheurs les outils pour repousser les les limites de l'apprentissage efficace en termes de données. Alors que des modèles tels que YOLO26 s'approchent de la publication, nous nous attendons à des capacités encore plus grandes en matière d'apprentissage à partir d'entrées de données minimales.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant