Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Apprendimento Few-Shot

Scopri come il few-shot learning consente all'IA di adattarsi con dati minimi, trasformando settori come la diagnostica medica e la conservazione della fauna selvatica.

Il Few-Shot Learning (FSL) è un sottocampo del machine learning che si concentra sulla creazione di modelli in grado di generalizzare nuovi concetti a partire da pochi esempi. I modelli tradizionali di deep learning, soprattutto nella computer vision, spesso richiedono grandi quantità di dati di addestramento etichettati per ottenere prestazioni elevate. L'FSL affronta la sfida della scarsità di dati creando modelli in grado di apprendere efficacemente in situazioni di scarsità di dati, imitando la capacità umana di apprendere nuovi oggetti o categorie da pochissime istanze. Questo lo rende prezioso per le applicazioni in cui la raccolta e l'etichettatura dei dati sono costose, richiedono molto tempo o sono semplicemente impossibili.

Come funziona il Few-Shot Learning

L'idea alla base dell'FSL è quella di sfruttare la conoscenza pregressa da un dataset ampio e diversificato per apprendere rapidamente nuove attività correlate. Invece di imparare a classificare direttamente categorie specifiche, il modello impara una rappresentazione più generale dei dati o impara come confrontare i punti dati. Gli approcci comuni includono:

  • Apprendimento basato sulle metriche: Questi metodi apprendono una funzione di distanza o una metrica di similarità per confrontare alcune immagini "di supporto" etichettate con immagini "di query" non etichettate. All'immagine di query viene quindi assegnata la classe dell'immagine di supporto più simile. Esempi popolari di questo approccio includono le Siamese Networks, che imparano a determinare se due immagini provengono dalla stessa classe, e le Prototypical Networks, che imparano una rappresentazione prototipica per ogni classe nello spazio metrico.
  • Apprendimento Basato sull'Ottimizzazione: Spesso associato al meta-apprendimento (o "imparare ad imparare"), questo approccio addestra il processo di ottimizzazione di un modello stesso. L'obiettivo è sviluppare un modello che possa adattare rapidamente i suoi parametri a un nuovo compito con pochi passaggi di discesa del gradiente. Un algoritmo influente in questo settore è il Model-Agnostic Meta-Learning (MAML).
  • Apprendimento basato sulla memoria: Questi modelli utilizzano un componente di memoria esterna per memorizzare le informazioni dai pochi esempi disponibili. Quando viene presentato un nuovo esempio, il modello recupera le informazioni rilevanti dalla sua memoria per fare una previsione. Questo è concettualmente simile al funzionamento degli algoritmi k-Nearest Neighbors (k-NN).

Apprendimento Few-Shot vs. Concetti Correlati

È importante distinguere l'FSL da altri paradigmi di apprendimento che trattano dati limitati:

  • Zero-Shot Learning (ZSL): Lo ZSL è una tecnica più estrema dell'FSL, in quanto richiede a un modello di riconoscere classi che non ha mai visto durante l'addestramento, utilizzando solo descrizioni o attributi semantici di alto livello. L'FSL richiede almeno un esempio, mentre lo ZSL non ne richiede alcuno.
  • One-Shot Learning (OSL): OSL è una variante specifica di FSL in cui al modello viene fornito esattamente un esempio etichettato per ogni nuova classe. Rappresenta lo scenario più impegnativo all'interno del framework few-shot.
  • Transfer Learning: FSL è una forma di transfer learning, ma i due non sono identici. Il transfer learning tradizionale spesso comporta l'utilizzo di un modello pre-addestrato su un ampio dataset come ImageNet e la sua messa a punto su un dataset nuovo più piccolo. FSL è specificamente progettato per scenari in cui il nuovo dataset è estremamente piccolo (ad esempio, meno di 10 esempi per classe). Puoi esplorare come modelli come Ultralytics YOLO11 utilizzano pesi pre-addestrati per il transfer learning nella nostra documentazione sull'addestramento dei modelli.

Applicazioni nel mondo reale

L'FSL è particolarmente utile in domini specializzati dove i dati sono scarsi.

  1. Diagnosi di malattie rare nell'imaging medico: Per le malattie rare, la raccolta di migliaia di scansioni di pazienti per l'addestramento del modello spesso non è fattibile. Con FSL, un modello pre-addestrato su un ampio set di dati di immagini mediche comuni può essere adattato per identificare i segni di una malattia rara utilizzando solo una manciata di casi confermati. Ciò accelera lo sviluppo di strumenti diagnostici per l'analisi delle immagini mediche.
  2. Rilevamento di difetti industriali: Nella produzione, una nuova linea di prodotti può presentare difetti unici e poco frequenti. Invece di interrompere la produzione per raccogliere migliaia di esempi di difetti, un modello FSL per il rilevamento di oggetti può essere addestrato rapidamente con pochi campioni per automatizzare il controllo qualità, migliorando l'efficienza e riducendo gli sprechi. Piattaforme come Ultralytics HUB possono aiutare a gestire tali dataset specializzati e ad accelerare il deployment del modello.

Sfide e direzioni future

Nonostante le sue promesse, FSL affronta sfide significative. L'ostacolo principale è prevenire l'overfitting, poiché il modello può facilmente memorizzare i pochi esempi invece di imparare a generalizzare. Le prestazioni del modello possono anche essere altamente sensibili alla qualità e alla rappresentatività degli esempi di supporto forniti.

La ricerca in corso, guidata da istituzioni come la Stanford University, Google AI e Meta AI, si concentra sulla creazione di algoritmi di meta-apprendimento più robusti e su un migliore sfruttamento delle tecniche di apprendimento non supervisionato o auto-supervisionato per il pre-training. La combinazione di questi approcci mira a costruire sistemi di AI più flessibili ed efficienti in termini di dati, spingendo i confini di ciò che è possibile in ambienti con dati limitati. Framework avanzati come PyTorch e TensorFlow forniscono gli strumenti necessari ai ricercatori per esplorare questi metodi all'avanguardia.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti