Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Apprendimento Few-Shot

Scopri come il few-shot learning consente all'IA di adattarsi con dati minimi, trasformando settori come la diagnostica medica e la conservazione della fauna selvatica.

L'apprendimento a pochi colpi (Few-Shot Learning, FSL) è un sottocampo specialistico del dell'apprendimento automatico (ML) che si concentra sull'addestramento modelli di intelligenza artificiale per categorizzare, detect o comprendere nuovi concetti utilizzando solo un numero molto ridotto di esempi etichettati. esempi etichettati. Nel tradizionale apprendimento profondo (DL), i modelli spesso richiedono migliaia di di immagini per classe per ottenere un'elevata precisione. Tuttavia, l'FSL imita la capacità umana di generalizzare rapidamente da un'esperienza limitata. esperienza limitata, proprio come un bambino può riconoscere una giraffa dopo aver visto solo una o due immagini. Questa capacità è fondamentale per le applicazioni in cui l'acquisizione di grandi quantità di dati di dati per l'addestramento è costosa, lunga o praticamente impossibile. praticamente impossibile.

Meccanismi fondamentali dell'apprendimento a pochi colpi

L'obiettivo principale dell'FSL è quello di ridurre la dipendenza da enormi insiemi di dati, sfruttando la conoscenza pregressa. Invece di imparare nuovi modelli da zero, il modello utilizza le informazioni apprese da un set di dati di base per interpretare i pochi esempi disponibili per un nuovo compito. esempi disponibili per un nuovo compito. Questo obiettivo viene spesso raggiunto attraverso approcci distinti:

  • Meta-apprendimento: Spesso descritto come "imparare a imparare", il meta-apprendimento il meta-apprendimento addestra i modelli ad adattarsi rapidamente a nuovi compiti. compiti. Algoritmi come il Model-Agnostic Meta-Learning (MAML) ottimizzano i parametri interni del modello in modo da i parametri interni del modello in modo che pochi passi di gradiente su un nuovo compito portino a buone prestazioni.
  • Apprendimento basato sulle metriche: Questo approccio mappa i dati di input in uno spazio di caratteristiche in cui gli elementi simili sono simili sono vicini e quelli dissimili sono lontani. Tecniche come Reti prototipiche calcolano una rappresentazione media (prototipo) per ogni classe per ogni classe e classify i nuovi campioni di query in base alla loro distanza da questi prototipi, con un funzionamento simile a quello di una sofisticato k-Nearest Neighbors (k-NN).
  • Aumento dei dati: Quando i campioni sono scarsi, i ricercatori spesso ampliano artificialmente il set di dati. Le tecniche avanzate di aumento dei dati possono generare variazioni sintetiche delle poche immagini disponibili, aiutando a evitare che il modello si di adattamento eccessivo agli esempi limitati.

Implementazione dell'apprendimento a pochi colpi con YOLO11

In scenari pratici di computer vision (CV), l'FSL è spesso implementato attraverso l'apprendimento per trasferimento. Prendendo un modello robusto come YOLO11che ha già appreso ricche rappresentazioni rappresentazioni di caratteristiche ricche da insiemi di dati massicci come COCO, gli sviluppatori possono mettere a punto il modello su un piccolo set di dati personalizzato. I pesi preaddestrati fungono da potente estrattore di caratteristiche, permettendo al modello di convergere su nuove classi estrattore di caratteristiche, consentendo al modello di convergere su nuove classi con pochissimi campioni.

Il seguente codice Python dimostra come applicare questo concetto utilizzando il metodo ultralytics pacchetto. Caricando un modello caricando un modello pre-addestrato e addestrandolo per un breve periodo di tempo su un piccolo set di dati, si esegue essenzialmente un adattamento a pochi colpi. adattamento.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model to leverage learned feature representations
model = YOLO("yolo11n.pt")

# Fine-tune the model on a small dataset (e.g., 'coco8.yaml' has only 4 images per batch)
# The model adapts its existing knowledge to the new few-shot task
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# The model can now detect objects from the small dataset with high efficiency

Distinguere i pochi colpi dai concetti correlati

Per capire dove si colloca l'FSL nel panorama dell'IA, è utile differenziarlo da paradigmi di apprendimento simili:

  • Apprendimento a zero colpi (ZSL): Mentre FSL richiede almeno un piccolo insieme di esempi (il "set di supporto"), ZSL non richiede alcun esempio visivo durante l'addestramento dell'inferenza per la classe target. durante l'addestramento dell'inferenza per la specifica classe di riferimento. Invece, ZSL si affida a descrizioni semantiche o ad attributi (ad es. attributi semantici (ad esempio, le incorporazioni di testo) per riconoscere le categorie non viste.
  • Apprendimento one-shot: Si tratta di un caso estremo di caso estremo di FSL in cui il modello deve imparare una nuova classe da un solo esempio etichettato. Si tratta di un benchmark standard standard nei sistemi di riconoscimento facciale, dove un telefono si sblocca dopo aver visto il volto dell'utente una sola volta.
  • Apprendimento per trasferimento: L'FSL è un'applicazione applicazione specifica dell'apprendimento per trasferimento. L'apprendimento di trasferimento standard potrebbe ancora utilizzare centinaia di immagini per la per la messa a punto, mentre l'FSL si rivolge esplicitamente a scenari con con regimi di dati molto bassi (ad esempio, da 5 a 10 immagini per classe).

Applicazioni nel mondo reale

Il Few-Shot Learning sta sbloccando il potenziale nei settori in cui i dati sono naturalmente scarsi o le anomalie distinte sono rare.

Diagnostica medica

Nell'analisi delle immagini mediche, ottenere migliaia di scansioni etichettate per patologie rare è spesso impossibile. L'FSL consente ai modelli di intelligenza artificiale di identificare tipi di tumori rari o condizioni genetiche rare utilizzando solo una manciata di casi di studio annotati. Istituzioni come Stanford Medicine stanno esplorando attivamente queste tecniche per democratizzare gli strumenti di AI strumenti diagnostici per malattie poco rappresentate.

Controllo qualità della produzione

La moderna IA nella produzione si basa sul rilevamento dei difetti per garantire la qualità. Tuttavia, difetti specifici potrebbero verificarsi solo una volta su un milione di unità. Invece di aspettare mesi per raccogliere un grande set di dati di "difetti", gli ingegneri usano l'FSL per addestrare i sistemi di rilevamento degli oggetti su pochi esempi. sistemi di rilevamento degli oggetti su pochi esempi di un nuovo difetto, consentendo l'implementazione immediata di protocolli di garanzia della qualità aggiornati.

Robotica e adattamento

I robot che operano in ambienti dinamici incontrano spesso oggetti che non hanno mai visto prima. Utilizzando i sistemi FSL, sistemi robotici possono imparare ad afferrare o manipolare un nuovo strumento dopo averne ricevuto una dimostrazione solo poche volte. Questa capacità è essenziale per l'automazione flessibile nel magazzini e nella logistica, un obiettivo di aziende come Boston Dynamics.

Sfide e prospettive future

Nonostante le sue promesse, l'FSL deve affrontare delle sfide per quanto riguarda l'affidabilità. I modelli possono essere sensibili ai pochi esempi specifici Se il set di supporto non è rappresentativo, le prestazioni si riducono in modo significativo. La ricerca attuale si concentra su migliorare la robustezza delle incorporazioni e sviluppare migliori metodi di stima dell'incertezza. Quadri come PyTorch e TensorFlow continuano a evolversi, fornendo ai ricercatori gli strumenti per spingersi oltre i i confini dell'apprendimento efficiente dei dati. Modelli come YOLO26 si avvicinano al rilascio, ci aspettiamo capacità ancora maggiori nell'apprendimento da dati minimi.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora