Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

One-Shot Learning

Scopri la potenza dell'One-Shot Learning, una tecnica di AI rivoluzionaria che consente ai modelli di generalizzare a partire da dati minimi per applicazioni reali.

L'apprendimento One-Shot (OSL) è un task di classificazione all'interno del machine learning (ML) in cui un modello viene addestrato a riconoscere una nuova classe di oggetti a partire da un singolo esempio. A differenza dei modelli tradizionali di deep learning che richiedono grandi quantità di dati di addestramento, l'OSL mira a imitare la capacità umana di apprendere un nuovo concetto da una singola istanza. Questo lo rende particolarmente prezioso in scenari in cui la raccolta di dati è costosa, difficile o impossibile. L'idea centrale non è quella di imparare a classificare direttamente gli oggetti, ma piuttosto di apprendere una funzione di similarità che possa determinare se due immagini appartengono alla stessa classe.

Come funziona l'apprendimento one-shot

Invece di addestrare un modello per identificare classi specifiche, i modelli OSL vengono tipicamente addestrati su un'attività diversa: determinare se due immagini di input sono uguali o diverse. Un'architettura comune utilizzata per questo è la Siamese Network, che consiste in due reti neurali identiche che condividono gli stessi pesi. Ciascuna rete elabora una delle due immagini di input per creare un embedding: una rappresentazione numerica compatta dell'immagine.

Il modello confronta quindi questi due embedding per calcolare un punteggio di similarità. Durante l'addestramento del modello, la rete impara a produrre embedding simili per immagini della stessa classe e embedding dissimili per immagini di classi diverse. Una volta addestrato, il modello può classificare una nuova immagine confrontandola con il singolo "shot" o esempio di ogni classe conosciuta. La nuova immagine viene assegnata alla classe con il punteggio di similarità più alto. Questo approccio si basa fortemente su una buona estrazione delle feature per costruire rappresentazioni solide.

Relazione con Altri Paradigmi di Apprendimento

OSL fa parte di una famiglia più ampia di metodi di apprendimento progettati per scenari con pochi dati:

  • Few-Shot Learning (FSL): Una generalizzazione di OSL in cui il modello apprende da un piccolo numero di esempi (ad esempio, da 2 a 5) per classe, anziché solo uno. FSL fornisce più informazioni di OSL, portando spesso a prestazioni migliori.
  • Zero-Shot Learning (ZSL): Un paradigma più impegnativo in cui il modello deve riconoscere classi che non ha mai visto durante l'addestramento, in genere imparando una mappatura tra caratteristiche visive e descrizioni semantiche di alto livello.
  • Meta-Apprendimento: Spesso definito "imparare ad imparare", questo approccio addestra un modello su un'ampia varietà di task di apprendimento per consentirgli di risolvere nuovi task in modo più efficiente. Molte tecniche OSL e FSL si basano sui principi del meta-apprendimento, come descritto dalla ricerca di istituzioni come il BAIR dell'UC Berkeley.
  • Transfer Learning: Ciò comporta l'utilizzo di un modello pre-addestrato su un ampio set di dati (come ImageNet) e quindi il suo fine-tuning su un set di dati più piccolo e specifico. Pur essendo correlato, OSL si concentra sull'apprendimento da un singolo esempio senza un ampio fine-tuning.

Applicazioni nel mondo reale

L'apprendimento One-Shot è molto efficace in situazioni con dati scarsi.

  1. Riconoscimento facciale: I sistemi di sicurezza possono utilizzare l'OSL per identificare una persona dopo aver mostrato solo una foto. Il sistema impara a creare una firma facciale univoca (embedding) e può quindi riconoscere quella persona da diverse angolazioni e in varie condizioni di illuminazione. Questo viene utilizzato in applicazioni che vanno dallo sblocco degli smartphone all'accesso sicuro agli edifici. Un primo articolo influente, DeepFace di Facebook AI, ha dimostrato la potenza delle reti profonde per questo compito.
  2. Scoperta di farmaci: In farmacologia, l'identificazione di nuove molecole che potrebbero diventare farmaci efficaci è un processo costoso. L'OSL può essere utilizzato per costruire modelli che prevedono le proprietà di una nuova molecola basandosi su un singolo esempio noto con le caratteristiche desiderate. Questo accelera il processo di screening, come discusso nella ricerca sull'apprendimento profondo basato su grafi per lo sviluppo di farmaci.

Sfide e direzioni future

La sfida principale in OSL è la generalizzazione. Un modello deve apprendere l'essenza fondamentale di una classe da un singolo esempio senza sovradattarsi alle sue caratteristiche specifiche. La qualità del singolo esempio è quindi fondamentale. La ricerca in corso, come il lavoro evidenziato su Papers with Code, si concentra sullo sviluppo di rappresentazioni di caratteristiche più robuste e strategie avanzate di meta-learning. L'integrazione delle capacità OSL in piattaforme di visione generiche come Ultralytics HUB potrebbe espanderne notevolmente l'uso in ambienti con dati limitati. Man mano che i modelli diventano più potenti, valutarli con metriche di performance appropriate in queste difficili condizioni è anche un'area chiave di studio.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti