Glossario

Apprendimento one-shot

Scoprite la potenza del One-Shot Learning, una tecnica rivoluzionaria di intelligenza artificiale che consente ai modelli di generalizzare da dati minimi per applicazioni reali.

L'apprendimento One-Shot (OSL) è un compito di classificazione nell'ambito dell'apprendimento automatico (ML) in cui un modello viene addestrato a riconoscere una nuova classe di oggetti da un solo esempio. A differenza dei tradizionali modelli di deep learning, che richiedono grandi quantità di dati di addestramento, l'OSL mira a imitare la capacità umana di apprendere un nuovo concetto da una singola istanza. Questo lo rende particolarmente utile in scenari in cui la raccolta di dati è costosa, difficile o impossibile. L'idea centrale non è quella di imparare a classificare direttamente gli oggetti, ma piuttosto di apprendere una funzione di somiglianza in grado di determinare se due immagini appartengono alla stessa classe.

Come funziona l'apprendimento one-shot

Invece di addestrare un modello per identificare classi specifiche, i modelli OSL sono tipicamente addestrati per un compito diverso: determinare se due immagini in ingresso sono uguali o diverse. Un'architettura comunemente utilizzata a questo scopo è la rete siamese, che consiste in due reti neurali identiche che condividono gli stessi pesi. Ogni rete elabora una delle due immagini in ingresso per creare un embedding, ovvero unarappresentazione numerica compatta dell'immagine.

Il modello confronta quindi queste due incorporazioni per calcolare un punteggio di somiglianza. Durante l'addestramento del modello, la rete impara a produrre incorporazioni simili per immagini della stessa classe e incorporazioni dissimili per immagini di classi diverse. Una volta addestrato, il modello è in grado di classificare una nuova immagine confrontandola con il singolo "scatto" o esempio di ciascuna classe nota. La nuova immagine viene assegnata alla classe con il punteggio di somiglianza più alto. Questo approccio si basa molto su una buona estrazione delle caratteristiche per costruire rappresentazioni robuste.

Relazione con altri paradigmi di apprendimento

L'OSL fa parte di una più ampia famiglia di metodi di apprendimento progettati per scenari con pochi dati:

  • Apprendimento a pochi colpi (FSL): Una generalizzazione dell'OSL in cui il modello apprende da un numero ridotto di esempi (ad esempio, da 2 a 5) per classe, anziché da uno solo. L'FSL fornisce più informazioni rispetto all'OSL e spesso porta a prestazioni migliori.
  • Apprendimento a colpo zero (ZSL): Un paradigma più impegnativo in cui il modello deve riconoscere le classi che non ha mai visto durante l'addestramento, in genere imparando una mappatura tra le caratteristiche visive e le descrizioni semantiche di alto livello.
  • Meta-apprendimento: Spesso chiamato "imparare a imparare", questo approccio addestra un modello su un'ampia varietà di compiti di apprendimento per consentirgli di risolvere nuovi compiti in modo più efficiente. Molte tecniche OSL e FSL si basano sui principi del meta-apprendimento, come descritto dalla ricerca di istituzioni come il BAIR della UC Berkeley.
  • Trasferimento di apprendimento: Si tratta di utilizzare un modello pre-addestrato su un set di dati di grandi dimensioni (come ImageNet) e di metterlo a punto su un set di dati più piccolo e specifico. Sebbene sia correlato, l'OSL si concentra sull'apprendimento da un singolo esempio senza una messa a punto estesa.

Applicazioni del mondo reale

L'apprendimento One-Shot è molto efficace in situazioni di scarsità di dati.

  1. Riconoscimento facciale: I sistemi di sicurezza possono utilizzare l'OSL per identificare una persona dopo averle mostrato una sola foto. Il sistema impara a creare una firma facciale unica (embedding) e può quindi riconoscere quella persona da diverse angolazioni e in varie condizioni di illuminazione. Questo viene utilizzato in applicazioni che vanno dallo sblocco degli smartphone all'accesso sicuro agli edifici. Un primo autorevole lavoro, DeepFace di Facebook AI, ha dimostrato la potenza delle reti profonde per questo compito.
  2. Scoperta di farmaci: In farmacologia, l'identificazione di nuove molecole che potrebbero diventare farmaci efficaci è un processo costoso. L'OSL può essere utilizzato per costruire modelli che prevedano le proprietà di una nuova molecola sulla base di un singolo esempio noto con le caratteristiche desiderate. Questo accelera il processo di screening, come discusso nella ricerca sul deep learning basato su grafi per lo sviluppo di farmaci.

Sfide e direzioni future

La sfida principale dell'OSL è la generalizzazione. Un modello deve apprendere l'essenza di una classe da un singolo esempio senza adattarsi eccessivamente alle sue caratteristiche specifiche. La qualità del singolo esempio è quindi fondamentale. La ricerca in corso, come quella evidenziata su Papers with Code, si concentra sullo sviluppo di rappresentazioni di caratteristiche più robuste e di strategie di meta-apprendimento avanzate. L'integrazione di funzionalità OSL in piattaforme di visione generiche come Ultralytics HUB potrebbe ampliare notevolmente il loro utilizzo in ambienti con dati limitati. Man mano che i modelli diventano più potenti, anche la loro valutazione con metriche di prestazione appropriate in queste condizioni difficili è un'area di studio fondamentale.

Unitevi alla comunità di Ultralytics

Entrate a far parte del futuro dell'IA. Connettetevi, collaborate e crescete con gli innovatori globali.

Iscriviti ora
Link copiato negli appunti