Glossario

Apprendimento in un colpo solo

Scopri la potenza dell'Apprendimento One-Shot, una tecnica rivoluzionaria di intelligenza artificiale che consente ai modelli di generalizzare da dati minimi per applicazioni reali.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

L'apprendimento One-Shot (OSL) è un'area specializzata dell'apprendimento automatico (ML) in cui l'obiettivo è classificare nuovi esempi basandosi su una sola istanza di addestramento per ogni classe. Questo contrasta nettamente con i tradizionali metodi di apprendimento supervisionato, che spesso richiedono migliaia di esempi etichettati per ogni classe per ottenere un'elevata precisione. L'OSL è particolarmente importante negli scenari in cui i dati di addestramento sono scarsi, costosi o richiedono molto tempo per essere raccolti, il che la rende una tecnica cruciale per le applicazioni del mondo reale in cui le limitazioni dei dati sono comuni.

Come funziona l'apprendimento in un colpo solo

Invece di imparare a mappare direttamente un input a un'etichetta di classe da numerosi esempi, i modelli OSL apprendono tipicamente una funzione di somiglianza. L'idea di base è quella di determinare quanto un nuovo esempio non visto (query) sia simile all'unico esempio etichettato disponibile (supporto) per ogni classe. Se l'esempio di query è molto simile all'esempio di supporto di una specifica classe, gli viene assegnata l'etichetta di quella classe. Spesso si utilizzano architetture di deep learning (DL) come le reti siamesi, che elaborano due input simultaneamente per determinarne la somiglianza. Queste reti sono spesso pre-addestrate su grandi insiemi di dati (come ImageNet) utilizzando il transfer learning per apprendere rappresentazioni robuste delle caratteristiche prima di essere adattate al compito OSL attraverso tecniche come l'apprendimento metrico.

Concetti chiave nell'apprendimento one-shot

  • Set di supporto: Contiene il singolo esempio etichettato fornito per ogni classe da cui il modello deve imparare.
  • Query Set: Contiene gli esempi non etichettati che il modello deve classificare in base all'insieme di supporto.
  • Apprendimento della somiglianza/metrica: Il processo di apprendimento di una funzione di distanza o di una metrica che misura la somiglianza tra i punti di dati, fondamentale per confrontare gli esempi di query con quelli di supporto.
  • Formazione episodica: Una strategia di addestramento comune in cui il modello viene addestrato su molti piccoli compiti OSL (episodi) campionati da un set di dati più ampio per simulare lo scenario one-shot durante l'addestramento.

Apprendimento in un colpo solo vs. paradigmi correlati

Per comprendere l'OSL è necessario distinguerlo dai concetti correlati:

  • Apprendimento a pochi colpi (FSL): L'OSL è considerato una variante estrema dell'FSL. Mentre l'OSL utilizza un solo esempio per classe, l'FSL utilizza un piccolo numero (k > 1, in genere 5 o 10) di esempi per classe. Entrambi affrontano il problema della scarsità di dati, ma si differenziano per il numero di campioni disponibili. Per saperne di più su questi paradigmi, leggi il nostro blog post sulla comprensione dell'apprendimento a pochi colpi, a zero colpi e a trasferimento.
  • Apprendimento Zero-Shot (ZSL): Lo ZSL affronta un problema ancora più difficile: classificare istanze di classi che non sono mai state viste durante la formazione. Questo obiettivo viene tipicamente raggiunto sfruttando informazioni ausiliarie, come attributi semantici o descrizioni testuali, che collegano le classi viste e quelle non viste. L'OSL richiede la visione di un solo esempio; lo ZSL richiede la visione di zero esempi ma necessita di un contesto semantico aggiuntivo.
  • Apprendimento per trasferimento e messa a punto: Sebbene l'OSL utilizzi spesso l' apprendimento per trasferimento (preaddestramento su un ampio set di dati), l'obiettivo è diverso. L'apprendimento di trasferimento standard o la messa a punto fine di solito presuppongono che sia disponibile una quantità ragionevole di dati di destinazione per l'adattamento, mentre l'OSL si occupa specificamente del vincolo di un solo esempio. Tecniche come l'addestramento personalizzato dei modelli Ultralytics YOLO comportano spesso la messa a punto dei pesi pre-addestrati, ma in genere con più di un esempio per classe.

Applicazioni del mondo reale

L'OSL consente di realizzare diverse applicazioni precedentemente ostacolate dalle limitazioni dei dati:

  1. Riconoscimento facciale: I sistemi di sicurezza o i dispositivi personali potrebbero aver bisogno di identificare o verificare una persona dopo averla registrata con una sola fotografia. Il NIST conduce test approfonditi sulle tecnologie di riconoscimento facciale, molte delle quali affrontano sfide simili con pochi scatti o con un solo scatto.
  2. Rilevamento di oggetti rari: In campi come il controllo di qualità della produzione o la conservazione della fauna selvatica, l'identificazione di difetti rari o di specie a rischio potrebbe essere possibile solo con uno o pochissimi esempi precedenti. Mentre modelli come Ultralytics YOLO11 eccellono nell'individuazione di oggetti con un numero sufficiente di dati, le tecniche OSL potrebbero aumentarli per le classi estremamente rare.
  3. Verifica della firma: Autenticare la firma di una persona sulla base di una singola firma di riferimento memorizzata su file. La ricerca esplora il deep learning per questo compito, spesso in regimi di basso consumo di dati.
  4. Scoperta di farmaci: Identificare potenziali nuovi candidati farmaci o prevedere le proprietà delle molecole sulla base di risultati sperimentali molto limitati, accelerando il processo di ricerca. Gli studi mostrano l'applicazione dell'OSL nella previsione delle interazioni farmaco-target.

Sfide e direzioni future

La sfida principale dell'OSL è la generalizzazione: come può un modello apprendere in modo affidabile l'essenza di una classe da un solo esempio senza andare in overfitting? La scelta e la qualità del singolo esempio di supporto diventano fondamentali. La ricerca in corso si concentra sullo sviluppo di rappresentazioni di caratteristiche più robuste, di metriche di somiglianza migliori e di tecniche come il meta-apprendimento ("imparare a imparare") per migliorare le prestazioni dell'OSL. L'integrazione delle funzionalità OSL in modelli di visione generici e in piattaforme come Ultralytics HUB potrebbe ampliare notevolmente la loro applicabilità in ambienti con limitazioni di dati. La valutazione dei modelli OSL richiede un'attenta considerazione delle metriche di prestazione in queste condizioni difficili.

Leggi tutto