Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024

Comprendere il few-shot learning, lo zero-shot learning e il transfer learning

Abirami Vina

5 minuti di lettura

29 gennaio 2025

Esplora le differenze tra few-shot learning, zero-shot learning e transfer learning nella computer vision e come questi paradigmi modellano il training dei modelli AI.

I sistemi di intelligenza artificiale (AI) sono in grado di gestire compiti complessi come il riconoscimento facciale, la classificazione di immagini e la guida di automobili con un input umano minimo. Lo fanno studiando i dati, riconoscendo i modelli e utilizzando tali modelli per fare previsioni o prendere decisioni. Con l'avanzare dell'AI, stiamo assistendo a modi sempre più sofisticati in cui i modelli di AI possono apprendere, adattarsi ed eseguire compiti con notevole efficienza.

Ad esempio, la computer vision è una branca dell'AI che si concentra sul consentire alle macchine di interpretare e comprendere le informazioni visive del mondo. Lo sviluppo tradizionale di modelli di computer vision si basa fortemente su ampi set di dati annotati per il training. La raccolta e l'etichettatura di tali dati possono richiedere molto tempo ed essere costose. 

Per affrontare queste sfide, i ricercatori hanno introdotto approcci innovativi come il few-shot learning (FSL), che apprende da esempi limitati; lo zero-shot learning (ZSL), che identifica oggetti mai visti prima; e il transfer learning (TL), che applica la conoscenza di modelli pre-addestrati a nuovi compiti.

In questo articolo, esploreremo come funzionano questi paradigmi di apprendimento, evidenzieremo le loro principali differenze ed esamineremo le applicazioni nel mondo reale. Iniziamo!

Una panoramica dei paradigmi di apprendimento

Esploriamo cosa sono il few-shot learning, lo zero-shot learning e il transfer learning rispetto alla computer vision e come funzionano. 

Few-shot learning

Il Few-shot learning è un metodo in cui i sistemi imparano a riconoscere nuovi oggetti utilizzando solo un piccolo numero di esempi. Ad esempio, se si mostrano a un modello alcune immagini di un pinguino, un pellicano e una pulcinella di mare (questo piccolo gruppo è chiamato "support set"), il modello impara come appaiono questi uccelli. 

Successivamente, se si mostra al modello una nuova immagine, come un pinguino, il modello confronta questa nuova immagine con quelle nel suo support set e sceglie la corrispondenza più simile. Quando è difficile raccogliere una grande quantità di dati, questo metodo è utile perché il sistema può comunque imparare e adattarsi con solo pochi esempi.

__wf_reserved_inherit
Fig. 1. Una panoramica di come funziona il few-shot learning.

Zero-shot learning

Lo Zero-shot learning è un modo per le macchine di riconoscere cose che non hanno mai visto prima senza aver bisogno di esempi. Utilizza informazioni semantiche, come descrizioni, per aiutare a creare connessioni.

Ad esempio, se una macchina ha imparato a conoscere animali come gatti, leoni e cavalli comprendendo caratteristiche come "piccolo e soffice", "grande felino selvatico" o "faccia lunga", può utilizzare questa conoscenza per identificare un nuovo animale, come una tigre. Anche se non ha mai visto una tigre prima, può usare una descrizione come "un animale simile a un leone con strisce scure" per identificarla correttamente. Questo rende più facile per le macchine imparare e adattarsi senza aver bisogno di molti esempi.

__wf_reserved_inherit
Fig. 2. Lo zero-shot learning identifica nuovi oggetti utilizzando descrizioni.

Transfer learning

Il Transfer learning è un paradigma di apprendimento in cui un modello utilizza ciò che ha imparato da un compito per aiutare a risolvere un nuovo compito simile. Questa tecnica è particolarmente utile quando si tratta di compiti di computer vision come il rilevamento di oggetti, la classificazione di immagini e il riconoscimento di modelli. 

Ad esempio, nella computer vision, un modello pre-addestrato può riconoscere oggetti generali, come animali, e quindi essere messo a punto attraverso il transfer learning per identificare quelli specifici, come diverse razze di cani. Riutilizzando la conoscenza di compiti precedenti, il transfer learning rende più facile addestrare modelli di computer vision su set di dati più piccoli, risparmiando tempo e fatica.

__wf_reserved_inherit
Fig. 3. Una panoramica di come funziona il transfer learning.

Potresti chiederti quali tipi di modelli supportano il transfer learning. Ultralytics YOLO11 è un ottimo esempio di modello di computer vision in grado di farlo. È un modello di rilevamento di oggetti all'avanguardia che viene prima pre-addestrato su un ampio set di dati generale. Successivamente, può essere messo a punto e addestrato in modo personalizzato su un set di dati più piccolo e specializzato per compiti specifici.

Confronto tra paradigmi di apprendimento

Ora che abbiamo parlato di few-shot learning, zero-shot learning e transfer learning, confrontiamoli per vedere come differiscono.

__wf_reserved_inherit
Fig. 4. Principali differenze tra few-shot, zero-shot e transfer learning. Immagine dell'autore.

Il few-shot learning è utile quando si ha solo una piccola quantità di dati etichettati. Rende possibile per un modello di AI imparare da pochi esempi. Lo zero-shot learning, d'altra parte, non richiede alcun dato etichettato. Invece, utilizza descrizioni o contesto per aiutare il sistema a gestire nuovi compiti. Nel frattempo, il transfer learning adotta un approccio diverso utilizzando la conoscenza di modelli pre-addestrati, consentendo loro di adattarsi rapidamente a nuovi compiti con dati aggiuntivi minimi. Ogni metodo ha i suoi punti di forza a seconda del tipo di dati e del compito su cui si sta lavorando.

Applicazioni nel mondo reale di vari paradigmi di apprendimento

Questi paradigmi di apprendimento stanno già facendo la differenza in molti settori, risolvendo problemi complessi con soluzioni innovative. Diamo un'occhiata più da vicino a come possono essere applicati nel mondo reale.

Diagnosi di malattie rare con il few-shot learning

Il few-shot learning rappresenta una svolta per il settore sanitario, specialmente nell'imaging medicale. Può aiutare i medici a diagnosticare malattie rare utilizzando solo pochi esempi o anche descrizioni, senza la necessità di grandi quantità di dati. Questo è particolarmente utile quando i dati sono limitati, come spesso accade, poiché la raccolta di dataset estesi per condizioni rare può essere complessa.

Ad esempio, SHEPHERD utilizza il few-shot learning e i grafi di conoscenza biomedica per diagnosticare disturbi genetici rari. Mappa le informazioni del paziente, come sintomi ed esiti degli esami, su una rete di geni e malattie noti. Questo aiuta a individuare la probabile causa genetica e a trovare casi simili, anche quando i dati sono limitati. 

__wf_reserved_inherit
Fig 5. Il modello Shepherd diagnostica malattie rare utilizzando dati minimi.

Miglioramento del rilevamento di malattie delle piante con lo zero-shot learning

In agricoltura, l'identificazione rapida delle malattie delle piante è essenziale, poiché i ritardi nel rilevamento possono portare a danni diffusi alle colture, riduzione dei raccolti e significative perdite finanziarie. I metodi tradizionali spesso si basano su grandi dataset e sulla conoscenza di esperti, che potrebbero non essere sempre accessibili, specialmente in aree remote o con risorse limitate. È qui che entrano in gioco i progressi nell'IA, come lo zero-shot learning.

Supponiamo che un agricoltore stia coltivando pomodori e patate e noti sintomi come foglie gialle o macchie marroni. Lo zero-shot learning può aiutare a identificare malattie come la peronospora senza richiedere grandi dataset. Utilizzando le descrizioni dei sintomi, il modello può classificare malattie che non ha mai visto prima. Questo approccio è veloce, scalabile e consente agli agricoltori di rilevare una varietà di problemi delle piante. Li aiuta a monitorare la salute delle colture in modo più efficiente, ad agire tempestivamente e a ridurre le perdite.

__wf_reserved_inherit
Fig 6.  Utilizzo dello zero-shot learning per identificare le malattie delle piante.

Veicoli autonomi e transfer learning

I veicoli autonomi spesso devono adattarsi a diversi ambienti per navigare in sicurezza. Il transfer learning li aiuta a utilizzare le conoscenze pregresse per adattarsi rapidamente a nuove condizioni senza dover ricominciare l'addestramento da zero. In combinazione con la computer vision, che aiuta i veicoli a interpretare le informazioni visive, queste tecnologie consentono una navigazione più fluida su diversi terreni e condizioni meteorologiche, rendendo la guida autonoma più efficiente e affidabile.

Un buon esempio di questo in azione è un sistema di gestione del parcheggio che utilizza Ultralytics YOLO11 per monitorare i posti auto. YOLO11, un modello di object detection pre-addestrato, può essere ottimizzato utilizzando il transfer learning per identificare in tempo reale i posti auto vuoti e occupati. Addestrando il modello su un dataset più piccolo di immagini di parcheggi, impara a rilevare con precisione gli spazi liberi, i posti occupati e persino le aree riservate.

__wf_reserved_inherit
Fig 7. Gestione del parcheggio tramite Ultralytics YOLO11.

Integrato con altre tecnologie, questo sistema può guidare i conducenti al posto disponibile più vicino, contribuendo a ridurre i tempi di ricerca e la congestione del traffico. Il transfer learning lo rende possibile basandosi sulle capacità di object detection esistenti di YOLO11, consentendogli di adattarsi alle esigenze specifiche della gestione del parcheggio senza dover ricominciare da zero. Questo approccio consente di risparmiare tempo e risorse, creando al contempo una soluzione altamente efficiente e scalabile che migliora le operazioni di parcheggio e ottimizza l'esperienza complessiva dell'utente.

Tendenze emergenti nei paradigmi di apprendimento

Il futuro dei paradigmi di apprendimento nella computer vision è orientato allo sviluppo di sistemi di Vision AI più intelligenti e sostenibili. In particolare, una tendenza in crescita è l'uso di approcci ibridi che combinano few-shot learning, zero-shot learning e transfer learning. Unendo i punti di forza di questi metodi, i modelli possono apprendere nuove attività con dati minimi e applicare le loro conoscenze in diverse aree.

Un esempio interessante è l'utilizzo di deep embeddings adattati per ottimizzare i modelli utilizzando le conoscenze derivanti da attività precedenti e una piccola quantità di nuovi dati, semplificando il lavoro con dataset limitati. 

Allo stesso modo, l'X-shot learning è progettato per gestire attività con diverse quantità di dati. Utilizza la supervisione debole, in cui i modelli apprendono da etichette limitate o rumorose, e istruzioni chiare per aiutarli ad adattarsi rapidamente, anche con pochi o nessun esempio precedente disponibile. Questi approcci ibridi mostrano come l'integrazione di diversi metodi di apprendimento possa aiutare i sistemi di IA ad affrontare le sfide in modo più efficace.

Punti chiave

Few-shot learning, zero-shot learning e transfer learning affrontano ciascuno sfide specifiche nella computer vision, rendendoli adatti a diverse attività. L'approccio giusto dipende dall'applicazione specifica e dalla quantità di dati disponibili. Ad esempio, il few-shot learning funziona bene con dati limitati, mentre lo zero-shot learning è ottimo per affrontare classi non viste o sconosciute.

Guardando al futuro, è probabile che la combinazione di questi metodi per creare modelli ibridi che integrano visione, linguaggio e audio sarà un obiettivo chiave. Questi progressi mirano a rendere i sistemi di IA più flessibili, efficienti e capaci di affrontare problemi complessi, aprendo nuove possibilità di innovazione nel settore.

Scopri di più sull'IA unendoti alla nostra community e consultando il nostro repository GitHub. Scopri come l'IA nelle auto a guida autonoma e la computer vision in agricoltura stanno rimodellando il futuro. Dai un'occhiata alle opzioni di licenza YOLO disponibili per iniziare!

Costruiamo insieme il futuro
dell'AI!

Inizia il tuo viaggio con il futuro del machine learning

Inizia gratis
Link copiato negli appunti