Vision AI

L'active learning accelera lo sviluppo della computer vision

Scopri come l'active learning viene utilizzato nella computer vision per ridurre al minimo gli sforzi di annotazione ed esplora le sue applicazioni nel mondo reale in vari settori.

ABAbirami Vina

3 min readJanuary 23, 2025

L'active learning accelera lo sviluppo della computer vision

Addestrare un modello di computer vision è molto simile a insegnare a un bambino a riconoscere i colori. Per prima cosa, avrai bisogno di una raccolta di oggetti colorati. Dopodiché, guiderai il bambino a identificare correttamente ogni colore, un compito che spesso richiede molto tempo ed è ripetitivo.

Proprio come un bambino ha bisogno di molti esempi per imparare, un modello di visione ha bisogno di un ampio set di dati etichettati per riconoscere pattern e oggetti nelle immagini. Tuttavia, etichettare grandi quantità di dati richiede molto tempo e impegno, per non parlare delle risorse. Tecniche come l'apprendimento attivo possono aiutare a semplificare questo processo.

L'apprendimento attivo è un processo graduale in cui i dati più importanti vengono selezionati da un ampio dataset ed etichettati. Il modello impara da questi dati etichettati, diventando più accurato ed efficace. Concentrarsi solo sui dati più preziosi riduce la quantità di etichettatura necessaria e accelera lo sviluppo del modello.

In questo articolo, vedremo come l'apprendimento attivo aiuta nell'addestramento dei modelli, riduce i costi di etichettatura e migliora l'accuratezza complessiva del modello.

Link to this sectionI dataset di immagini non sono facili da costruire#

I dataset sono le fondamenta per i modelli di computer vision e deep learning. Dataset popolari come ImageNet offrono milioni di immagini con diverse categorie di oggetti. Tuttavia, creare e mantenere volumi così enormi di dataset di alta qualità comporta diverse sfide.

Ad esempio, raccogliere ed etichettare i dati richiede tempo, risorse e annotatori qualificati, il che rende il processo impegnativo a seconda dell'applicazione specifica. Sono necessarie soluzioni innovative e più efficienti per stare al passo con la crescente domanda di dataset di immagini, ed è esattamente ciò che l'active learning mira a risolvere.

L'apprendimento attivo offre una soluzione perfetta ottimizzando il processo di etichettatura dei dati. Selezionando strategicamente i punti dati più informativi per l'annotazione, l'apprendimento attivo massimizza le prestazioni del modello riducendo al minimo gli sforzi di etichettatura.

Link to this sectionCos'è l'apprendimento attivo?#

L'apprendimento attivo è una tecnica iterativa di machine learning in cui il modello seleziona i punti dati più importanti da etichettare da un ampio pool di dati non etichettati. Questi punti dati selezionati vengono etichettati manualmente e aggiunti al dataset di addestramento.

Il modello viene quindi riaddestrato sul dataset aggiornato e seleziona il set successivo di punti dati da etichettare. Questo processo si ripete, con il modello che migliora continuamente concentrandosi sui punti dati più informativi. Il ciclo continua finché il modello non raggiunge l'accuratezza desiderata o non soddisfa i criteri di etichettatura stabiliti in anticipo.

Una panoramica dell'active learning

Fig 1. Una panoramica dell'apprendimento attivo.

Link to this sectionCapire come funziona l'apprendimento attivo#

Forse ti starai chiedendo come la tecnica di apprendimento attivo decida quali punti dati necessitano di etichettatura manuale e quali etichettare successivamente. Capiamo come funziona l'apprendimento attivo paragonandolo allo studio per un esame: ti concentri sugli argomenti di cui non sei sicuro e ti assicuri anche di coprire una varietà di materie per essere ben preparato.

Per il set iniziale di processi di selezione dei dati, l'apprendimento attivo utilizza strategie come il campionamento per incertezza (uncertainty sampling) e il campionamento basato sulla diversità (diversity-based sampling). Il campionamento per incertezza dà priorità ai punti dati in cui il modello è meno sicuro delle proprie previsioni, mirando a migliorare l'accuratezza nei casi complessi. Il campionamento basato sulla diversità seleziona punti dati che coprono un'ampia gamma di caratteristiche, garantendo che il modello si generalizzi bene a dati non visti esponendolo a esempi diversificati.

Campionamento per incertezza a sinistra e campionamento basato sulla diversità a destra

Fig 2. Campionamento per incertezza (a sinistra) e campionamento basato sulla diversità (a destra).

Dopo la selezione iniziale dei dati, l'apprendimento attivo utilizza due approcci principali per l'etichettatura: campionamento basato su pool (pool-based sampling) e campionamento basato su stream (stream-based sampling). Sono simili a come un insegnante aiuta uno studente a concentrarsi su ciò che è più importante.

Nel campionamento basato su pool, il modello analizza un ampio pool di dati non etichettati e seleziona gli esempi più impegnativi o informativi da etichettare, proprio come uno studente che dà la priorità alle flashcard che trova più difficili. Per quanto riguarda il campionamento basato su stream, il modello elabora i dati man mano che arrivano, decidendo se etichettarli o saltarli, simile a uno studente che chiede aiuto solo quando è bloccato. In entrambi i casi, i dati etichettati vengono aggiunti al set di addestramento e il modello si riaddestra, migliorando costantemente a ogni iterazione.

Link to this sectionEsplorare le applicazioni dell'apprendimento attivo#

L'apprendimento attivo gioca un ruolo chiave nelle applicazioni di computer vision, come l'imaging medico e la guida autonoma, migliorando l'accuratezza del modello e snellendo il processo di etichettatura dei dati. Un esempio interessante di ciò sono i modelli di computer vision utilizzati nelle auto a guida autonoma per rilevare pedoni o oggetti in condizioni di scarsa illuminazione o nebbia. L'apprendimento attivo può migliorare l'accuratezza concentrandosi su scenari di guida diversificati e impegnativi.

Nello specifico, l'apprendimento attivo può essere utilizzato per identificare dati incerti o frame da tali scenari per un'etichettatura selettiva. L'aggiunta di questi esempi etichettati al set di addestramento migliora la capacità del modello di riconoscere pedoni e oggetti in ambienti difficili, come durante condizioni meteorologiche avverse o la guida notturna.

Ad esempio, NVIDIA ha utilizzato l'apprendimento attivo per migliorare il rilevamento dei pedoni di notte nei suoi modelli di guida autonoma. Selezionando strategicamente i dati più informativi per l'addestramento, in particolare negli scenari complessi, le prestazioni del modello aumentano notevolmente.

Rilevamento di un pedone con un ombrello tramite active learning

Fig 3. Rilevamento di un pedone con ombrello tramite l'apprendimento attivo.

Link to this sectionL'apprendimento attivo può ridurre i costi di etichettatura#

Un altro aspetto chiave dell'apprendimento attivo è il suo potenziale nel ridurre i costi di etichettatura. Lo fa concentrandosi solo sui punti dati più importanti, invece di richiedere annotazioni per l'intero dataset. Questo approccio mirato fa risparmiare tempo, impegno e denaro. Concentrandosi su campioni incerti o diversificati, l'apprendimento attivo riduce il numero di annotazioni necessarie mantenendo al contempo un'elevata accuratezza del modello.

Infatti, la ricerca mostra che l'apprendimento attivo può ridurre i costi di etichettatura del 40-60% senza sacrificare le prestazioni. Questo è particolarmente utile in settori come la sanità e la produzione, dove l'etichettatura dei dati è costosa. Semplificando il processo di annotazione, l'apprendimento attivo aiuta le aziende a sviluppare modelli più velocemente e a distribuirli in modo più efficiente, mantenendo l'accuratezza.

Link to this sectionVantaggi dell'apprendimento attivo#

Ecco alcuni degli altri principali vantaggi che l'apprendimento attivo può offrire:

Gestione dello sbilanciamento delle classi: L'apprendimento attivo può aiutare ad affrontare i problemi di sbilanciamento delle classi etichettando istanze dalle classi di dati minoritarie. Il modello può avere prestazioni migliori su scenari rari con dati limitati.
Cicli di sviluppo più rapidi: Etichettare meno dati significa indirettamente accelerare il processo di sviluppo dei modelli di machine learning e computer vision, lasciando più tempo e risorse per ulteriori iterazioni ed esperimenti.
Adattabilità: Può migliorare continuamente i dati di addestramento iterando su campioni incerti o casi limite, rendendolo adatto a dataset dinamici o in evoluzione.

Link to this sectionL'apprendimento attivo e l'AutoML possono collaborare#

L'Automated Machine Learning (AutoML) si concentra sull'automazione dei compiti iterativi e dispendiosi in termini di tempo coinvolti nella creazione e distribuzione di modelli di machine learning. Semplifica i flussi di lavoro di machine learning automatizzando compiti come la selezione del modello e la valutazione delle prestazioni per ridurre la necessità di intervento manuale.

Se integrato con l'apprendimento attivo, l'AutoML può accelerare e ottimizzare il ciclo di vita dello sviluppo del modello. Il componente di apprendimento attivo seleziona strategicamente i punti dati più informativi per l'etichettatura, mentre l'AutoML affina il modello automatizzando la scelta dell'architettura, dei parametri e della messa a punto.

Flusso di lavoro AutoML

Fig 4. Flusso di lavoro AutoML.

Capiamo questa combinazione di tecnologie con un esempio.

Supponiamo che tu stia cercando di rilevare condizioni rare nell'imaging medico (un caso d'uso in cui i dataset etichettati sono limitati e costosi da ottenere). L'apprendimento attivo può identificare e selezionare dati incerti, come sottili cambiamenti nelle radiografie, che il modello non riesce a classificare. Quindi, i dati incerti possono avere la priorità per l'annotazione manuale per migliorare la comprensione del modello.

Con i dati annotati, l'AutoML può ottimizzare il modello esplorando varie architetture, iperparametri e altre tecniche di aumento dei dati. Il processo iterativo accelera lo sviluppo di modelli di visione affidabili come Ultralytics YOLO11 che aiutano i professionisti sanitari a formulare diagnosi accurate.

Link to this sectionSfide dell'apprendimento attivo#

L'apprendimento attivo e le sue tecniche offrono numerosi vantaggi, ma ci sono alcune considerazioni da tenere a mente durante l'implementazione di queste strategie:

Selezione della strategia di query: L'apprendimento attivo coinvolge molte tecniche e la scelta del metodo migliore influisce significativamente sull'efficacia del modello. Selezionare una strategia inappropriata può ridurre le prestazioni del modello per un'applicazione specifica.
Costi di riaddestramento: La natura iterativa dell'apprendimento attivo richiede costose risorse computazionali, specialmente per dataset di grandi dimensioni. Il modello viene riaddestrato dopo ogni round di etichettatura, aumentandone la complessità.
Qualità del modello iniziale: L'efficacia dell'apprendimento attivo dipende dalla qualità del modello iniziale. Un modello iniziale con scarse prestazioni potrebbe non identificare accuratamente i punti dati informativi, portando a richieste di etichettatura scadenti e prestazioni complessive ridotte.

Link to this sectionLa strada da percorrere per l'apprendimento attivo e l'AutoML#

Con i recenti progressi nell'IA e nella computer vision, l'apprendimento attivo è pronto ad affrontare sfide più complesse e a snellire i flussi di lavoro di machine learning. Combinare l'apprendimento attivo con tecniche come l'apprendimento federato (federated learning) e l'apprendimento auto-supervisionato (self-supervised learning) può migliorare ulteriormente l'efficienza e la scalabilità dei modelli di visione.

L'apprendimento federato consente a un modello di essere addestrato su più dispositivi o server con un framework distribuito senza richiedere che i dati lascino la loro posizione originale. Considera settori come la sanità, dove la privacy dei dati è importante: l'apprendimento federato rende possibile l'addestramento direttamente su dati locali sensibili mantenendoli al sicuro. Invece di condividere dati grezzi, vengono condivisi solo aggiornamenti del modello o intuizioni, assicurando che le informazioni private rimangano protette pur contribuendo al processo di addestramento.

Nel frattempo, l'apprendimento auto-supervisionato aiuta a ridurre la necessità di dati etichettati pre-addestrando i modelli su dati non etichettati. Questo processo crea una base solida per il modello. L'apprendimento attivo può quindi basarsi su questo identificando e selezionando i punti dati più importanti per l'annotazione umana, perfezionando ulteriormente il modello.

Link to this sectionDall'apprendimento attivo all'impatto attivo#

L'apprendimento attivo fornisce un modo pratico per affrontare le principali sfide nella computer vision, come l'alto costo dell'annotazione dei dati e la necessità di modelli più accurati. Concentrandosi sull'etichettatura dei soli punti dati più preziosi, riduce lo sforzo richiesto agli esseri umani aumentando al contempo le prestazioni del modello.

Se combinato con tecnologie come l'AutoML, l'apprendimento attivo snellisce lo sviluppo dei modelli automatizzando i compiti dispendiosi in termini di tempo. Con il proseguire dei progressi, l'apprendimento attivo è destinato a diventare uno strumento essenziale per costruire sistemi di computer vision più intelligenti ed efficienti.

Esplora il nostro repository GitHub e unisciti alla nostra community per saperne di più sui modelli di IA e computer vision. Scopri altre applicazioni della computer vision nella produzione e nell'assistenza sanitaria sulle nostre pagine delle soluzioni. Puoi anche dare un'occhiata alle nostre opzioni di licenza per iniziare oggi stesso il tuo viaggio nell'IA applicata alla visione.

Explore solutions

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

L'active learning accelera lo sviluppo della computer vision

Link to this sectionI dataset di immagini non sono facili da costruire#

Link to this sectionCos'è l'apprendimento attivo?#

Link to this sectionCapire come funziona l'apprendimento attivo#

Link to this sectionEsplorare le applicazioni dell'apprendimento attivo#

Link to this sectionL'apprendimento attivo può ridurre i costi di etichettatura#

Link to this sectionVantaggi dell'apprendimento attivo#

Link to this sectionL'apprendimento attivo e l'AutoML possono collaborare#

Link to this sectionSfide dell'apprendimento attivo#

Link to this sectionLa strada da percorrere per l'apprendimento attivo e l'AutoML#

Link to this sectionDall'apprendimento attivo all'impatto attivo#

Explore solutions

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

Costruiamo insieme il futuro dell'AI!