Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024

L'apprendimento attivo accelera lo sviluppo della computer vision

Abirami Vina

3 minuti di lettura

23 gennaio 2025

Scopri come l'active learning viene utilizzato nella computer vision per ridurre al minimo gli sforzi di annotazione ed esplora le sue applicazioni nel mondo reale in vari settori.

Addestrare un modello di computer vision è molto simile a insegnare a un bambino a riconoscere i colori. Innanzitutto, è necessaria una raccolta di oggetti colorati. Quindi, si guida il bambino a identificare correttamente ogni colore, un compito spesso lungo e ripetitivo.

Proprio come un bambino ha bisogno di molti esempi per imparare, un modello di visione ha bisogno di un ampio set di dati etichettati per riconoscere schemi e oggetti nelle immagini. Tuttavia, l'etichettatura di grandi quantità di dati richiede molto tempo e impegno, per non parlare delle risorse. Tecniche come l'active learning possono aiutare a semplificare questo processo.

L'apprendimento attivo è un processo graduale in cui i dati più importanti di un ampio set di dati vengono selezionati ed etichettati. Il modello apprende da questi dati etichettati, diventando più accurato ed efficace. Concentrarsi solo sui dati più preziosi riduce la quantità di etichettatura necessaria e accelera lo sviluppo del modello.

In questo articolo, daremo un'occhiata a come l'active learning aiuta con l'addestramento del modello, riduce i costi di etichettatura e migliora l'accuratezza complessiva del modello.

Creare set di dati di immagini non è semplice.

I dataset sono la base per i modelli di computer vision e deep learning. Dataset popolari come ImageNet offrono milioni di immagini con diverse categorie di oggetti. Tuttavia, la creazione e la manutenzione di tali enormi volumi di dataset di alta qualità comportano diverse sfide. 

Ad esempio, la raccolta e l'etichettatura dei dati richiedono tempo, risorse e annotatori esperti, rendendo il processo impegnativo a seconda dell'applicazione specifica. Sono necessarie soluzioni innovative e più efficienti per tenere il passo con la crescente domanda di set di dati di immagini, ed è esattamente ciò che l'active learning si propone di risolvere. 

L'apprendimento attivo offre una soluzione perfetta ottimizzando il processo di etichettatura dei dati. Selezionando strategicamente i punti dati più informativi per l'annotazione, l'apprendimento attivo massimizza le prestazioni del modello riducendo al minimo gli sforzi di etichettatura. 

Cos'è l'apprendimento attivo (active learning)?

L'apprendimento attivo è una tecnica iterativa di machine learning in cui il modello seleziona i punti dati più importanti da etichettare da un ampio pool di dati non etichettati. Questi punti dati selezionati vengono etichettati manualmente e aggiunti al set di dati di addestramento. 

Il modello viene quindi riaddestrato sul dataset aggiornato e seleziona il successivo set di punti dati da etichettare. Questo processo si ripete, con il modello che migliora continuamente concentrandosi sui punti dati più informativi. Il ciclo continua fino a quando il modello non raggiunge l'accuratezza desiderata o soddisfa i criteri di etichettatura stabiliti in anticipo.

__wf_reserved_inherit
Fig. 1. Una panoramica dell'apprendimento attivo.

Comprendere come funziona l'active learning

Potresti chiederti come la tecnica di active learning decide quali punti dati necessitano di etichettatura manuale e quali etichettare successivamente. Cerchiamo di capire come funziona l'active learning confrontandolo con lo studio per un test: ci si concentra sugli argomenti su cui non si è sicuri e ci si assicura anche di coprire una varietà di argomenti per essere ben preparati.

Per il set iniziale di processi di selezione dei dati, l'active learning utilizza strategie come l'uncertainty sampling e il diversity-based sampling. L'uncertainty sampling dà priorità ai punti dati in cui il modello è meno sicuro delle sue previsioni, con l'obiettivo di migliorare l'accuratezza nei casi difficili. Il diversity-based sampling seleziona punti dati che coprono un'ampia gamma di caratteristiche, garantendo che il modello si generalizzi bene a dati non visti esponendolo a esempi diversi.

__wf_reserved_inherit
Fig. 2. Campionamento dell'incertezza (a sinistra) e campionamento basato sulla diversità (a destra).

Dopo la selezione iniziale dei dati, l'apprendimento attivo utilizza due approcci principali per l'etichettatura: il campionamento basato su pool e il campionamento basato su flusso, che sono simili al modo in cui un insegnante aiuta uno studente a concentrarsi su ciò che è più importante. 

Nel campionamento basato su pool, il modello esamina un ampio pool di dati non etichettati e seleziona gli esempi più difficili o informativi da etichettare, proprio come uno studente che dà la priorità alle flashcard che trova più difficili. Per quanto riguarda il campionamento basato su stream, il modello elabora i dati man mano che arrivano, decidendo se etichettarli o saltarli, in modo simile a uno studente che chiede aiuto solo quando è bloccato. In entrambi i casi, i dati etichettati vengono aggiunti al set di training e il modello si riaddestra, migliorando costantemente a ogni iterazione.

Esplorazione delle applicazioni dell'apprendimento attivo

L'apprendimento attivo svolge un ruolo chiave nelle applicazioni di computer vision, come l'imaging medicale e la guida autonoma, migliorando l'accuratezza del modello e semplificando il processo di etichettatura dei dati. Un esempio interessante è rappresentato dai modelli di computer vision utilizzati nelle auto a guida autonoma per rilevare pedoni o oggetti in condizioni di scarsa illuminazione o nebbia. L'apprendimento attivo può migliorare l'accuratezza concentrandosi su scenari di guida diversi e impegnativi. 

Nello specifico, l'active learning può essere utilizzato per identificare dati o frame incerti da tali scenari per l'etichettatura selettiva. L'aggiunta di questi esempi etichettati al set di addestramento consente al modello di riconoscere meglio i pedoni e gli oggetti in ambienti difficili, ad esempio durante condizioni meteorologiche avverse o alla guida notturna.

Ad esempio, NVIDIA ha utilizzato l'active learning per migliorare il rilevamento dei pedoni di notte nei suoi modelli di guida autonoma. Selezionando strategicamente i dati più informativi per l'addestramento, in particolare in scenari difficili, le prestazioni del modello aumentano notevolmente.

__wf_reserved_inherit
Fig 3. Rilevamento di un pedone con ombrello tramite active learning.

L'apprendimento attivo può ridurre i costi di etichettatura

Un altro aspetto chiave dell'apprendimento attivo è il suo potenziale per ridurre i costi di etichettatura. Lo fa concentrandosi solo sui punti dati più importanti, invece di richiedere annotazioni per l'intero set di dati. Questo approccio mirato consente di risparmiare tempo, sforzi e denaro. Concentrandosi su campioni incerti o diversi, l'apprendimento attivo riduce il numero di annotazioni necessarie, pur mantenendo un'elevata accuratezza del modello.

Infatti, la ricerca mostra che l'apprendimento attivo può ridurre i costi di etichettatura del 40-60% senza sacrificare le prestazioni. Questo è particolarmente utile in settori come la sanità e la produzione, dove l'etichettatura dei dati è costosa. Semplificando il processo di annotazione, l'apprendimento attivo aiuta le aziende a sviluppare modelli più velocemente e a implementarli in modo più efficiente, mantenendo al contempo l'accuratezza.

Vantaggi dell'active learning

Ecco alcuni degli altri vantaggi chiave che l'apprendimento attivo può offrire:

  • Affrontare lo squilibrio di classe: L'active learning può aiutare ad affrontare i problemi di squilibrio di classe etichettando le istanze dalle classi di dati minoritarie. Il modello può funzionare meglio in scenari rari con dati limitati.
  • Cicli di sviluppo più rapidi: Etichettare meno dati significa indirettamente accelerare il processo di sviluppo dei modelli di machine learning e computer vision, consentendo di dedicare più tempo e risorse a ulteriori iterazioni ed esperimenti.
  • Adattabilità: Può migliorare continuamente i dati di addestramento iterando su campioni incerti o di edge-case, rendendolo adatto a dataset dinamici o in evoluzione.

L'apprendimento attivo e l'AutoML possono collaborare

L'Automated Machine Learning (AutoML) si concentra sull'automazione delle attività iterative e dispendiose in termini di tempo coinvolte nella creazione e nella distribuzione di modelli di machine learning. Semplifica i flussi di lavoro di machine learning automatizzando attività come la selezione del modello e la valutazione delle prestazioni per ridurre la necessità di interventi manuali. 

Se integrato con l'active learning, AutoML può accelerare e ottimizzare il ciclo di vita dello sviluppo del modello. Il componente di active learning seleziona strategicamente i punti dati più informativi per l'etichettatura, mentre AutoML perfeziona il modello automatizzando la scelta dell'architettura, dei parametri e della messa a punto.

__wf_reserved_inherit
Fig. 4. Workflow AutoML.

Comprendiamo questa combinazione di tecnologie con un esempio. 

Supponiamo che tu stia cercando di rilevare condizioni rare nell'imaging medicale (un caso d'uso in cui i set di dati etichettati sono limitati e costosi da ottenere). L'apprendimento attivo può identificare e selezionare dati incerti, come sottili cambiamenti nelle immagini a raggi X, che il modello non riesce a classificare. Quindi, i dati incerti possono essere considerati prioritari per l'annotazione manuale al fine di migliorare la comprensione del modello. 

Con i dati annotati, AutoML può ottimizzare il modello esplorando varie architetture, iperparametri e altre tecniche di data augmentation. Il processo iterativo accelera lo sviluppo di modelli di visione affidabili come Ultralytics YOLO11 che aiutano i professionisti sanitari a formulare diagnosi accurate.

Sfide dell'apprendimento attivo

L'apprendimento attivo e le sue tecniche offrono numerosi vantaggi, ma ci sono alcune considerazioni da tenere a mente quando si implementano queste strategie:

  • Selezione della strategia di interrogazione: L'apprendimento attivo coinvolge molte tecniche e la scelta del metodo migliore influisce in modo significativo sull'efficacia del modello. La selezione di una strategia inappropriata può ridurre le prestazioni del modello per una specifica applicazione.
  • Costi di retraining: La natura iterativa dell'apprendimento attivo richiede costose risorse computazionali, specialmente per set di dati di grandi dimensioni. Il modello viene riaddestrato dopo ogni round di etichettatura, aumentando la sua complessità.
  • Qualità iniziale del modello: L'efficacia dell'apprendimento attivo dipende dalla qualità del modello iniziale. Un modello iniziale con prestazioni scadenti potrebbe non identificare accuratamente i punti dati informativi, portando a richieste di etichette scadenti e a una riduzione delle prestazioni complessive.

La strada da percorrere per l'active learning e l'AutoML

Con i recenti progressi nell'IA e nella computer vision, l'active learning è destinato ad affrontare sfide più complesse e a semplificare i flussi di lavoro di machine learning. La combinazione dell'active learning con tecniche come il federated learning e il self-supervised learning può migliorare ulteriormente l'efficienza e la scalabilità dei modelli di vision. 

L'apprendimento federato consente di addestrare un modello su più dispositivi o server con un framework distribuito senza richiedere che i dati lascino la loro posizione originale. Si pensi a settori come quello sanitario, dove la privacy dei dati è importante: l'apprendimento federato rende possibile l'addestramento direttamente su dati locali sensibili, mantenendoli al sicuro. Invece di condividere i dati grezzi, vengono condivisi solo gli aggiornamenti o le informazioni del modello, garantendo che le informazioni private rimangano protette e contribuendo al contempo al processo di addestramento.

Nel frattempo, l'apprendimento auto-supervisionato aiuta a ridurre la necessità di dati etichettati pre-addestrando i modelli su dati non etichettati. Questo processo crea una solida base per il modello. L'apprendimento attivo può quindi basarsi su questo identificando e selezionando i punti dati più importanti per l'annotazione umana, affinando ulteriormente il modello.

Dall'apprendimento attivo all'impatto attivo

L'apprendimento attivo fornisce un modo pratico per affrontare le principali sfide della computer vision, come l'alto costo dell'annotazione dei dati e la necessità di modelli più accurati. Concentrandosi sull'etichettatura solo dei punti dati più preziosi, riduce lo sforzo richiesto agli esseri umani, aumentando al contempo le prestazioni del modello.

Se combinato con tecnologie come AutoML, l'active learning semplifica lo sviluppo del modello automatizzando attività che richiedono molto tempo. Con il progresso continuo, l'active learning è destinato a diventare uno strumento essenziale per la costruzione di sistemi di visione artificiale più intelligenti ed efficienti.

Esplora il nostro repository GitHub e unisciti alla nostra community per saperne di più sull'AI e sui modelli di computer vision. Scopri altre applicazioni della computer vision nel manufacturing e nell'healthcare nelle nostre pagine delle soluzioni. Puoi anche consultare le nostre opzioni di licenza per iniziare oggi stesso il tuo percorso nella Vision AI.

Costruiamo insieme il futuro
dell'AI!

Inizia il tuo viaggio con il futuro del machine learning

Inizia gratis
Link copiato negli appunti