Facendo clic su "Accetta tutti i cookie", l'utente accetta la memorizzazione dei cookie sul proprio dispositivo per migliorare la navigazione del sito, analizzarne l'utilizzo e contribuire alle nostre iniziative di marketing. Per saperne di più
Impostazioni dei cookie
Facendo clic su "Accetta tutti i cookie", l'utente accetta la memorizzazione dei cookie sul proprio dispositivo per migliorare la navigazione del sito, analizzarne l'utilizzo e contribuire alle nostre iniziative di marketing. Per saperne di più
Scoprite come l'apprendimento attivo viene utilizzato nella computer vision per ridurre al minimo gli sforzi di annotazione ed esplorate le sue applicazioni reali in vari settori.
L'addestramento di un modello di visione computerizzata è molto simile all'insegnamento dei colori a un bambino. Innanzitutto, è necessario disporre di una collezione di oggetti colorati. Poi si deve guidare il bambino a identificare correttamente ogni colore, un compito che spesso richiede tempo e ripetitività.
Proprio come un bambino ha bisogno di molti esempi per imparare, un modello di visione ha bisogno di un ampio insieme di dati etichettati per riconoscere modelli e oggetti nelle immagini. Tuttavia, l'etichettatura di grandi quantità di dati richiede molto tempo e impegno, per non parlare delle risorse. Tecniche come l'apprendimento attivo possono aiutare a semplificare questo processo.
L'apprendimento attivo è un processo graduale in cui i dati più importanti di un grande insieme di dati vengono selezionati ed etichettati. Il modello impara da questi dati etichettati, rendendolo più preciso ed efficace. Concentrarsi solo sui dati più importanti riduce la quantità di etichette necessarie e accelera lo sviluppo del modello.
In questo articolo vedremo come l'apprendimento attivo aiuta la formazione del modello, riduce i costi di etichettatura e migliora l'accuratezza complessiva del modello.
I dataset di immagini non sono facili da costruire
I dataset sono alla base dei modelli di computer vision e deep-learning. Dataset popolari come ImageNet offrono milioni di immagini con diverse categorie di oggetti. Tuttavia, la creazione e la manutenzione di questi enormi volumi di set di dati di alta qualità comporta diverse sfide.
Ad esempio, la raccolta e l'etichettatura dei dati richiede tempo, risorse e annotatori qualificati, rendendo il processo impegnativo a seconda dell'applicazione specifica. Sono necessarie soluzioni innovative e più efficienti per tenere il passo con la crescente domanda di set di dati di immagini, ed è proprio questo l'obiettivo dell'apprendimento attivo.
L'apprendimento attivo offre una soluzione perfetta ottimizzando il processo di etichettatura dei dati. Selezionando strategicamente i punti dati più informativi per l'annotazione, l'apprendimento attivo massimizza le prestazioni del modello riducendo al minimo gli sforzi di etichettatura.
Che cos'è l'apprendimento attivo?
L'apprendimento attivo è una tecnica di apprendimento automatico iterativo in cui il modello sceglie i punti di dati più importanti da etichettare da un ampio pool di dati non etichettati. Questi punti di dati selezionati vengono etichettati manualmente e aggiunti al set di dati di addestramento.
Il modello viene quindi riqualificato sul set di dati aggiornato e seleziona la serie successiva di punti dati da etichettare. Questo processo si ripete, con il modello che migliora continuamente concentrandosi sui punti dati più informativi. Il ciclo continua finché il modello non raggiunge l'accuratezza desiderata o soddisfa i criteri di etichettatura stabiliti in precedenza.
Figura 1. Una panoramica dell'apprendimento attivo.
Capire come funziona l'apprendimento attivo
Ci si potrebbe chiedere come la tecnica di apprendimento attivo decida quali punti di dati debbano essere etichettati manualmente e quali debbano essere etichettati successivamente. Per capire come funziona l'apprendimento attivo, facciamo un paragone con lo studio per un esame: ci si concentra sugli argomenti di cui non si è sicuri e si fa in modo di coprire una varietà di argomenti per essere ben preparati.
Per la serie iniziale di processi di selezione dei dati, l'apprendimento attivo utilizza strategie come il campionamento per incertezza e il campionamento basato sulla diversità. Il campionamento per incertezza dà la priorità ai punti di dati in cui il modello è meno sicuro delle sue previsioni, con l'obiettivo di migliorare l'accuratezza nei casi difficili. Il campionamento basato sulla diversità seleziona i punti di dati che coprono un'ampia gamma di caratteristiche, assicurando che il modello si generalizzi bene ai dati non visti esponendolo a esempi diversi.
Figura 2. Campionamento con incertezza (a sinistra) e campionamento basato sulla diversità (a destra).
Dopo la selezione iniziale dei dati, l'apprendimento attivo utilizza due approcci principali per l'etichettatura: il campionamento basato sul pool e il campionamento basato sul flusso, simili a come un insegnante aiuta uno studente a concentrarsi su ciò che è più importante.
Nel campionamento basato sul pool, il modello analizza un ampio pool di dati non etichettati e seleziona gli esempi più impegnativi o informativi da etichettare, proprio come uno studente che dà priorità alle flashcard che trova più difficili. Per quanto riguarda il campionamento basato sul flusso, il modello elabora i dati man mano che arrivano, decidendo se etichettarli o saltarli, come uno studente che chiede aiuto solo quando è bloccato. In entrambi i casi, i dati etichettati vengono aggiunti al set di addestramento e il modello si riaddestra, migliorando costantemente a ogni iterazione.
Esplorare le applicazioni dell'apprendimento attivo
L'apprendimento attivo svolge un ruolo fondamentale nelle applicazioni di computer vision, come l'imaging medico e la guida autonoma, migliorando l'accuratezza dei modelli e semplificando il processo di etichettatura dei dati. Un esempio interessante è rappresentato dai modelli di computer vision utilizzati nelle auto a guida autonoma per rilevare pedoni o oggetti in condizioni di scarsa illuminazione o nebbia. L'apprendimento attivo può migliorare l'accuratezza concentrandosi su scenari di guida diversi e impegnativi.
In particolare, l'apprendimento attivo può essere utilizzato per identificare i dati incerti o i fotogrammi di tali scenari per un'etichettatura selettiva. L'aggiunta di questi esempi etichettati al set di addestramento consente al modello di riconoscere meglio i pedoni e gli oggetti in ambienti difficili, ad esempio in condizioni meteorologiche avverse o durante la guida notturna.
Ad esempio, NVIDIA ha utilizzato l'apprendimento attivo per migliorare il rilevamento dei pedoni di notte nei suoi modelli di guida autonoma. Selezionando strategicamente i dati più informativi per l'addestramento, in particolare in scenari difficili, le prestazioni del modello aumentano in modo sostanziale.
Figura 3. Rilevamento di un pedone con ombrello mediante apprendimento attivo.
L'apprendimento attivo può ridurre i costi di etichettatura
Un altro aspetto chiave dell'apprendimento attivo è il suo potenziale di riduzione dei costi di etichettatura. Questo avviene concentrandosi solo sui punti di dati più importanti, invece di richiedere annotazioni per l'intero set di dati. Questo approccio mirato consente di risparmiare tempo, fatica e denaro. Concentrandosi su campioni incerti o diversi, l'apprendimento attivo riduce il numero di annotazioni necessarie, pur mantenendo un'elevata precisione del modello.
Le ricerche dimostrano infatti che l'apprendimento attivo può ridurre i costi di etichettatura del 40-60% senza sacrificare le prestazioni. Ciò è particolarmente utile in settori come quello sanitario e manifatturiero, dove l'etichettatura dei dati è costosa. Semplificando il processo di annotazione, l'apprendimento attivo aiuta le aziende a sviluppare più rapidamente i modelli e a distribuirli in modo più efficiente, pur mantenendo la precisione.
Vantaggi dell'apprendimento attivo
Ecco alcuni degli altri vantaggi principali che l'apprendimento attivo può offrire:
Affrontare lo sbilanciamento delle classi: L'apprendimento attivo può aiutare a risolvere i problemi di sbilanciamento delle classi etichettando le istanze provenienti da classi di dati minoritarie. Il modello può funzionare meglio in scenari rari con dati limitati.
Cicli di sviluppo più rapidi: Etichettare meno dati significa accelerare il processo di sviluppo dei modelli di apprendimento automatico e di visione computerizzata, consentendo di avere più tempo e risorse per ulteriori iterazioni ed esperimenti.
Adattabilità: È in grado di migliorare continuamente i dati di addestramento iterando su campioni incerti o con casi limite, il che lo rende adatto a insiemi di dati dinamici o in evoluzione.
Apprendimento attivo e AutoML possono lavorare insieme
L'Automated Machine Learning (AutoML) si concentra sull'automazione delle attività iterative e dispendiose in termini di tempo coinvolte nella costruzione e nella distribuzione di modelli di apprendimento automatico. Semplifica i flussi di lavoro dell'apprendimento automatico automatizzando attività come la selezione dei modelli e la valutazione delle prestazioni per ridurre la necessità di sforzi manuali.
Se integrato con l'apprendimento attivo, AutoML può accelerare e ottimizzare il ciclo di vita del modello. La componente di apprendimento attivo seleziona strategicamente i punti dati più informativi per l'etichettatura, mentre AutoML perfeziona il modello automatizzando la scelta dell'architettura, dei parametri e della messa a punto.
Vediamo di capire questa combinazione di tecnologie con un esempio.
Supponiamo che si stia cercando di individuare condizioni rare nella diagnostica per immagini (un caso d'uso in cui i set di dati etichettati sono limitati e costosi da ottenere). L'apprendimento attivo può identificare e selezionare i dati incerti, come i sottili cambiamenti nelle immagini a raggi X, che il modello non riesce a classificare. In seguito, i dati incerti possono essere classificati come prioritari per l'annotazione manuale, al fine di migliorare la comprensione del modello.
Con i dati annotati, AutoML può ottimizzare il modello esplorando varie architetture, iperparametri e altre tecniche di incremento dei dati. Il processo iterativo accelera lo sviluppo di modelli di visione affidabili come Ultralytics YOLO11, che aiutano i professionisti della sanità a fare diagnosi accurate.
Le sfide dell'apprendimento attivo
L'apprendimento attivo e le sue tecniche offrono numerosi vantaggi, ma ci sono alcune considerazioni da tenere a mente quando si implementano queste strategie:
Selezione della strategia di interrogazione: L'apprendimento attivo coinvolge molte tecniche e la scelta del metodo migliore ha un impatto significativo sull'efficacia del modello. La scelta di una strategia inadeguata può ridurre le prestazioni del modello per un'applicazione specifica.
Costi di riqualificazione: La natura iterativa dell'apprendimento attivo richiede risorse computazionali costose, soprattutto per i dataset di grandi dimensioni. Il modello viene riqualificato dopo ogni ciclo di etichettatura, aumentando la sua complessità.
Qualità del modello iniziale: L'efficacia dell'apprendimento attivo dipende dalla qualità del modello iniziale. Un modello iniziale poco performante potrebbe non identificare con precisione i punti di dati informativi, portando a richieste di etichette inferiori alla norma e a prestazioni complessive ridotte.
La strada da percorrere per l'apprendimento attivo e l'AutoML
Con i recenti progressi nell'IA e nella computer vision, l'apprendimento attivo è destinato ad affrontare sfide più complesse e a semplificare i flussi di lavoro dell'apprendimento automatico. La combinazione dell'apprendimento attivo con tecniche come l'apprendimento federato e l'apprendimento auto-supervisionato può migliorare ulteriormente l'efficienza e la scalabilità dei modelli di visione.
L'apprendimento federato consente di addestrare un modello su più dispositivi o server con un framework distribuito, senza che i dati debbano lasciare la loro posizione originale. Se si considerano settori come quello sanitario, in cui la privacy dei dati è importante, l'apprendimento federato consente di addestrare direttamente i dati sensibili locali mantenendoli al sicuro. Invece di condividere i dati grezzi, vengono condivisi solo gli aggiornamenti del modello o le intuizioni, garantendo che le informazioni private rimangano protette pur contribuendo al processo di formazione.
Nel frattempo, l'apprendimento auto-supervisionato aiuta a ridurre la necessità di dati etichettati, preaddestrando i modelli su dati non etichettati. Questo processo crea una base solida per il modello. L'apprendimento attivo può poi basarsi su questa base, identificando e selezionando i punti di dati più importanti per l'annotazione umana, affinando ulteriormente il modello.
Dall'apprendimento attivo all'impatto attivo
L'apprendimento attivo offre un modo pratico per affrontare le principali sfide della computer vision, come l'elevato costo dell'annotazione dei dati e la necessità di modelli più accurati. Concentrandosi sull'etichettatura dei soli punti dati più importanti, riduce lo sforzo richiesto all'uomo e aumenta le prestazioni del modello.
Se combinato con tecnologie come AutoML, l'apprendimento attivo semplifica lo sviluppo dei modelli automatizzando le attività che richiedono molto tempo. Con i continui progressi, l'apprendimento attivo è destinato a diventare uno strumento essenziale per la creazione di sistemi di visione artificiale più intelligenti ed efficienti.
Esplorate il nostro repository GitHub e unitevi alla nostra comunità per saperne di più sull'IA e sui modelli di computer vision. Scoprite altre applicazioni della computer vision nel settore manifatturiero e sanitario nelle nostre pagine dedicate alle soluzioni. Potete anche controllare le nostre opzioni di licenza per iniziare oggi stesso il vostro viaggio nella Vision AI.