Glossario

Apprendimento attivo

Scoprite l'apprendimento attivo, un metodo di apprendimento automatico economicamente vantaggioso che aumenta la precisione con un minor numero di etichette. Scoprite come trasforma l'addestramento dell'intelligenza artificiale!

L'apprendimento attivo è una metodologia di formazione specializzata nell'apprendimento automatico (ML) in cui un algoritmo di apprendimento può interrogare interattivamente un utente o un'altra fonte di informazioni (un "oracolo") per etichettare nuovi punti di dati. L'idea di base è che se un modello può scegliere i dati da cui imparare, può ottenere una maggiore precisione con una quantità di dati di addestramento significativamente inferiore. Questo è particolarmente utile nei settori in cui l 'etichettatura dei dati è costosa, richiede tempo o conoscenze specialistiche. Invece di etichettare un intero set di dati in una sola volta, l'apprendimento attivo dà priorità ai campioni più "informativi" per l'etichettatura, rendendo il processo di formazione del modello molto più efficiente.

Come funziona l'apprendimento attivo

Il processo di apprendimento attivo è ciclico e spesso viene descritto come un flusso di lavoro "human-in-the-loop". In genere segue queste fasi:

  1. Formazione iniziale del modello: Un modello, come il rilevatore Ultralytics YOLO11, viene prima addestrato su un piccolo set di dati inizialmente etichettati.
  2. Interrogazione di dati non etichettati: Il modello parzialmente addestrato viene quindi utilizzato per fare previsioni su un ampio pool di dati non etichettati. Sulla base di queste previsioni, il modello seleziona un sottoinsieme di campioni su cui è più "incerto".
  3. Annotazione umana: Questi campioni incerti vengono presentati a un esperto umano (l'oracolo), che fornisce le etichette corrette.
  4. Aumento del set di dati: I nuovi campioni etichettati vengono aggiunti al set di allenamento.
  5. Riqualificazione: Il modello viene riaddestrato sul set di dati aggiornato e più grande. Questo ciclo si ripete finché le prestazioni del modello non raggiungono la soglia desiderata o il budget per l'etichettatura non è esaurito.

La chiave di questo processo sta nella strategia di interrogazione. Le strategie più comuni includono il campionamento dell'incertezza (selezionando le istanze su cui il modello è meno fiducioso), l'interrogazione per comitato (utilizzando più modelli e selezionando le istanze su cui non sono d'accordo) o la stima del cambiamento previsto del modello. Una buona panoramica di queste strategie è contenuta in questa indagine sull'apprendimento attivo.

Applicazioni del mondo reale

L'apprendimento attivo è molto efficace in campi specialistici in cui l'annotazione di esperti rappresenta un collo di bottiglia.

  • Analisi delle immagini mediche: Quando si addestra un'intelligenza artificiale per rilevare malattie come il cancro dalle scansioni mediche, potrebbero essere disponibili milioni di immagini ma solo una quantità limitata di tempo per un radiologo. Invece di fargli etichettare immagini a caso, un sistema di apprendimento attivo può individuare i casi più ambigui o rari da esaminare. In questo modo lo sforzo dell'esperto si concentra dove è più necessario, accelerando lo sviluppo di un modello altamente accurato per compiti come il rilevamento dei tumori cerebrali. La ricerca in quest'area mostra riduzioni significative dello sforzo di etichettatura, come illustrato in studi come questo sulla segmentazione delle immagini biomediche.
  • Guida autonoma: I sistemi di percezione dei veicoli autonomi devono essere addestrati su insiemi di dati vasti e diversi che coprono innumerevoli scenari di guida. L'apprendimento attivo può identificare "casi limite" dai dati di guida raccolti, come un pedone parzialmente nascosto da un ostacolo o condizioni meteorologiche insolite, che il modello di rilevamento degli oggetti attuale fatica a gestire. Dando priorità a queste scene difficili da annotare, gli sviluppatori possono migliorare in modo più efficace la robustezza e la sicurezza del modello.

Apprendimento attivo e concetti correlati

È importante distinguere l'apprendimento attivo da altri paradigmi di apprendimento che utilizzano anche dati non etichettati:

  • Apprendimento semi-supervisionato: Utilizza contemporaneamente dati etichettati e non etichettati durante l'addestramento. A differenza dell'apprendimento attivo, in genere utilizza passivamente tutti i dati non etichettati disponibili, anziché interrogare selettivamente istanze specifiche per ottenere etichette.
  • Apprendimento auto-supervisionato: Apprende le rappresentazioni da dati privi di etichetta creando compiti di pre-test (ad esempio, la previsione di una parte mascherata di un'immagine). Non richiede l'annotazione umana durante la fase di pre-addestramento, mentre l'apprendimento attivo si affida a un oracolo per le etichette. DeepMind ha esplorato ampiamente quest'area.
  • Apprendimento per rinforzo: Apprende per tentativi ed errori attraverso le interazioni con l'ambiente, ricevendo ricompense o penalità per le azioni. Non prevede la richiesta di etichette esplicite come l'apprendimento attivo.
  • Apprendimento federato: Si concentra sull'addestramento di modelli su dispositivi decentralizzati, mantenendo i dati a livello locale, per rispondere principalmente alle preoccupazioni relative alla privacy dei dati. Apprendimento attivo: si concentra sull'acquisizione efficiente delle etichette. Queste tecniche possono talvolta essere combinate.

Strumenti e implementazione

L'implementazione dell'apprendimento attivo spesso comporta l'integrazione di modelli di ML con strumenti di annotazione e la gestione del flusso di dati. Framework come scikit-learn offrono alcune funzionalità, mentre esistono librerie specializzate per compiti specifici. Software di annotazione come Label Studio possono essere integrati nelle pipeline di apprendimento attivo, consentendo agli annotatori di fornire etichette per i campioni interrogati. Una gestione efficace dei dataset in evoluzione e dei modelli addestrati è fondamentale e piattaforme come Ultralytics HUB forniscono un'infrastruttura per organizzare questi asset durante il ciclo di vita dello sviluppo. Esplorate il repository GitHub di Ultralytics per ulteriori informazioni sull'implementazione di tecniche di ML avanzate.

Unitevi alla comunità di Ultralytics

Entrate a far parte del futuro dell'IA. Connettetevi, collaborate e crescete con gli innovatori globali.

Iscriviti ora
Link copiato negli appunti