Scopri come l'apprendimento auto-supervisionato sfrutta i dati non etichettati per un addestramento efficiente, trasformando l'IA in computer vision, NLP e altro ancora.
L'apprendimento auto-supervisionato (SSL) è un approccio all'apprendimento automatico (ML) che consente ai modelli di imparare da grandi quantità di dati non etichettati. A differenza dell'apprendimento supervisionato, che dipende in larga misura da dati meticolosamente etichettati, l'SSL crea ingegnosamente i propri segnali di supervisione direttamente dai dati di input. Questo lo rende eccezionalmente prezioso in campi come la computer vision (CV) e l'elaborazione del linguaggio naturale (NLP), dove i dati non etichettati sono abbondanti, ma il costo e lo sforzo dell'etichettatura manuale(annotazione dei dati) possono essere proibitivi.
Il meccanismo alla base di SSL prevede la progettazione di un "compito pretestuoso". Si tratta di un compito ausiliario autogenerato in cui il modello deve prevedere alcune proprietà dei dati che sono state intenzionalmente nascoste o alterate. Risolvendo questo compito pretestuoso, il modello è costretto ad apprendere strutture e rappresentazioni sottostanti significative(embeddings) dei dati senza etichette fornite dall'uomo. Questa fase iniziale di addestramento viene comunemente definita pre-addestramento.
Ad esempio, nella visione computerizzata, un compito pretestuoso potrebbe comportare:
In NLP, un compito pretestuoso ben noto è la modellazione del linguaggio mascherato, notoriamente utilizzata da modelli come BERT. In questo caso, il modello impara a prevedere le parole che sono state mascherate (nascoste) in modo casuale all'interno delle frasi.
Dopo un pre-addestramento su grandi insiemi di dati non etichettati, il modello acquisisce una ricca rappresentazione di caratteristiche. Questo modello pre-addestrato può poi essere adattato per compiti specifici a valle, come il rilevamento di oggetti, la classificazione di immagini o l'analisi del sentimento, attraversoun processo chiamato " fine-tuning". Il fine-tuning richiede in genere una quantità di dati etichettati molto inferiore rispetto all'addestramento di un modello da zero, rendendo la SSL un fattore chiave per un apprendimento di trasferimento efficace.
È fondamentale differenziare l'SSL dai paradigmi di ML correlati:
SSL ha capacità di intelligenza artificiale (AI) notevolmente avanzate:
SSL riduce in modo significativo la dipendenza da costosi set di dati etichettati, democratizzando lo sviluppo di potenti modelli di intelligenza artificiale. Strumenti come PyTorch e TensorFlowinsieme a piattaforme come Ultralytics HUB, forniscono ambienti per sfruttare le tecniche SSL per costruire e distribuire soluzioni di IA all'avanguardia.