Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Apprendimento semi-supervisionato

Scopri come l'apprendimento semi-supervisionato combina dati etichettati e non etichettati per migliorare i modelli di IA, ridurre i costi di etichettatura e aumentare l'accuratezza.

L'apprendimento semi-supervisionato (SSL) è un potente paradigma dell'apprendimento automatico (ML). dell'apprendimento automatico (ML) che colma il divario tra l'apprendimento completamente tra l'apprendimento completamente supervisionato e apprendimento non supervisionato. Mentre i metodi supervisionati richiedono insiemi di dati completamente annotati e i metodi non supervisionati lavorano interamente senza etichette, l'SSL opera sfruttando una piccola quantità di dati etichettati. sfruttando una piccola quantità di dati etichettati insieme a un pool molto più ampio di dati non etichettati. In molti scenari reali scenari reali, l'ottenimento dei dati grezzi è relativamente economico, ma il processo di di etichettatura dei dati è costoso, richiede tempo e richiede competenze umane. SSL affronta questo collo di bottiglia utilizzando i limitati esempi etichettati per guidare il processo di apprendimento. processo di apprendimento, consentendo al modello di estrarre struttura e modelli dai vasti segmenti non etichettati, migliorando così l'accuratezza e la generalizzazione del modello. l'accuratezza complessiva del modello e la sua generalizzazione.

Come funziona l'apprendimento semi-supervisionato

Il meccanismo fondamentale di SSL prevede la propagazione delle informazioni dai dati etichettati a quelli non etichettati. Il processo processo inizia generalmente con l'addestramento di un modello iniziale sul piccolo set di dati etichettati. Questo modello viene poi utilizzato per dedurre predizioni sui dati non etichettati. Le previsioni più sicure, spesso chiamate pseudo-etichette, vengono trattate come verità di base e il modello viene riqualificato. e il modello viene riaddestrato su questo set di dati ampliato. Questo ciclo iterativo permette alle reti neurali di apprendere confini decisionali che più robusti di quelli appresi dai soli dati etichettati.

Le tecniche comuni utilizzate in SSL includono:

  • Pseudo-etichettatura: Il modello genera etichette per i dati non etichettati e le predizioni ad alta affidabilità vengono aggiunte ai dati di addestramento. ai dati di addestramento. Questo metodo è spesso utilizzato in insieme alle soglie di confidenza.
  • Regolarizzazione della coerenza: Questo metodo incoraggia il modello a produrre la stessa predizione per un'immagine originale e per una versione un'immagine originale e una versione perturbata (ad esempio, dopo aver applicato l'aumento dei dati). aumento dei dati). Se il modello comprende l'oggetto l'oggetto, capovolgere o ruotare leggermente l'immagine non dovrebbe cambiare la classificazione. È possibile leggere ulteriori informazioni sui concetti di regolarizzazione della coerenza nella letteratura accademica.
  • Metodi basati su grafici: I punti di dati sono rappresentati come nodi di un grafo, dove gli spigoli riflettono la somiglianza. somiglianza. Le etichette vengono propagate dai nodi etichettati ai loro vicini non etichettati, una tecnica spesso discussa nella ricerca sulle reti neurali a grafo (GNN). reti neurali a grafo (GNN).

Applicazioni nel mondo reale

L'apprendimento semi-supervisionato è particolarmente trasformativo nei settori in cui i dati sono abbondanti ma l'annotazione degli esperti è scarsa. scarsità di annotazioni da parte di esperti.

  1. Analisi delle immagini mediche: Nel settore sanitario, la generazione di un per compiti come l'individuazione dei tumori il rilevamento dei tumori richiede che radiologi altamente pagati annotino manualmente le risonanze magnetiche o le scansioni TC. Con l'SSL, i ricercatori possono addestrare un modello su un modello su un piccolo insieme di scansioni verificate dal medico e poi sfruttare migliaia di archivi ospedalieri non annotati per migliorare le prestazioni. prestazioni. In questo modo si riducono significativamente i costi, mantenendo al contempo elevati standard diagnostici L 'intelligenza artificiale nell'assistenza sanitaria.
  2. Riconoscimento vocale: gli assistenti vocali specializzati richiedono enormi quantità di dati audio. Sebbene trascrivere migliaia di ore di audio sia trascrivere migliaia di ore di audio è impraticabile, le aziende tecnologiche possono utilizzare un piccolo set di parlato trascritto per per addestrare un modello di base. Questo modello impara poi dalle sfumature di milioni di ore di audio non trascritto che si trovano nei dati web. dati web, perfezionando la sua capacità di comprendere accenti e dialetti diversi attraverso il riconoscimento automatico del parlato.

Differenziare i concetti correlati

Per comprendere appieno l'SSL, è utile distinguerlo da paradigmi di apprendimento simili:

  • SSL vs. Apprendimento auto-supervisionato. Apprendimento auto-supervisionato: Sebbene condividano un acronimo, sono distinti. L'apprendimento auto-supervisionato crea le proprie etichette dalla struttura dei dati (ad esempio, prevedendo la parola successiva in una frase o la zona mancante in un'immagine). (ad esempio, prevedendo la parola successiva in una frase o una zona mancante in un'immagine) senza etichette umane. L'apprendimento semi-supervisionato si basa ancora su un insieme di etichette fornite dall'uomo per guidare il processo.
  • SSL vs. Apprendimento attivo: Nell'apprendimento apprendimento attivo, il modello identifica i punti di dati più confusi e chiede esplicitamente a un umano di etichettarli. di etichettarli. SSL, invece, tenta di risolvere automaticamente i dati non etichettati senza interrompere il flusso di lavoro per umano.
  • Apprendimento SSL vs. apprendimento per trasferimento: L'apprendimento per trasferimento consiste nel prendere pesi del modello da un compito di origine (come ImageNet) e di metterli a punto su un compito di destinazione. L'SSL si concentra sull'utilizzo di dati non etichettati della stessa distribuzione per migliorare l'apprendimento fin dall'inizio.

Attuazione pratica

L'implementazione di un flusso di lavoro semi-supervisionato spesso comporta un ciclo "insegnante-allievo" o una formazione iterativa. Di seguito è un esempio concettuale che utilizza il metodo ultralytics Python per dimostrare come si possano fare inferenze su dati non etichettati per generare previsioni che potrebbero servire come pseudo-etichette per un ulteriore addestramento.

from ultralytics import YOLO

# Initialize the YOLO11 model (Teacher)
model = YOLO("yolo11n.pt")

# Train initially on a small, available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on a directory of unlabeled images to generate predictions
# These results can be filtered by confidence to create 'pseudo-labels'
results = model.predict(source="./unlabeled_data", save_txt=True, conf=0.8)

# The saved text files from prediction can now be combined with the original
# dataset to retrain a robust 'Student' model.

Strumenti e prospettive future

Quadri di apprendimento profondo come PyTorch e TensorFlow forniscono gli elementi necessari per implementare cicli SSL e funzioni di perdita personalizzati. e funzioni di perdita personalizzate. Man mano che i modelli diventano più grandi e affamati di dati, tecniche come l'SSL stanno diventando una pratica standard per massimizzare l'efficienza dei dati. per massimizzare l'efficienza dei dati.

L'imminente piattaforma Ultralytics è progettata per semplificare i flussi di lavoro come questi, aiutando i team a gestire la transizione dai dati grezzi alla distribuzione dei modelli. dai dati grezzi alla distribuzione dei modelli, facilitando la cura dei dati e la la curatela dei dati e processi di auto-annotazione. Utilizzando utilizzando in modo efficace i dati non etichettati, le aziende possono implementare soluzioni di intelligenza artificiale ad alte prestazioni come YOLO11 ad alte prestazioni come YOLO11, in modo più rapido e conveniente rispetto ai metodi puramente metodi supervisionati.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora