Cliccando su “Accetta tutti i cookie”, l'utente accetta di memorizzare i cookie sul proprio dispositivo per migliorare la navigazione del sito, analizzare l'utilizzo del sito e assistere le nostre attività di marketing. Maggiori informazioni
Impostazioni dei cookie
Cliccando su “Accetta tutti i cookie”, l'utente accetta di memorizzare i cookie sul proprio dispositivo per migliorare la navigazione del sito, analizzare l'utilizzo del sito e assistere le nostre attività di marketing. Maggiori informazioni
Scopri le differenze tra l'apprendimento supervisionato e quello non supervisionato nella visione artificiale e come scegliere l'approccio più adatto ai tuoi dati e agli obiettivi del tuo progetto.
Scala i tuoi progetti di visione artificiale con Ultralytics
L'intelligenza artificiale (IA) si basa sul concetto fondamentale di insegnare alle macchine ad apprendere e a ragionare in modi simili all'intelligenza umana. Proprio come le persone imparano attraverso diversi metodi, quali l'insegnamento diretto o l'osservazione di schemi ed esperienze, i sistemi di IA e di apprendimento automatico sono progettati per seguire questi stessi approcci.
Nello specifico, quando si parla di algoritmi di apprendimento automatico, i sistemi vengono addestrati ad apprendere dai dati anziché essere programmati in modo esplicito per ogni singola attività. Anziché basarsi su regole fisse, i modelli di apprendimento automatico individuano schemi ricorrenti nei dati e li utilizzano per formulare previsioni o prendere decisioni.
Ad esempio, la visione artificiale è una branca dell'intelligenza artificiale e dell'apprendimento automatico che mira a consentire ai sistemi di interpretare e comprendere le informazioni visive, come immagini e video. Dal riconoscimento degli oggetti all'identificazione di modelli nascosti all'interno di grandi insiemi di dati, questi sistemi dipendono in larga misura dal modo in cui vengono addestrati ad apprendere.
Alcuni modelli di visione artificiale apprendono da dati etichettati, in cui ogni dato in ingresso è associato a una risposta corretta; ciò significa che ogni immagine o punto dati è accompagnato da un'etichetta predefinita che indica al modello cosa rappresenta. Ciò consente al modello di apprendere la relazione tra il dato in ingresso e l'output atteso, migliorando la sua capacità di formulare previsioni accurate su dati nuovi e non visti in precedenza.
Altri modelli di visione artificiale apprendono da dati non etichettati, per i quali non vengono fornite risposte predefinite, concentrandosi invece sull'identificazione di schemi e relazioni all'interno dei dati stessi. Questi approcci sono noti rispettivamente come apprendimento supervisionato e apprendimento non supervisionato e costituiscono la base di molti sistemi di visione artificiale all'avanguardia.
In questo articolo approfondiremo l'apprendimento supervisionato e quello non supervisionato, il loro impiego nella visione artificiale e come scegliere l'approccio più adatto al proprio progetto di IA applicata alla visione. Cominciamo!
In che modo gli approcci di apprendimento basati sull'intelligenza artificiale potenziano la visione artificiale
Si può pensare all'intelligenza artificiale come a un ombrello che copre una vasta gamma di tecnologie che consentono alle macchine di svolgere compiti che in genere richiedono l'intelligenza umana. All'interno di questo ombrello, l'apprendimento automatico è un'area fondamentale che permette ai sistemi di imparare dai dati invece di basarsi esclusivamente su regole fisse.
Nell'ambito dell'apprendimento automatico, diverse tecniche di apprendimento determinano il modo in cui un modello apprende e migliora nel tempo. Approcci quali l'apprendimento supervisionato (apprendimento da dati etichettati con risposte corrette), l'apprendimento non supervisionato (identificazione di modelli in dati non etichettati), l'apprendimento per rinforzo (apprendimento per tentativi ed errori utilizzando feedback o ricompense) e l'apprendimento semi-supervisionato (combinazione di una piccola quantità di dati etichettati con una grande quantità di dati non etichettati) definiscono il modo in cui i sistemi elaborano i dati in ingresso e generano i dati in uscita.
Fig. 1. Una panoramica dei metodi di apprendimento dell'IA (Fonte)
In particolare, i sistemi di visione artificiale vengono realizzati utilizzando tali approcci di apprendimento per interpretare e comprendere i dati visivi. L'apprendimento supervisionato è il metodo più comunemente utilizzato, poiché consente ai modelli di apprendere da esempi chiaramente etichettati e di produrre risultati accurati e affidabili.
Ad esempio, un modello può essere addestrato su immagini etichettate come «gatto» e «cane», apprendendo caratteristiche quali la forma, le orecchie e la struttura del muso, in modo da poter classify correttamente classify immagini utilizzando algoritmi di classificazione. Nel contempo, nella visione artificiale si ricorre anche all’apprendimento non supervisionato e semi-supervisionato, spesso per individuare modelli nei dati o per migliorare le prestazioni quando i dati etichettati sono limitati.
Uno sguardo all'utilizzo dei modelli di apprendimento supervisionato nella visione artificiale
Si possono paragonare gli algoritmi di apprendimento supervisionato a una classe, dove l'insegnante fornisce esempi accompagnati dalle risposte corrette, in modo che gli studenti possano imparare cosa è giusto e cosa è sbagliato. Nell'apprendimento automatico, i modelli apprendono in modo simile utilizzando dati etichettati, in cui ogni input è associato a un output noto.
Supponiamo che tu stia lavorando alla realizzazione di un sistema di visione artificiale che automatizzi l'analisi delle partite di baseball. Potresti addestrare un modello come Ultralytics su immagini o fotogrammi video in cui oggetti come la palla, la mazza e i giocatori sono etichettati.
Ogni oggetto verrebbe contrassegnato con la sua posizione e la sua categoria, consentendo al modello di imparare cosa cercare. Con il passare del tempo, il modello sarà in grado di detect localizzare questi oggetti in nuove riprese, supportando casi d'uso quali il tracciamento della palla e il rilevamento dei giocatori tra i fotogrammi.
Fig. 2. Un esempio di rilevamento di oggetti ottenuto tramite apprendimento supervisionato (Fonte)
Oltre al rilevamento di oggetti, l'apprendimento supervisionato è ampiamente utilizzato in una vasta gamma di attività di visione artificiale, quali la classificazione delle immagini, la segmentazione delle istanze e la stima della posa, in cui precisione e coerenza rivestono un ruolo fondamentale. In ciascuna di queste attività, i modelli apprendono dai dati etichettati per identificare modelli specifici e formulare previsioni affidabili su nuovi input.
Questi modelli vengono solitamente realizzati utilizzando il deep learning, una forma di apprendimento automatico che impiega reti neurali per apprendere modelli direttamente dai dati. Le reti neurali sono progettate per elaborare le informazioni in un modo che si ispira vagamente al funzionamento del cervello umano, consentendo ai modelli di apprendere caratteristiche visive complesse da grandi insiemi di dati.
I primi approcci alla visione artificiale si basavano spesso su caratteristiche definite manualmente, combinate con algoritmi quali le macchine a vettori di supporto (le SVM sono modelli che classify individuando il confine ottimale tra le categorie) o gli alberi decisionali (modelli che prendono decisioni suddividendo i dati in rami).
Al contrario, i modelli di visione artificiale odierni utilizzano il deep learning per apprendere automaticamente queste caratteristiche dai dati, rendendoli più efficaci nella gestione di compiti visivi su larga scala e altamente dettagliati.
Comprendere l'importanza dei modelli di apprendimento non supervisionato nell'intelligenza artificiale applicata alla visione
Sebbene l'apprendimento supervisionato sia l'approccio più diffuso nella visione artificiale, esistono alcune applicazioni in questo campo in cui i dati etichettati non sono disponibili o la loro creazione risulta troppo costosa e richiede troppo tempo.
In questi casi, gli algoritmi di apprendimento non supervisionato possono rappresentare un'utile alternativa. Supponiamo che si disponga di un'ampia raccolta di foto non etichettate provenienti da una fotocamera per la fauna selvatica.
Non ci sono etichette che indichino il contenuto di ciascuna immagine, ma si desidera comunque organizzare o comprendere i dati. Un modello non supervisionato è in grado di analizzare queste immagini e raggruppare quelle simili, separando in cluster gli animali che si assomigliano, anche senza conoscerne le etichette esatte.
Come funziona l'apprendimento non supervisionato nella visione artificiale
Ma come funziona l'apprendimento automatico non supervisionato? Anziché basarsi su risposte corrette, il modello apprende individuando autonomamente modelli e strutture all'interno dei dati. Cerca somiglianze e differenze tra i dati senza fare affidamento su esempi etichettati.
Un caso d'uso comune è il rilevamento delle anomalie, in cui il modello apprende l'aspetto dei dati normali e poi identifica qualsiasi elemento che se ne discosti. Il rilevamento di anomalie e valori anomali è una delle applicazioni industriali di maggiore impatto. Alcuni esempi includono l'individuazione di articoli difettosi su una linea di produzione, la segnalazione di scansioni mediche insolite per la revisione da parte di un radiologo o il rilevamento di attività sospette nelle riprese di sorveglianza. Poiché i difetti e le anomalie sono spesso rari e vari, etichettare ogni caso possibile è poco pratico, rendendo gli approcci non supervisionati la scelta più naturale.
A tal fine, vengono spesso utilizzate tecniche quali il clustering e la riduzione della dimensionalità, solitamente applicate alle caratteristiche estratte dalle immagini piuttosto che alle immagini grezze stesse. I metodi di clustering, come il clustering k-means, raggruppano immagini simili sulla base di modelli condivisi, mentre le tecniche di riduzione della dimensionalità, come l'analisi delle componenti principali (PCA), semplificano i dati concentrandosi sulle caratteristiche più rilevanti.
Ciò consente al modello di individuare più facilmente modelli e strutture significative all'interno di set di dati voluminosi e complessi. Il vantaggio principale dell'apprendimento non supervisionato è che funziona bene con dati non etichettati ed è in grado di rivelare modelli che non sono immediatamente evidenti. Tuttavia, è più difficile da valutare e offre un minore controllo sul risultato finale rispetto all'apprendimento supervisionato.
Apprendimento auto-supervisionato e semi-supervisionato nella visione artificiale
Mentre approfondisci l'argomento dell'apprendimento supervisionato e non supervisionato, potresti chiederti se esista una via di mezzo tra i due. È interessante notare che l'apprendimento auto-supervisionato e quello semi-supervisionato colmano il divario tra l'apprendimento supervisionato e quello non supervisionato.
Questi approcci consentono ai modelli di apprendere in modo più efficace dai dati non etichettati. Anziché basarsi esclusivamente su esempi etichettati, essi creano autonomamente i propri compiti di apprendimento a partire dai dati oppure combinano un piccolo set di dati etichettati con uno più ampio di dati non etichettati.
Nell'apprendimento auto-supervisionato, il modello apprende risolvendo compiti generati dai dati stessi. Ad esempio, potrebbe ricevere un'immagine con una parte mancante e imparare a prevedere cosa dovrebbe occupare quello spazio, oppure potrebbe imparare a riconoscere diverse prospettive dello stesso oggetto. Ciò aiuta il modello ad apprendere caratteristiche utili senza bisogno di etichette inserite manualmente.
D'altra parte, nell'apprendimento semi-supervisionato, si utilizza una piccola quantità di dati etichettati insieme a un insieme più ampio di dati non etichettati per migliorare le prestazioni. In alcuni casi, il modello è in grado di generare etichette per i dati non etichettati e di utilizzarle per continuare l'apprendimento.
Il vantaggio principale di questi approcci è che riducono la necessità di disporre di grandi set di dati etichettati, la cui creazione è spesso costosa e richiede molto tempo. Tuttavia, possono risultare più complessi da progettare e valutare rispetto ai metodi completamente supervisionati.
Principali differenze tra apprendimento supervisionato e non supervisionato
La differenza tra apprendimento supervisionato e non supervisionato risiede nel modo in cui un modello apprende e nell'obiettivo che si prefigge. Mentre l'apprendimento supervisionato si basa su dati etichettati e su indicazioni chiare per apprendere compiti specifici, l'apprendimento non supervisionato opera senza risposte predefinite e si concentra sull'individuazione di modelli e strutture all'interno dei dati.
Ad esempio, in un sistema di monitoraggio del traffico, un modello di apprendimento supervisionato può essere addestrato su immagini etichettate per detect , pedoni o semafori. Al contrario, un modello non supervisionato potrebbe analizzare grandi quantità di filmati per raggruppare modelli di traffico simili o identificare eventi insoliti, come ingorghi imprevisti o movimenti anomali, senza che gli venga esplicitamente indicato cosa cercare.
Quando utilizzare l'apprendimento supervisionato nella visione artificiale
L'apprendimento supervisionato è un'ottima scelta per le attività di visione artificiale in cui l'obiettivo è chiaramente definito e il modello deve mappare i dati di input su output accurati. Funziona particolarmente bene quando si dispone di un set di dati etichettato affidabile e si necessitano risultati coerenti e prevedibili.
Fig. 3. Compiti di visione artificiale basati sull'apprendimento supervisionato (Fonte)
Viene comunemente utilizzato per risolvere problemi in cui il modello deve distinguere tra categorie note o prevedere risultati specifici. Anziché esplorare modelli ricorrenti, l'attenzione è rivolta all'apprendimento di relazioni precise dai dati etichettati, rendendo più facile guidare il modello verso il risultato desiderato.
Un altro vantaggio fondamentale è il controllo. Con l'apprendimento supervisionato, è più facile misurare le prestazioni utilizzando metriche chiare, mettere a punto il modello e garantire un comportamento stabile durante l'implementazione. Ciò lo rende perfetto per i sistemi che richiedono coerenza e affidabilità nel tempo.
Tuttavia, ciò comporta un compromesso. Il modello dipende in larga misura dalla qualità e dalla quantità dei dati etichettati, e la raccolta e l'annotazione di tali dati possono richiedere molto tempo.
Esempi concreti di visione artificiale supervisionata
I modelli di visione artificiale come YOLO Ultralytics utilizzano l'apprendimento supervisionato per svolgere compiti quali il rilevamento di oggetti con elevata precisione, specialmente nelle applicazioni in tempo reale. Ecco alcuni casi d'uso comuni nel mondo reale in cui l'apprendimento supervisionato fa la differenza:
Assistenza sanitaria e diagnostica per immagini: i medici possono avvalersi di sistemi di visione artificiale addestrati su immagini cliniche etichettate, quali radiografie o risonanze magnetiche, in cui vengono utilizzati classificatori per identificare patologie quali tumori o fratture, favorendo diagnosi più rapide e accurate.
Controllo qualità industriale: negli ambienti produttivi, i sistemi di visione addestrati su dati etichettati sono in grado di ispezionare i prodotti analizzando una serie di caratteristiche relative alla qualità, quali la forma, i difetti superficiali, la consistenza e le dimensioni. Imparando da esempi sia di prodotti conformi che difettosi, questi sistemi sono in grado di identificare in modo coerente i difetti e di garantire il rispetto degli standard di produzione.
Guida autonoma: i sistemi di guida autonoma si basano su modelli addestrati su dati di guida etichettati per riconoscere le corsie, i veicoli, i pedoni e la segnaletica stradale, aiutando i veicoli a muoversi in sicurezza in tempo reale.
Sistemi di vendita al dettaglio e di gestione delle casse: i negozi utilizzano modelli addestrati su immagini di prodotti etichettate per identificare gli articoli sugli scaffali o alla cassa, consentendo la fatturazione automatizzata e una gestione più efficiente delle scorte. Questi sistemi possono inoltre supportare attività quali la segmentazione della clientela, se integrati con dati aggiuntivi, aiutando le aziende a comprendere meglio le abitudini di acquisto.
Agricoltura e monitoraggio delle colture: gli agricoltori possono utilizzare modelli addestrati su immagini etichettate per detect classify , ad esempio per identificare e contare le patate sane e quelle danneggiate, migliorando così il controllo qualità e riducendo le perdite.
Fig. 4. Utilizzo YOLO detect contare le patate sane e quelle difettose
Quali tipi di problemi nel campo della visione artificiale può risolvere l'apprendimento non supervisionato?
L'apprendimento non supervisionato è utile quando non si dispone di dati etichettati sufficienti o quando i dati non forniscono risposte chiare. In questi casi, l'obiettivo non è quello di formulare previsioni esatte, ma di comprendere i modelli e la struttura dei dati.
Viene spesso utilizzato quando si analizza per la prima volta un set di dati non etichettato. Anziché indicare al modello cosa cercare, gli si permette di individuare autonomamente le somiglianze, raggruppare le immagini correlate o evidenziare modelli insoliti.
In un ampio archivio di immagini, un approccio non supervisionato può aiutare a raggruppare immagini simili o a individuare i casi anomali che potrebbero richiedere un'ulteriore analisi. Ciò lo rende un utile punto di partenza nei progetti di data science.
I modelli generativi, tra cui le GAN, gli autoencoder variazionali e i modelli di diffusione, apprendono la distribuzione sottostante delle immagini per crearne di completamente nuove. Questi modelli sono alla base di applicazioni quali la sintesi di immagini, l'inpainting, la super-risoluzione e il trasferimento di stile, e costituiscono la spina dorsale degli attuali sistemi di IA generativa.
Segmentazione non supervisionata: alcuni metodi raggruppano pixel o regioni in segmenti coerenti senza ricorrere a maschere etichettate, il che risulta utile quando l'annotazione è troppo dispendiosa o quando l'obiettivo è individuare una struttura piuttosto che abbinare categorie predefinite.
L'apprendimento non supervisionato è particolarmente utile anche quando si lavora con grandi insiemi di dati, dove l'assegnazione delle etichette richiede molto tempo o non è praticabile. In questi casi, consente di ricavare informazioni dai dati senza dover ricorrere a dati di addestramento etichettati.
È inoltre comunemente utilizzato in ambiti quali l'IA generativa (modelli che generano nuovi dati come immagini, testo o audio) e l'apprendimento della rappresentazione (modelli che apprendono caratteristiche o schemi utili dai dati grezzi), dove i modelli acquisiscono caratteristiche generali da grandi quantità di dati. In generale, se il vostro problema riguarda l'esplorazione, l'individuazione di schemi o l'utilizzo di dati non etichettati, l'apprendimento non supervisionato rappresenta un approccio flessibile e pratico da prendere in considerazione.
Esempi concreti di apprendimento non supervisionato nella visione artificiale
Ecco alcuni esempi di casi d'uso in cui l'apprendimento non supervisionato viene applicato alla visione artificiale:
Rilevamento delle anomalie nella produzione: i modelli sono in grado di apprendere l'aspetto dei prodotti normali e di segnalare difetti o irregolarità senza bisogno di esempi etichettati per ogni possibile difetto.
Organizzazione e ricerca delle immagini: le grandi raccolte di immagini, come le librerie fotografiche o i cataloghi di e-commerce, possono essere raggruppate automaticamente in base alla somiglianza visiva, facilitando il lavoro dei data scientist nell'organizzazione, nell'esplorazione e nella ricerca all'interno di grandi set di dati.
Sorveglianza e sicurezza: i sistemi sono in grado di analizzare le riprese video per individuare modelli o comportamenti insoliti, come movimenti inaspettati o variazioni nella composizione della folla, senza essere stati specificatamente addestrati su eventi etichettati.
Pre-elaborazione ed esplorazione dei dati: i metodi non supervisionati vengono spesso utilizzati per esplorare e strutturare i dati grezzi delle immagini prima dell'addestramento dei modelli supervisionati, contribuendo a migliorare la qualità dei dati e a ridurre il lavoro manuale.
Limiti pratici dell'apprendimento supervisionato e non supervisionato
Nonostante i vantaggi offerti da entrambi gli approcci di apprendimento, è necessario tenere conto di alcuni limiti. Ecco alcuni aspetti pratici da considerare quando si sviluppano modelli di visione artificiale:
Sovradattamento nei modelli supervisionati: nell'apprendimento supervisionato, un modello può adattarsi eccessivamente ai dati di addestramento invece di apprendere modelli generali. Ciò accade spesso quando il set di dati è di piccole dimensioni o non sufficientemente diversificato. Ad esempio, un modello addestrato a detect in un determinato tipo di prodotto potrebbe non funzionare correttamente se sottoposto a test su nuovi dati relativi a prodotti leggermente diversi o in condizioni di illuminazione diverse.
Sfide legate agli algoritmi di clustering: nell'apprendimento non supervisionato, un modello è in grado di raggruppare punti dati simili. Tuttavia, questo approccio può fallire quando i dati sono rumorosi, incoerenti o privi di una struttura chiara. Ad esempio, nelle attività di raggruppamento delle immagini, immagini con colori simili ma oggetti diversi potrebbero essere raggruppate in modo errato.
L'importanza di una corretta pre-elaborazione: prima dell'addestramento, i dati devono essere puliti e preparati. Ciò avviene solitamente utilizzando Python specializzate nell'elaborazione delle immagini e nella trasformazione dei dati. Ciò è particolarmente importante nella visione artificiale, dove le immagini possono variare in termini di dimensioni, qualità o illuminazione. Senza una corretta pre-elaborazione, i modelli potrebbero apprendere dal rumore anziché da modelli significativi, con conseguenti prestazioni scadenti.
Punti chiave
Nella visione artificiale, sia l'apprendimento supervisionato che quello non supervisionato rivestono un ruolo importante. L'approccio più adeguato dipende dal tipo di dati a disposizione, a seconda che siano etichettati o meno, nonché dal problema che si intende risolvere e dalle esigenze di implementazione.
Se il tuo obiettivo è ottenere un'elevata precisione e risultati ben definiti, l'apprendimento automatico supervisionato è spesso la scelta migliore. Se stai analizzando i dati o lavorando senza etichette, l'apprendimento non supervisionato può essere più adatto.