Guide

Esplorazione dell'apprendimento supervisionato vs non supervisionato nella computer vision

Impara le differenze tra apprendimento supervisionato e non supervisionato nella computer vision e come scegliere l'approccio giusto per i tuoi dati e gli obiettivi del progetto.

ABAbirami Vina7 min readApril 20, 2026

Apprendimento supervisionato vs non supervisionato nella computer vision

L'intelligenza artificiale (AI) si basa sul concetto fondamentale di insegnare alle macchine a imparare e ragionare in modi che ricordano l'intelligenza umana. Proprio come le persone imparano attraverso metodi diversi, come l'istruzione diretta o l'osservazione di modelli ed esperienze, i sistemi di AI e machine learning sono progettati per seguire questi stessi approcci.

Nello specifico, quando si parla di algoritmi di machine learning, i sistemi vengono addestrati a imparare dai dati invece di essere esplicitamente programmati per ogni compito. Invece di affidarsi a regole fisse, i modelli di machine learning identificano modelli nei dati e li usano per fare previsioni o decisioni.

Ad esempio, la computer vision è un ramo dell'AI e del machine learning che si concentra sul consentire ai sistemi di interpretare e comprendere informazioni visive, come immagini e video. Dal riconoscimento di oggetti all'identificazione di modelli nascosti in grandi dataset, questi sistemi dipendono fortemente da come sono stati addestrati ad apprendere.

Vengono utilizzate diverse tecniche di apprendimento AI per addestrare questi sistemi, a seconda del tipo di dati disponibili e del problema da risolvere.

Alcuni modelli di computer vision imparano da dati etichettati, dove ogni input è associato a una risposta corretta, il che significa che ogni immagine o punto dati viene fornito con un'etichetta predefinita che indica al modello cosa rappresenta. Ciò consente al modello di imparare la relazione tra l'input e l'output atteso, migliorando la sua capacità di effettuare previsioni accurate su dati nuovi e non visti.

Altri modelli di visione imparano da dati non etichettati, dove non vengono fornite risposte predefinite, concentrandosi invece sull'identificazione di modelli e relazioni all'interno dei dati stessi. Questi approcci sono noti rispettivamente come apprendimento supervisionato e apprendimento non supervisionato, e costituiscono le fondamenta di molti sistemi di computer vision all'avanguardia.

In questo articolo esploreremo l'apprendimento supervisionato e non supervisionato, come vengono utilizzati nella computer vision e come scegliere l'approccio che meglio si adatta al tuo progetto di AI di visione. Cominciamo!

Link to this sectionCome gli approcci di apprendimento AI potenziano la computer vision#

Puoi immaginare l'intelligenza artificiale come un ombrello che copre una gamma di tecnologie che consentono alle macchine di eseguire compiti che solitamente richiedono l'intelligenza umana. All'interno di questo ombrello, il machine learning è un'area chiave che rende possibile ai sistemi imparare dai dati invece di affidarsi solo a regole fisse.

All'interno del machine learning, diverse tecniche di apprendimento determinano come un modello apprende e migliora nel tempo. Approcci come l'apprendimento supervisionato (imparare da dati etichettati con risposte corrette), l'apprendimento non supervisionato (identificare modelli in dati non etichettati), l'apprendimento per rinforzo (imparare per tentativi ed errori usando feedback o ricompense) e l'apprendimento semi-supervisionato (combinare una piccola quantità di dati etichettati con una grande quantità di dati non etichettati) definiscono come i sistemi elaborano i dati di input e generano dati di output.

Una panoramica dei metodi di apprendimento dell'IA

Fig 1. Una panoramica dei metodi di apprendimento AI (Fonte)

In particolare, i sistemi di computer vision sono costruiti utilizzando tali approcci di apprendimento per interpretare e comprendere i dati visivi. L'apprendimento supervisionato è il metodo più comunemente usato, poiché consente ai modelli di imparare da esempi chiaramente etichettati e di produrre risultati accurati e affidabili.

Ad esempio, un modello può essere addestrato su immagini etichettate come “gatto” e “cane”, imparando caratteristiche come forma, orecchie e struttura facciale, in modo da poter classificare correttamente nuove immagini utilizzando algoritmi di classificazione. Nel frattempo, anche l'apprendimento non supervisionato e semi-supervisionato vengono utilizzati nella computer vision, spesso per esplorare modelli nei dati o per migliorare le prestazioni quando i dati etichettati sono limitati.

Link to this sectionUno sguardo all'utilizzo dei modelli di apprendimento supervisionato nella computer vision#

Puoi paragonare gli algoritmi di apprendimento supervisionato a un ambiente scolastico, in cui un insegnante fornisce esempi insieme alle risposte corrette affinché gli studenti possano imparare cosa è giusto e cosa è sbagliato. Nel machine learning, i modelli imparano in modo simile utilizzando dati etichettati, dove ogni input è associato a un output noto.

Diciamo che stai lavorando alla costruzione di un sistema di computer vision che automatizza l'analisi delle partite di baseball. Potresti addestrare un modello come Ultralytics YOLO26 su immagini o fotogrammi video in cui oggetti come la palla, la mazza e i giocatori sono etichettati.

Ogni oggetto verrebbe contrassegnato con la sua posizione e categoria, consentendo al modello di imparare cosa cercare. Nel tempo, il modello può rilevare e localizzare questi oggetti in nuovi filmati, supportando casi d'uso come il tracciamento della palla e il rilevamento dei giocatori tra i fotogrammi.

Un esempio di rilevamento oggetti abilitato dall'apprendimento supervisionato

Fig 2. Un esempio di rilevamento oggetti abilitato dall'apprendimento supervisionato (Fonte)

Oltre al rilevamento oggetti, l'apprendimento supervisionato è ampiamente utilizzato in una gamma di compiti di computer vision come la classificazione delle immagini, la segmentazione di istanze e la stima della posa, dove l'accuratezza e la coerenza sono importanti. In ognuno di questi compiti, i modelli imparano da dati etichettati per identificare modelli specifici e fare previsioni affidabili su nuovi input.

Questi modelli sono solitamente costruiti usando il deep learning, un tipo di machine learning che utilizza reti neurali per imparare modelli direttamente dai dati. Le reti neurali sono progettate per elaborare informazioni in un modo vagamente ispirato al funzionamento del cervello umano, consentendo ai modelli di apprendere caratteristiche visive complesse da grandi dataset.

I primi approcci di computer vision spesso si basavano su caratteristiche progettate manualmente combinate con algoritmi come le macchine a vettori di supporto (SVM, modelli che classificano i dati trovando il confine migliore tra le categorie) o alberi di decisione (modelli che prendono decisioni dividendo i dati in rami).

Al contrario, i modelli di computer vision oggi usano il deep learning per apprendere automaticamente queste caratteristiche dai dati, rendendoli più efficaci nella gestione di compiti visivi su larga scala e altamente dettagliati.

Link to this sectionComprendere la necessità di modelli di apprendimento non supervisionato nella visione AI#

Sebbene l'apprendimento supervisionato sia l'approccio preferito nella computer vision, ci sono alcune applicazioni di visione in cui i dati etichettati non sono disponibili o sono troppo costosi e dispendiosi in termini di tempo da creare.

In questi casi, gli algoritmi di apprendimento non supervisionato possono essere un'utile alternativa. Diciamo che hai una vasta collezione di foto non etichettate provenienti da una telecamera per la fauna selvatica.

Non ci sono etichette che indicano cosa contiene ogni immagine, ma vuoi comunque organizzare o comprendere i dati. Un modello non supervisionato può analizzare queste immagini e raggruppare quelle simili, separando gli animali che si somigliano in cluster, anche senza conoscerne le etichette esatte.

Link to this sectionCome funziona l'apprendimento non supervisionato nella computer vision#

Quindi, come funziona il machine learning non supervisionato? Invece di imparare dalle risposte corrette, il modello impara identificando modelli e strutture all'interno dei dati da solo. Cerca somiglianze e differenze tra i dati senza affidarsi a esempi etichettati.

Un caso d'uso comune è il rilevamento di anomalie, in cui il modello impara com'è fatto un dato normale e quindi identifica tutto ciò che se ne discosta. Il rilevamento di anomalie e outlier è una delle applicazioni industriali di maggior impatto. Gli esempi includono l'individuazione di articoli difettosi su una linea di produzione, la segnalazione di scansioni mediche insolite per la revisione del radiologo o il rilevamento di attività sospette nei filmati di sorveglianza. Poiché i difetti e le anomalie sono spesso rari e variegati, etichettare ogni possibile caso non è pratico, rendendo gli approcci non supervisionati una soluzione naturale.

Per supportare questo, vengono spesso utilizzate tecniche come il clustering e la riduzione della dimensionalità, solitamente sulle caratteristiche estratte dalle immagini piuttosto che sulle immagini grezze stesse. I metodi di clustering, come il clustering k-means, raggruppano immagini simili in base a modelli condivisi, mentre le tecniche di riduzione della dimensionalità, come l'analisi delle componenti principali (PCA), semplificano i dati concentrandosi sulle caratteristiche più importanti.

Ciò rende più facile per il modello identificare modelli e strutture significative all'interno di dataset grandi e complessi. Il vantaggio principale dell'apprendimento non supervisionato è che funziona bene con dati non etichettati e può rivelare modelli che non sono immediatamente ovvi. Tuttavia, è più difficile da valutare e offre meno controllo sull'output finale rispetto all'apprendimento supervisionato.

Link to this sectionApprendimento auto-supervisionato e semi-supervisionato nella computer vision#

Mentre esplori l'apprendimento supervisionato e non supervisionato, potresti chiederti se esiste una via di mezzo tra i due. È interessante notare che l'apprendimento auto-supervisionato e quello semi-supervisionato colmano il divario tra l'apprendimento supervisionato e quello non supervisionato.

Questi approcci rendono possibile per i modelli imparare dai dati non etichettati in modo più efficace. Invece di affidarsi solo a esempi etichettati, creano i propri compiti di apprendimento dai dati o combinano un piccolo dataset etichettato con uno più grande non etichettato.

Nell'apprendimento auto-supervisionato, il modello impara risolvendo compiti creati dai dati stessi. Ad esempio, gli potrebbe essere data un'immagine con una parte mancante e imparare a prevedere cosa dovrebbe riempire quello spazio, oppure potrebbe imparare a riconoscere diverse viste dello stesso oggetto. Questo aiuta il modello a imparare caratteristiche utili senza bisogno di etichette manuali.

D'altra parte, nell'apprendimento semi-supervisionato, viene utilizzata una piccola quantità di dati etichettati insieme a un set più ampio di dati non etichettati per migliorare le prestazioni. In alcuni casi, il modello può generare etichette per i dati non etichettati e usarle per continuare ad apprendere.

Il vantaggio chiave di questi approcci è che riducono la necessità di grandi dataset etichettati, che sono spesso costosi e dispendiosi in termini di tempo da creare. Tuttavia, possono essere più complessi da progettare e valutare rispetto ai metodi completamente supervisionati.

Link to this sectionDifferenze chiave tra apprendimento supervisionato e non supervisionato#

La differenza tra apprendimento supervisionato e non supervisionato dipende da come un modello apprende e da cosa sta cercando di ottenere. Mentre l'apprendimento supervisionato si basa su dati etichettati e una chiara guida per imparare compiti specifici, l'apprendimento non supervisionato funziona senza risposte predefinite e si concentra sulla scoperta di modelli e strutture all'interno dei dati.

Ad esempio, in un sistema di monitoraggio del traffico, un modello di apprendimento supervisionato può essere addestrato su immagini etichettate per rilevare veicoli, pedoni o segnali stradali. Al contrario, un modello non supervisionato potrebbe analizzare grandi quantità di filmati video per raggruppare modelli di traffico simili o identificare eventi insoliti, come congestioni impreviste o movimenti anomali, senza essere esplicitamente istruito su cosa cercare.

Link to this sectionQuando utilizzare l'apprendimento supervisionato nella computer vision#

L'apprendimento supervisionato è un'ottima opzione per i compiti di computer vision in cui l'obiettivo è chiaramente definito e il modello deve mappare i dati di input a output accurati. Funziona particolarmente bene quando hai un dataset etichettato affidabile e hai bisogno di risultati coerenti e prevedibili.

Attività di computer vision basate sull'apprendimento supervisionato

Fig 3. Compiti di computer vision guidati dall'apprendimento supervisionato (Fonte)

È comunemente usato per problemi in cui il modello deve distinguere tra categorie note o prevedere risultati specifici. Piuttosto che esplorare modelli, l'attenzione si concentra sull'apprendimento di relazioni precise da dati etichettati, rendendo più facile guidare il modello verso un risultato desiderato.

Un altro vantaggio chiave è il controllo. Con l'apprendimento supervisionato, è più facile misurare le prestazioni utilizzando metriche chiare, perfezionare il modello e garantire un comportamento stabile durante il deployment. Questo lo rende perfetto per i sistemi che richiedono coerenza e affidabilità nel tempo.

Tuttavia, questo comporta un compromesso. Il modello dipende fortemente dalla qualità e dalla scala dei dati etichettati, e raccogliere e annotare tali dati può richiedere molto tempo.

Link to this sectionEsempi reali di computer vision supervisionata#

I modelli di visione AI come i modelli Ultralytics YOLO usano l'apprendimento supervisionato per eseguire compiti come il rilevamento oggetti con elevata precisione, specialmente in applicazioni in tempo reale. Ecco alcuni casi d'uso comuni di visione reale in cui l'apprendimento supervisionato fa la differenza:

Sanità e imaging medico: I medici possono utilizzare sistemi di computer vision addestrati su scansioni etichettate, come raggi X o risonanze magnetiche, dove i classificatori vengono utilizzati per identificare condizioni come tumori o fratture, supportando diagnosi più rapide e accurate.
Ispezione della qualità industriale: Negli ambienti di produzione, i sistemi di visione addestrati su dati etichettati possono ispezionare i prodotti analizzando una serie di caratteristiche relative alla qualità, come forma, difetti superficiali, consistenza e dimensioni. Imparando da esempi di prodotti accettabili e difettosi, questi sistemi possono identificare costantemente i guasti e mantenere gli standard di produzione.
Guida autonoma: I sistemi di guida autonoma si affidano a modelli addestrati su dati di guida etichettati per riconoscere corsie, veicoli, pedoni e segnali stradali, aiutando i veicoli a navigare in sicurezza in tempo reale.
Sistemi di vendita al dettaglio e cassa: I negozi utilizzano modelli addestrati su immagini di prodotti etichettate per identificare gli articoli sugli scaffali o alla cassa, consentendo la fatturazione automatica e una gestione dell'inventario più efficiente. Questi sistemi possono anche supportare compiti come la segmentazione della clientela se combinati con dati aggiuntivi, aiutando le aziende a comprendere meglio le abitudini di acquisto.
Agricoltura e monitoraggio delle colture: Gli agricoltori possono utilizzare modelli addestrati su immagini etichettate per rilevare e classificare le colture, come identificare e contare patate sane e danneggiate, migliorando il controllo qualità e riducendo le perdite.

Utilizzo di YOLO per rilevare e contare patate sane e difettose

Fig 4. Utilizzo di YOLO per rilevare e contare patate sane e difettose

Link to this sectionQuali tipi di problemi nella computer vision può risolvere l'apprendimento non supervisionato#

L'apprendimento non supervisionato è utile quando non hai abbastanza dati etichettati o quando i tuoi dati non vengono forniti con risposte chiare. In queste situazioni, l'obiettivo non è fare previsioni esatte, ma comprendere modelli e strutture nei dati.

È spesso usato quando si esplora un dataset non etichettato per la prima volta. Invece di dire al modello cosa cercare, gli permetti di identificare somiglianze, raggruppare immagini correlate o evidenziare modelli insoliti da solo.

In una vasta collezione di immagini, un approccio non supervisionato può aiutare a organizzare insieme immagini simili o segnalare outlier che potrebbero aver bisogno di ulteriore attenzione. Questo lo rende un utile punto di partenza nei progetti di data science.

I modelli generativi, inclusi GAN, autoencoder variazionali e modelli di diffusione, imparano la distribuzione sottostante delle immagini per crearne di completamente nuove. Questi modelli alimentano applicazioni come la sintesi di immagini, l'inpainting, la super-risoluzione e il trasferimento di stile, e formano la spina dorsale degli odierni sistemi di AI generativa.

Nella segmentazione non supervisionata, alcuni metodi raggruppano pixel o regioni in segmenti coerenti senza fare affidamento su maschere etichettate, il che è utile quando l'annotazione è troppo costosa o quando l'obiettivo è scoprire strutture piuttosto che corrispondere a categorie predefinite.

L'apprendimento non supervisionato è anche di grande impatto quando si lavora con grandi dataset in cui l'etichettatura richiede tempo o non è pratica. In questi casi, ti permette di ottenere approfondimenti dai dati senza affidarti a dati di addestramento etichettati.

È anche comunemente usato in aree come l'AI generativa (modelli che creano nuovi dati come immagini, testo o audio) e l'apprendimento di rappresentazioni (modelli che imparano caratteristiche o modelli utili da dati grezzi), dove i modelli imparano caratteristiche generali da grandi quantità di dati. Nel complesso, se il tuo problema riguarda l'esplorazione, la scoperta di modelli o il lavoro con dati non etichettati, l'apprendimento non supervisionato è un approccio flessibile e pratico da considerare.

Link to this sectionEsempi reali di apprendimento non supervisionato nella computer vision#

Ecco alcuni esempi di casi d'uso in cui l'apprendimento non supervisionato viene applicato nella computer vision:

Rilevamento di anomalie nella produzione: I modelli possono imparare com'è fatto un prodotto normale e possono segnalare difetti o irregolarità senza aver bisogno di esempi etichettati di ogni possibile difetto.
Organizzazione e ricerca di immagini: Grandi collezioni di immagini, come librerie fotografiche o cataloghi di e-commerce, possono essere automaticamente raggruppate in base alla somiglianza visiva, rendendo più facile per i data scientist organizzare, esplorare e cercare tra grandi dataset.
Sorveglianza e sicurezza: I sistemi possono analizzare i filmati video per identificare modelli o comportamenti insoliti, come movimenti imprevisti o cambiamenti nella folla, senza essere stati esplicitamente addestrati su eventi etichettati.
Pre-elaborazione ed esplorazione dei dati: I metodi non supervisionati sono spesso usati per esplorare e strutturare dati di immagini grezzi prima di addestrare modelli supervisionati, aiutando a migliorare la qualità dei dati e ridurre lo sforzo manuale.

Link to this sectionLimitazioni pratiche dell'apprendimento supervisionato e non supervisionato#

Nonostante i vantaggi di entrambi gli approcci di apprendimento, ci sono alcune limitazioni da considerare. Ecco alcuni fattori pratici da tenere a mente durante la costruzione di modelli di computer vision:

Overfitting nei modelli supervisionati: Nell'apprendimento supervisionato, un modello può imparare i dati di addestramento troppo da vicino invece di imparare modelli generali. Questo accade spesso quando il dataset è piccolo o non abbastanza diversificato. Ad esempio, un modello addestrato a rilevare difetti in un tipo di prodotto può fallire quando testato su nuovi dati costituiti da prodotti leggermente diversi o condizioni di illuminazione differenti.
Sfide con gli algoritmi di clustering: Nell'apprendimento non supervisionato, un modello può raggruppare punti dati simili insieme. Tuttavia, questo può fallire quando i dati sono rumorosi, incoerenti o mancano di una struttura chiara. Ad esempio, nei compiti di raggruppamento di immagini, le immagini con colori simili ma oggetti diversi potrebbero essere raggruppate erroneamente.
Importanza di una corretta pre-elaborazione: Prima dell'addestramento, i dati devono essere puliti e preparati. Questo viene solitamente fatto utilizzando librerie Python che gestiscono l'elaborazione delle immagini e la trasformazione dei dati. È particolarmente importante nella computer vision, dove le immagini possono variare per dimensioni, qualità o illuminazione. Senza una corretta pre-elaborazione, i modelli possono imparare dal rumore invece che da modelli significativi, portando a scarse prestazioni.

Link to this sectionPunti chiave#

Nella computer vision, sia l'apprendimento supervisionato che quello non supervisionato svolgono ruoli importanti. L'approccio giusto dipende dal tipo di dati che hai, se sono etichettati o meno, così come dal problema che stai cercando di risolvere e dalle tue esigenze di deployment.

Se il tuo obiettivo è un'elevata accuratezza e output chiaramente definiti, il machine learning supervisionato è spesso la scelta migliore. Se stai esplorando i dati o lavorando senza etichette, l'apprendimento non supervisionato può essere più adatto.

Vuoi saperne di più sull'AI? Dai un'occhiata alla nostra community e al nostro repository GitHub. Esplora le nostre pagine sulle soluzioni per scoprire di più sull'AI nella robotica e sulla computer vision in agricoltura. Scopri le nostre opzioni di licenza e inizia a sviluppare con la computer vision oggi stesso!

Explore solutions

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Esplorazione dell'apprendimento supervisionato vs non supervisionato nella computer vision

Link to this sectionCome gli approcci di apprendimento AI potenziano la computer vision#

Link to this sectionUno sguardo all'utilizzo dei modelli di apprendimento supervisionato nella computer vision#

Link to this sectionComprendere la necessità di modelli di apprendimento non supervisionato nella visione AI#

Link to this sectionCome funziona l'apprendimento non supervisionato nella computer vision#

Link to this sectionApprendimento auto-supervisionato e semi-supervisionato nella computer vision#

Link to this sectionDifferenze chiave tra apprendimento supervisionato e non supervisionato#

Link to this sectionQuando utilizzare l'apprendimento supervisionato nella computer vision#

Link to this sectionEsempi reali di computer vision supervisionata#

Link to this sectionQuali tipi di problemi nella computer vision può risolvere l'apprendimento non supervisionato#

Link to this sectionEsempi reali di apprendimento non supervisionato nella computer vision#

Link to this sectionLimitazioni pratiche dell'apprendimento supervisionato e non supervisionato#

Link to this sectionPunti chiave#

Explore solutions

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

Costruiamo insieme il futuro dell'AI!