Vision AI

Tipi di tecniche di apprendimento dell'AI utilizzate nella visione artificiale

Esplora i diversi tipi di tecniche di machine learning e deep learning utilizzate nelle applicazioni di visione artificiale, dall'apprendimento supervisionato al transfer learning.

ABAbirami Vina

4 min readNovember 6, 2024

Tipi di tecniche di apprendimento dell'AI utilizzate nella visione artificiale

Il machine learning è un tipo di intelligenza artificiale (IA) che aiuta i computer ad apprendere dai dati in modo che possano prendere decisioni autonomamente, senza bisogno di una programmazione dettagliata per ogni attività. Comporta la creazione di modelli algoritmici in grado di identificare pattern nei dati. Identificando pattern nei dati e apprendendo da essi, questi algoritmi possono migliorare gradualmente le loro prestazioni nel tempo.

Un ambito in cui il machine learning gioca un ruolo cruciale è la computer vision, un campo dell'IA che si concentra sui dati visivi. La computer vision utilizza il machine learning per aiutare i computer a rilevare e riconoscere pattern in immagini e video. Spinto dai progressi nel machine learning, il valore di mercato globale della computer vision è stimato intorno ai 175,72 miliardi di dollari entro il 2032.

In questo articolo, esamineremo i diversi tipi di machine learning utilizzati nella computer vision, inclusi l'apprendimento supervisionato, non supervisionato, per rinforzo e il transfer learning, e come ognuno di essi svolga un ruolo in diverse applicazioni. Iniziamo!

Link to this sectionPanoramica del machine learning nella computer vision#

La computer vision si basa sul machine learning, specialmente su tecniche come il deep learning e le reti neurali, per interpretare e analizzare le informazioni visive. Questi metodi rendono possibile per i computer eseguire attività di computer vision come rilevare oggetti nelle immagini, classificare immagini per categoria e riconoscere volti. Il machine learning è essenziale anche per applicazioni di computer vision in tempo reale, come il controllo qualità nella produzione e l' imaging medico nell' assistenza sanitaria. In questi casi, le reti neurali aiutano i computer a interpretare dati visivi complessi, come l'analisi di scansioni cerebrali per rilevare tumori.

Di fatto, molti modelli avanzati di computer vision, come Ultralytics YOLO11, sono costruiti su reti neurali.

Segmentazione di scansioni cerebrali tramite Ultralytics YOLO11

Fig 1. Segmentazione di scansioni cerebrali usando Ultralytics YOLO11.

Esistono diversi tipi di metodi di apprendimento nel machine learning, come l'apprendimento supervisionato, non supervisionato, transfer learning e apprendimento per rinforzo, che stanno spingendo i confini di ciò che è possibile nella computer vision. Nelle sezioni seguenti, esploreremo ognuno di questi tipi per capire come contribuiscono alla computer vision.

Link to this sectionEsplorazione dell'apprendimento supervisionato#

L'apprendimento supervisionato è il tipo di machine learning più comunemente utilizzato. Nell'apprendimento supervisionato, i modelli vengono addestrati utilizzando dati etichettati. Ogni input viene taggato con l'output corretto, il che aiuta il modello ad apprendere. Simile a uno studente che impara da un insegnante, questi dati etichettati fungono da guida o supervisore.

Durante l'addestramento, al modello vengono forniti sia dati di input (le informazioni che deve elaborare) che dati di output (le risposte corrette). Questa configurazione aiuta il modello ad apprendere la connessione tra input e output. L'obiettivo principale dell'apprendimento supervisionato è che il modello scopra una regola o un pattern che colleghi accuratamente ogni input al suo output corretto. Con questa mappatura, il modello può fare previsioni accurate quando incontra nuovi dati. Ad esempio, il riconoscimento facciale nella computer vision si basa sull'apprendimento supervisionato per identificare i volti in base a questi pattern appresi.

Un uso comune di ciò è lo sblocco del tuo smartphone con il riconoscimento facciale. Il modello viene addestrato su immagini etichettate del tuo volto in modo che, quando provi a sbloccare il telefono, confronti l'immagine dal vivo con ciò che ha appreso. Se rileva una corrispondenza, il telefono si sblocca.

Riconoscimento facciale utilizzato per sbloccare il tuo smartphone

Fig 2. Il riconoscimento facciale può essere utilizzato per sbloccare il tuo smartphone.

Link to this sectionCome funziona l'apprendimento non supervisionato nell'IA?#

L'apprendimento non supervisionato è un tipo di machine learning che utilizza dati non etichettati: al modello non viene fornita alcuna guida o risposta corretta durante l'addestramento. Invece, impara a scoprire pattern e intuizioni da solo.

L'apprendimento non supervisionato identifica pattern utilizzando tre metodi principali:

Clustering: raggruppa punti dati simili. È utile per attività come la segmentazione della clientela, dove clienti simili possono essere raggruppati in base ai loro comportamenti o attributi.
Associazione: viene utilizzata per identificare le relazioni tra gli elementi, aiutando a scoprire le connessioni all'interno dei dati (ad esempio, trovare prodotti spesso acquistati insieme nell'analisi del carrello).
Riduzione della dimensionalità: semplifica i set di dati rimuovendo caratteristiche ridondanti, il che aiuta nella visualizzazione e nell'elaborazione.

Un'applicazione chiave dell'apprendimento non supervisionato è la compressione delle immagini, dove tecniche come il k-means clustering riducono la dimensione dell'immagine senza influire sulla qualità visiva. I pixel vengono raggruppati in cluster e ogni cluster è rappresentato da un colore medio, risultando in un'immagine con meno colori e una dimensione del file più piccola.

Un esempio di compressione di immagini non supervisionata

Fig 3. Un esempio di compressione delle immagini non supervisionata.

However, unsupervised learning does face certain limitations. Without predefined answers, it can struggle with accuracy and performance evaluation. It often requires manual effort to interpret results and label groups, and it is sensitive to issues like missing values and noise, which can impact the quality of the results.

Link to this sectionSpiegazione dell'apprendimento per rinforzo#

A differenza dell'apprendimento supervisionato e non supervisionato, l'apprendimento per rinforzo non si basa su dati di addestramento. Invece, utilizza agenti basati su reti neurali per interagire con un ambiente al fine di raggiungere un obiettivo specifico.

Il processo coinvolge tre componenti principali:

Agente: lo studente o il decisore.
Ambiente: tutto ciò con cui l'agente interagisce, che può essere reale o virtuale.
Segnale di ricompensa: un valore numerico fornito dopo ogni azione, che guida l'agente verso l'obiettivo.

Mentre l'agente intraprende azioni, influisce sull'ambiente, che poi risponde con un feedback. Il feedback aiuta l'agente a valutare le sue scelte e ad adattare il suo comportamento. Il segnale di ricompensa aiuta l'agente a capire quali azioni lo avvicinano al raggiungimento del suo obiettivo.

L'apprendimento per rinforzo è fondamentale per casi d'uso come la guida autonoma e la robotica. Nella guida autonoma, attività come i controlli del veicolo, il rilevamento degli oggetti e l'evitamento apprendono in base al feedback. I modelli vengono addestrati utilizzando agenti di rete neurale per rilevare pedoni o altri oggetti e intraprendere azioni appropriate per evitare collisioni. Allo stesso modo, nella robotica, l'apprendimento per rinforzo abilita attività come la manipolazione di oggetti e il controllo del movimento.

Un ottimo esempio di apprendimento per rinforzo in azione è un progetto di OpenAI, in cui i ricercatori hanno addestrato agenti IA a giocare al popolare videogioco multiplayer, Dota 2. Utilizzando reti neurali, questi agenti hanno elaborato enormi quantità di informazioni dall'ambiente di gioco per prendere decisioni strategiche rapide. Attraverso un feedback continuo, gli agenti hanno appreso e migliorato nel tempo, raggiungendo infine un livello di abilità abbastanza alto da battere alcuni dei migliori giocatori del gioco.

Interpretazione umana contro quella dell'IA della Dota Matrix

Fig 4. Interpretazione umana vs IA della matrice di Dota.

Link to this sectionCapire le basi del transfer learning#

Il transfer learning è diverso dagli altri tipi di apprendimento. Invece di addestrare un modello da zero, utilizza un modello pre-addestrato su un grande dataset e lo perfeziona per un compito nuovo, ma correlato. La conoscenza acquisita durante l'addestramento iniziale viene utilizzata per migliorare le prestazioni del nuovo compito. Il transfer learning riduce il tempo necessario per l'addestramento per un nuovo compito, a seconda della sua complessità. Funziona mantenendo i livelli iniziali del modello che catturano le caratteristiche generali e sostituendo i livelli finali con quelli del nuovo compito specifico.

Il trasferimento dello stile artistico è un'interessante applicazione del transfer learning nella computer vision. Questa tecnica consente a un modello di trasformare un'immagine per adattarla allo stile di diverse opere d'arte. Per ottenere ciò, una rete neurale viene prima addestrata su un ampio dataset di immagini accoppiate ai loro stili artistici. Attraverso questo processo, il modello impara a identificare caratteristiche generali dell'immagine e pattern di stile.

Una volta addestrato il modello, può essere perfezionato per applicare lo stile di un dipinto specifico a una nuova immagine. La rete si adatta alla nuova immagine preservando le caratteristiche di stile apprese, permettendole di creare un risultato unico che combina il contenuto originale con lo stile artistico selezionato. Ad esempio, potresti scattare una foto di una catena montuosa e applicare lo stile de L'urlo di Edvard Munch, ottenendo un'immagine che cattura la scena ma con lo stile audace ed espressivo del dipinto.

Un esempio di trasferimento di stile artistico tramite transfer learning

Fig 5. Un esempio di trasferimento dello stile artistico usando il transfer learning.

Link to this sectionUno sguardo alle differenze tra i tipi di machine learning#

Ora che abbiamo coperto i principali tipi di machine learning, diamo un'occhiata più da vicino a ciascuno per aiutarti a capire la soluzione migliore per diverse applicazioni.

Apprendimento supervisionato: questo tipo è altamente accurato quando si lavora con dati etichettati, ma richiede molti dati e può essere sensibile al rumore.
Apprendimento non supervisionato: è utile per esplorare dati non etichettati alla ricerca di pattern nascosti, sebbene i risultati possano essere meno precisi e più difficili da interpretare.
Apprendimento per rinforzo: addestra gli agenti a prendere decisioni passo dopo passo in ambienti complessi, ma spesso richiede una potenza di calcolo significativa.
Transfer learning: questo approccio utilizza modelli pre-addestrati per velocizzare l'addestramento e migliorare le prestazioni su nuovi compiti, specialmente quando i dati sono limitati.

Un confronto tra tutti i tipi di machine learning

Fig 6. Un confronto di tutti i tipi di machine learning. Immagine dell'autore.

Scegliere il tipo di machine learning giusto dipende da diversi fattori. L'apprendimento supervisionato funziona bene se hai abbondanti dati etichettati e un compito chiaro. L'apprendimento non supervisionato è utile per l'esplorazione dei dati o quando gli esempi etichettati sono scarsi. L'apprendimento per rinforzo è ideale per compiti complessi che richiedono un processo decisionale passo dopo passo, mentre il transfer learning è ottimo quando i dati sono limitati o le risorse sono scarse. Considerando questi fattori, puoi selezionare l'approccio più adatto per il tuo progetto di computer vision.

Link to this sectionIn conclusione#

Le tecniche di machine learning possono affrontare una varietà di sfide, specialmente in aree come la computer vision. Comprendendo i diversi tipi, supervisionato, non supervisionato, per rinforzo e transfer learning, puoi scegliere l'approccio migliore per le tue esigenze.

L'apprendimento supervisionato è ottimo per compiti che richiedono un'elevata precisione e dati etichettati, mentre l'apprendimento non supervisionato è ideale per trovare pattern in dati non etichettati. L'apprendimento per rinforzo funziona bene in contesti complessi basati su decisioni, e il transfer learning è utile quando vuoi costruire su modelli pre-addestrati con dati limitati.

Ogni metodo ha punti di forza e applicazioni uniche, dal riconoscimento facciale alla robotica, fino al trasferimento dello stile artistico. Scegliere il tipo giusto può sbloccare nuove possibilità in settori come l'assistenza sanitaria, l'automotive e l'intrattenimento.

Per saperne di più, visita il nostro repository GitHub e interagisci con la nostra community. Esplora le applicazioni dell'AI nelle auto a guida autonoma e nell'agricoltura sulle nostre pagine delle soluzioni. 🚀

Explore solutions

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Tipi di tecniche di apprendimento dell'AI utilizzate nella visione artificiale

Link to this sectionPanoramica del machine learning nella computer vision#

Link to this sectionEsplorazione dell'apprendimento supervisionato#

Link to this sectionCome funziona l'apprendimento non supervisionato nell'IA?#

Link to this sectionSpiegazione dell'apprendimento per rinforzo#

Link to this sectionCapire le basi del transfer learning#

Link to this sectionUno sguardo alle differenze tra i tipi di machine learning#

Link to this sectionIn conclusione#

Explore solutions

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

AI nella Robotica

IA nella logistica

AI nel settore Retail

IA nel settore sanitario

IA nella produzione

AI nel settore automobilistico

AI in Agricoltura

Costruiamo insieme il futuro dell'AI!