Sfruttare l'apprendimento per rinforzo nei progetti di computer vision

Abirami Vina

5 minuti di lettura

5 giugno 2025

Scoprite come l'apprendimento per rinforzo nelle applicazioni di computer vision sta aiutando i sistemi a vedere, prendere decisioni e migliorare nelle applicazioni del mondo reale in tutti i settori.

Un modo semplice per spiegare l'intelligenza artificiale (IA) è che si tratta di un campo incentrato sulla ricreazione del modo in cui gli esseri umani pensano e imparano. Da qui nasce l'idea delle tecniche di apprendimento nell'IA, che sono metodi diversi che permettono alle macchine di migliorare le loro prestazioni nel tempo, proprio come fanno le persone.

In precedenza, abbiamo esplorato le principali tecniche di apprendimento dell'IA, tra cui l'apprendimento supervisionato, non supervisionato, di rinforzo e di trasferimento, e come ognuna di esse svolga un ruolo importante nell'aiutare i modelli di IA a elaborare le informazioni e a prendere decisioni.

Oggi daremo un'occhiata più da vicino all'apprendimento per rinforzo, una tecnica che insegna ai sistemi di intelligenza artificiale a imparare attraverso l'esperienza, interagendo con l'ambiente e migliorando in base al feedback. In particolare, analizzeremo come l'apprendimento per rinforzo possa essere applicato alle applicazioni di computer vision - sistemi che consentono alle macchine di interpretare e comprendere le informazioni visive del mondo.

L'unione di concetti come l'apprendimento per rinforzo e la visione computerizzata apre nuove possibilità ed è un'area di ricerca attiva. Consente ai sistemi di intelligenza artificiale di riconoscere ciò che vedono e di prendere decisioni informate sulla base di tali informazioni visive. 

Che cos'è l'apprendimento per rinforzo?

L'apprendimento per rinforzo è una branca dell'apprendimento automatico in cui un agente AI impara compiendo azioni e ricevendo un feedback sotto forma di premi o penalità. L'obiettivo è capire quali azioni portano ai risultati migliori nel tempo.

Si può pensare all'apprendimento per rinforzo come all'addestramento di un cane. Quando un cane si siede a comando, gli si dà un premio. Dopo un po' di tempo, il cane impara che stare seduto porta a una ricompensa. Nell'apprendimento per rinforzo, l'agente o modello di intelligenza artificiale è come il cane; l'ambiente è il mondo circostante e la ricompensa lo aiuta a capire se ha fatto la mossa giusta.

Questo è diverso dall'apprendimento supervisionato, in cui al modello AI vengono mostrati molti esempi di risposte corrette. Ad esempio, al modello potrebbe essere mostrata l'immagine di un cane e gli verrebbe detto: "Questo è un cane". 

L'apprendimento per rinforzo, invece, non si basa su dati etichettati. Si tratta invece di apprendere provando diverse azioni e imparando dai risultati, un po' come se si giocasse una partita e si capisse quali mosse aiutano a vincere.

__wf_reserved_inherit
Figura 1. Apprendimento per rinforzo vs. apprendimento supervisionato.

L'apprendimento per rinforzo è fondamentale per le attività in cui le decisioni vengono prese passo dopo passo e ogni scelta cambia ciò che accade dopo. Questo tipo di apprendimento viene utilizzato nei videogiochi di strategia per rendere il gioco più impegnativo e coinvolgente per i giocatori.

Come funziona l'apprendimento per rinforzo nelle soluzioni di IA

Pensate a come si impara ad andare in bicicletta. All'inizio si può cadere. Ma con la pratica si inizia a capire cosa aiuta a rimanere in equilibrio. Più si pedala, più si migliora. Si impara facendo, non solo sentendosi dire cosa fare.

L'apprendimento per rinforzo funziona in modo simile per l'intelligenza artificiale. Impara attraverso l'esperienza, provando azioni diverse, osservando ciò che accade e migliorando gradualmente la sua capacità di fare le scelte giuste nel corso del tempo.

__wf_reserved_inherit
Figura 2. Comprensione del funzionamento dell'apprendimento per rinforzo.

Ecco una panoramica di alcuni componenti chiave dell'apprendimento per rinforzo:

  • Agente: L'agente è colui che apprende o prende decisioni. Interagisce con l'ambiente compiendo azioni e mira a raggiungere un obiettivo specifico.
  • Ambiente: L'ambiente comprende tutto ciò con cui l'agente interagisce. Cambia in risposta alle azioni dell'agente e fornisce un feedback basato sui risultati.
  • Stato: Uno stato rappresenta un'istantanea della situazione attuale nell'ambiente. L'agente osserva lo stato per comprendere l'ambiente circostante e determinare le azioni successive.
  • Azione: Un'azione è una mossa o una decisione presa dall'agente che influisce sull'ambiente. Ogni azione porta a un nuovo stato e può influenzare le ricompense future.
  • Ricompensa: Una ricompensa è semplicemente un feedback dell'ambiente che indica all'agente se la sua azione è stata vantaggiosa o meno. Le ricompense positive incoraggiano l'agente a ripetere le azioni buone, mentre quelle negative scoraggiano quelle scarse.
  • Politica: Una politica è la strategia dell'agente per scegliere le azioni in base allo stato corrente. Nel corso del tempo, l'agente affina la sua politica per massimizzare le ricompense totali che può ottenere.

Utilizzando questi componenti insieme, l'apprendimento per rinforzo consente ai sistemi di intelligenza artificiale di apprendere comportamenti efficaci attraverso continui tentativi ed errori. A ogni tentativo, l'agente diventa più bravo a selezionare le azioni che portano a ricompense più alte e a risultati migliori.

Apprendimento per rinforzo nelle innovazioni della visione artificiale

La computer vision è utilizzata per compiti come il rilevamento di oggetti nelle immagini, la classificazione di ciò che è presente in un'immagine e la segmentazione di un'immagine in parti diverse. I modelli di visione artificiale come Ultralytics YOLO11 supportano questi compiti e possono essere utilizzati per creare applicazioni di grande impatto che raccolgono informazioni visive.  

Tuttavia, quando queste attività di Vision AI vengono combinate con l'apprendimento per rinforzo, il risultato è una soluzione AI che non si limita a vedere, ma impara anche ad agire sulla base delle intuizioni visive e migliora nel tempo.

Un esempio interessante di apprendimento per rinforzo nelle applicazioni di computer vision è l'uso dei robot nei magazzini. I robot dotati di telecamere e sistemi di visione computerizzata possono analizzare l'ambiente circostante, individuare la posizione di ogni articolo, identificarne la forma e le dimensioni e capire come è posizionato sullo scaffale.

Ogni volta che il robot tenta di raccogliere un oggetto, riceve un feedback: successo se l'oggetto viene raccolto correttamente o fallimento se viene fatto cadere. Con il tempo, il robot impara quali azioni funzionano meglio per i diversi oggetti. Invece di seguire un insieme fisso di istruzioni, migliora continuamente grazie all'esperienza.

__wf_reserved_inherit
Figura 3. Un braccio robotico che utilizza l'intelligenza artificiale della visione e l'apprendimento per rinforzo per raccogliere oggetti.

Applicazioni dell'apprendimento per rinforzo nella visione artificiale

Ora che abbiamo capito meglio cos'è l'apprendimento per rinforzo e il suo ruolo nella computer vision, vediamo alcuni esempi in cui l'apprendimento per rinforzo e la computer vision vengono utilizzati insieme.

Integrazione di Vision AI e apprendimento per rinforzo per veicoli più intelligenti

I veicoli autonomi possono affidarsi sia all'IA di visione per comprendere l'ambiente circostante sia all'apprendimento per rinforzo per prendere decisioni basate su ciò che vedono. Un ottimo esempio di questo tipo di applicazione è il DeepRacer di AWS.

AWS DeepRacer è un'auto da corsa in scala 1/18 completamente autonoma che impara a guidare utilizzando una telecamera e l'apprendimento per rinforzo. Invece di sentirsi dire cosa fare, capisce le cose da sola, provando, sbagliando e imparando da essi.

La telecamera di questa piccola auto funziona come un paio di occhi, catturando la pista davanti a sé. In base a ciò che vede, l'auto impara a sterzare e ad andare veloce. A ogni giro, migliora. Ad esempio, può imparare a percorrere curve più ampie o a rallentare prima delle curve strette, grazie alle esperienze precedenti.

L'addestramento del DeepRacer inizia in un ambiente virtuale, dove il modello si esercita e affina le sue capacità di guida. Una volta raggiunto un certo livello di prestazioni, tali abilità vengono trasferite su piste reali con auto fisiche. 

__wf_reserved_inherit
Figura 4. L'AWS DeepRacer utilizza la visione e l'apprendimento per rinforzo per guidare autonomamente. Fonte dell'immagine: Amazon. 

Verso robot chirurgici autonomi

Un'area di ricerca interessante che sta guadagnando attenzione è l'integrazione della Vision AI e dell'apprendimento per rinforzo nella chirurgia robotica. Al momento, questa applicazione è ancora in gran parte teorica. I ricercatori stanno eseguendo simulazioni in ambienti virtuali.

Tuttavia, i primi esperimenti stanno dando risultati promettenti, suggerendo che i robot chirurgici potrebbero in futuro eseguire procedure complesse e delicate con maggiore precisione, adattabilità e un intervento umano minimo.

__wf_reserved_inherit
Figura 5. I robot chirurgici stanno diventando sempre più avanzati.

Ad esempio, immaginiamo una situazione in cui un pezzo di garza debba essere sollevato con cura da un sito chirurgico. Un robot dotato di Vision AI analizzerebbe innanzitutto la scena, utilizzando la segmentazione per identificare la garza e i tessuti circostanti. 

L'apprendimento per rinforzo aiuterebbe quindi il robot chirurgico a decidere come affrontare il compito, determinando l'angolo migliore per afferrare la garza, la quantità di pressione da applicare e il modo in cui sollevarla senza disturbare le aree sensibili vicine. Con il tempo e la pratica ripetuta in ambienti simulati, il robot potrebbe imparare a eseguire questi movimenti sottili e critici con crescente abilità e sicurezza.

Pro e contro dell'apprendimento per rinforzo nell'IA della visione

L'apprendimento per rinforzo consente ai sistemi Vision AI di andare oltre il semplice riconoscimento e di iniziare a prendere decisioni basate su ciò che vedono. Questo apre nuove possibilità in settori come la robotica, l'automazione e l'interazione in tempo reale. 

Ecco alcuni dei principali vantaggi dell'integrazione dell'apprendimento per rinforzo nei flussi di lavoro di Vision AI:

  • Minore dipendenza da dati etichettati: Questi sistemi possono imparare dall'interazione, quindi non hanno bisogno di enormi set di dati etichettati per iniziare.
  • Gestisce meglio l'incertezza: L'apprendimento per rinforzo può gestire informazioni visive incomplete o rumorose regolando le azioni in base al feedback piuttosto che affidarsi solo a dati perfetti.
  • Supporta l'apprendimento a lungo termine: Aiuta i modelli a migliorare nel tempo, imparando da sequenze di azioni, non solo da singole decisioni.

D'altra parte, ecco alcuni limiti dell'apprendimento per rinforzo da considerare:

  • Problema dell'assegnazione dei crediti: può essere difficile per l'agente capire quali azioni specifiche hanno contribuito al risultato finale, specialmente in lunghe sequenze di decisioni.
  • Rischio di esplorazione non sicura: Durante l'addestramento, l'agente potrebbe tentare azioni non sicure o indesiderate che non sarebbero accettabili in applicazioni reali come la sanità o la guida autonoma.
  • Convergenza lenta: Può essere necessario molto tempo perché il modello raggiunga effettivamente buone prestazioni, soprattutto per compiti complessi.

Punti di forza

L'apprendimento per rinforzo nei progetti di computer vision consente ai sistemi di intelligenza artificiale di comprendere l'ambiente circostante e di imparare ad agire grazie all'esperienza. Con modelli come Ultralytics YOLO11 che forniscono il rilevamento degli oggetti in tempo reale, il sistema può prendere decisioni informate in base a ciò che vede.

Questo approccio va oltre i metodi tradizionali, consentendo all'IA di migliorare attraverso prove e feedback, invece di affidarsi esclusivamente a dati etichettati. Supporta l'apprendimento continuo e aiuta a costruire sistemi di IA di visione più flessibili, adattivi e intelligenti che migliorano nel tempo.

Unisciti alla nostra comunità in crescita. Visitate il nostro repository GitHub per approfondire il tema dell'intelligenza artificiale. Volete avviare i vostri progetti di computer vision? Esplorate le nostre opzioni di licenza. Per saperne di più sull'IA nella produzione e sull'IA di visione nell'industria automobilistica, consultate le nostre pagine dedicate alle soluzioni.

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti