Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024

Sfruttare l'apprendimento per rinforzo in progetti di computer vision

Abirami Vina

5 minuti di lettura

5 giugno 2025

Scopri come il reinforcement learning nelle applicazioni di computer vision sta aiutando i sistemi a vedere, prendere decisioni e migliorare nelle applicazioni del mondo reale in vari settori.

Un modo semplice per spiegare l'intelligenza artificiale (AI) è che si tratta di un campo incentrato sulla ricreazione del modo in cui gli esseri umani pensano e imparano. Da qui nasce l'idea delle tecniche di apprendimento nell'AI, che sono diversi metodi che consentono alle macchine di migliorare le proprie prestazioni nel tempo, proprio come fanno le persone.

In precedenza, abbiamo esplorato le principali tecniche di apprendimento dell'IA, tra cui l'apprendimento supervisionato, non supervisionato, per rinforzo e transfer learning, e come ognuna di esse svolga un ruolo importante nell'aiutare i modelli di IA a elaborare le informazioni e a prendere decisioni.

Oggi esamineremo più da vicino l'apprendimento per rinforzo, una tecnica che insegna ai sistemi di intelligenza artificiale ad apprendere attraverso l'esperienza, interagendo con un ambiente e migliorando in base al feedback. In particolare, esploreremo come l'apprendimento per rinforzo può essere applicato alle applicazioni di computer vision - sistemi che consentono alle macchine di interpretare e comprendere le informazioni visive provenienti dal mondo.

Mettere insieme concetti come l'apprendimento per rinforzo e la visione artificiale sta aprendo nuove entusiasmanti possibilità ed è un'area di ricerca attiva. Consente ai sistemi di intelligenza artificiale di riconoscere ciò che vedono e prendere decisioni informate in base a tali informazioni visive. 

Cos'è l'apprendimento per rinforzo?

L'apprendimento per rinforzo è una branca del machine learning in cui un agente AI impara compiendo azioni e ricevendo feedback sotto forma di ricompense o penalità. L'obiettivo è capire quali azioni portano ai risultati migliori nel tempo.

Si può pensare all'apprendimento per rinforzo come all'addestramento di un cane. Quando un cane si siede su comando, gli si dà un premio. Dopo un po', il cane impara che sedersi porta a una ricompensa. Nell'apprendimento per rinforzo, l'agente o modello di IA è come il cane; l'ambiente è il mondo che lo circonda e la ricompensa lo aiuta a capire se ha fatto la mossa giusta.

Questo è diverso dall'apprendimento supervisionato, dove al modello AI vengono mostrati molti esempi delle risposte corrette. Ad esempio, al modello potrebbe essere mostrata l'immagine di un cane e gli viene detto: "Questo è un cane". 

L'apprendimento per rinforzo, d'altra parte, non si basa su dati etichettati. Invece, implica l'apprendimento provando diverse azioni e imparando dai risultati, proprio come giocare a un gioco e capire quali mosse ti aiutano a vincere.

__wf_reserved_inherit
Fig. 1. Apprendimento per rinforzo vs. apprendimento supervisionato.

L'apprendimento per rinforzo è fondamentale per le attività in cui le decisioni vengono prese passo dopo passo e ogni scelta cambia ciò che accade dopo. Questo tipo di apprendimento viene utilizzato nei videogiochi di strategia per rendere il gameplay più stimolante e coinvolgente per i giocatori.

Come funziona il reinforcement learning nelle soluzioni di IA

Considera come impari ad andare in bicicletta. All'inizio potresti cadere. Ma con la pratica, inizi a capire cosa ti aiuta a rimanere in equilibrio. Più vai in bicicletta, meglio diventi. Impari facendo, non solo sentendoti dire cosa fare.

L'apprendimento per rinforzo funziona in modo simile per l'IA. Impara attraverso l'esperienza, provando diverse azioni, osservando cosa succede e migliorando gradualmente la sua capacità di fare le scelte giuste nel tempo.

__wf_reserved_inherit
Fig. 2. Comprensione del funzionamento del reinforcement learning.

Ecco uno sguardo ad alcuni dei componenti chiave del reinforcement learning:

  • Agente: L'agente è colui che apprende o prende decisioni. Interagisce con l'ambiente intraprendendo azioni e mira a raggiungere un obiettivo specifico.
  • Ambiente: L'ambiente include tutto ciò con cui l'agente interagisce. Cambia in risposta alle azioni dell'agente e fornisce un feedback basato sui risultati.
  • Stato: Uno stato rappresenta un'istantanea della situazione corrente nell'ambiente. L'agente osserva lo stato per comprendere l'ambiente circostante e determinare quale azione intraprendere successivamente.
  • Azione: Un'azione è una mossa o una decisione presa dall'agente che influisce sull'ambiente. Ogni azione porta a un nuovo stato e può influenzare le ricompense future.
  • Ricompensa: Una ricompensa è semplicemente un feedback dall'ambiente che indica all'agente se la sua azione è stata vantaggiosa o meno. Le ricompense positive incoraggiano l'agente a ripetere le buone azioni, mentre le ricompense negative scoraggiano quelle cattive.
  • Policy: Una policy è la strategia di un agente per scegliere le azioni in base allo stato corrente. Nel tempo, l'agente perfeziona la sua policy per massimizzare le ricompense totali che può ottenere.

Utilizzando insieme questi componenti, l'apprendimento per rinforzo consente ai sistemi di IA di apprendere comportamenti efficaci attraverso tentativi ed errori continui. Ad ogni tentativo, l'agente diventa più bravo a selezionare azioni che portano a ricompense più elevate e risultati migliori.

Apprendimento per rinforzo nelle innovazioni della computer vision

La computer vision viene utilizzata per attività come il rilevamento di oggetti nelle immagini, la classificazione di ciò che è presente in un'immagine e la segmentazione di un'immagine in diverse parti. I modelli di computer vision come Ultralytics YOLO11 supportano tali attività e possono essere utilizzati per creare applicazioni di grande impatto in grado di raccogliere informazioni visive.  

Tuttavia, quando queste attività di Vision AI sono combinate con l'apprendimento per rinforzo, il risultato è una soluzione di IA che non si limita a vedere, ma impara anche ad agire in base alle informazioni visive e migliora nel tempo.

Un esempio interessante di apprendimento per rinforzo nelle applicazioni di computer vision è l'uso di robot nei magazzini. I robot dotati di telecamere e sistemi di computer vision possono analizzare l'ambiente circostante, rilevare dove si trova ogni articolo, identificarne la forma e le dimensioni e capire come è posizionato sullo scaffale.

Ogni volta che il robot tenta di raccogliere un oggetto, riceve un feedback: successo se l'oggetto viene raccolto correttamente o fallimento se cade. Nel tempo, il robot impara quali azioni funzionano meglio per i diversi oggetti. Invece di seguire una serie fissa di istruzioni, migliora continuamente attraverso l'esperienza.

__wf_reserved_inherit
Fig. 3. Un braccio robotico che utilizza l'AI visiva e l'apprendimento per rinforzo per raccogliere oggetti.

Applicazioni dell'apprendimento per rinforzo nella computer vision

Ora che abbiamo una migliore comprensione di cosa sia l'apprendimento per rinforzo e del suo ruolo nella computer vision, esaminiamo più da vicino alcuni esempi di dove l'apprendimento per rinforzo e la computer vision vengono utilizzati insieme.

Integrazione di Vision AI e apprendimento per rinforzo per veicoli più intelligenti

I veicoli autonomi possono fare affidamento sia sulla Vision AI per comprendere l'ambiente circostante, sia sull'apprendimento per rinforzo per prendere decisioni in base a ciò che vedono. Un ottimo esempio di questo in azione è AWS DeepRacer.

La AWS DeepRacer è un'auto da corsa completamente autonoma in scala 1/18 che impara a guidare utilizzando una telecamera e l'apprendimento per rinforzo. Invece di ricevere istruzioni su cosa fare, capisce le cose da sola provando, commettendo errori e imparando da essi.

La telecamera di questa minuscola auto funziona come un paio di occhi, catturando la pista davanti a sé. In base a ciò che vede, l'auto impara a sterzare e quanto velocemente andare. Ad ogni giro, migliora. Ad esempio, potrebbe imparare a fare curve più ampie o a rallentare prima delle curve strette imparando dai tentativi passati.

L'addestramento per DeepRacer inizia in un ambiente virtuale, dove il modello si esercita e perfeziona le sue capacità di guida. Una volta raggiunto un certo livello di prestazioni, tali competenze vengono trasferite a piste reali con auto fisiche. 

__wf_reserved_inherit
Fig 4. AWS DeepRacer utilizza la vision e il reinforcement learning per guidare autonomamente. Fonte dell'immagine: Amazon. 

Verso robot chirurgici autonomi

Un'area di ricerca entusiasmante che sta guadagnando attenzione è l'integrazione di Vision AI e apprendimento per rinforzo nella chirurgia robotica. Al momento, questa applicazione è ancora in gran parte teorica. I ricercatori stanno eseguendo simulazioni in ambienti virtuali.

Tuttavia, i primi esperimenti stanno mostrando risultati promettenti, suggerendo che i robot chirurgici potrebbero eventualmente eseguire procedure complesse e delicate con maggiore precisione, adattabilità e minima assistenza umana.

__wf_reserved_inherit
Fig 5. I robot chirurgici stanno diventando sempre più avanzati.

Ad esempio, immagina una situazione in cui un pezzo di garza deve essere sollevato con cura da un sito chirurgico. Un robot dotato di Vision AI analizzerebbe prima la scena, utilizzando la segmentazione per identificare la garza e i tessuti circostanti. 

L'apprendimento per rinforzo aiuterebbe quindi il robot chirurgico a decidere come affrontare il compito, determinando l'angolazione migliore per afferrare la garza, quanta pressione applicare e come sollevarla senza disturbare le aree sensibili vicine. Nel tempo e attraverso la pratica ripetuta in ambienti simulati, il robot potrebbe imparare a eseguire questi movimenti sottili e critici con crescente abilità e sicurezza.

Pro e contro del reinforcement learning nella Vision AI

L'apprendimento per rinforzo consente ai sistemi di Visione Artificiale di andare oltre il semplice riconoscimento e iniziare a prendere decisioni in base a ciò che vedono. Questo apre nuove possibilità in aree come la robotica, l'automazione e l'interazione in tempo reale. 

Ecco alcuni dei principali vantaggi dell'integrazione del reinforcement learning nei flussi di lavoro di Vision AI:

  • Minore dipendenza dai dati etichettati: Questi sistemi possono apprendere dall'interazione, quindi non necessitano di enormi set di dati etichettati per iniziare.
  • Gestisce meglio l'incertezza: L'apprendimento per rinforzo può gestire informazioni visive incomplete o rumorose regolando le azioni in base al feedback piuttosto che affidarsi solo a dati perfetti.
  • Supporta l'apprendimento a lungo termine: Aiuta i modelli a migliorare nel tempo imparando da sequenze di azioni, non solo da decisioni in un singolo passaggio.

D'altra parte, ecco alcune delle limitazioni dell'apprendimento per rinforzo da considerare:

  • Problema di attribuzione del merito: Può essere difficile per l'agente capire quali azioni specifiche hanno contribuito a un risultato finale, specialmente in lunghe sequenze di decisioni.
  • Rischio di esplorazione non sicura: Durante l'addestramento, l'agente può provare azioni non sicure o indesiderabili che non sarebbero accettabili in applicazioni del mondo reale come l'assistenza sanitaria o la guida autonoma.
  • Convergenza lenta: Può volerci molto tempo prima che il modello raggiunga effettivamente una buona performance, soprattutto per compiti complessi.

Punti chiave

L'apprendimento per rinforzo nei progetti di computer vision consente ai sistemi di intelligenza artificiale di comprendere l'ambiente circostante e imparare ad agire attraverso l'esperienza. Con modelli come Ultralytics YOLO11 che forniscono il rilevamento di oggetti in tempo reale, il sistema può prendere decisioni informate in base a ciò che vede.

Questo approccio va oltre i metodi tradizionali, consentendo all'IA di migliorare attraverso la sperimentazione e il feedback, invece di basarsi esclusivamente su dati etichettati. Supporta l'apprendimento continuo e aiuta a costruire sistemi di Vision AI più flessibili, adattivi e intelligenti, che migliorano nel tempo.

Unisciti alla nostra community in crescita. Visita il nostro repository GitHub per approfondire la tua conoscenza dell'IA. Stai cercando di iniziare i tuoi progetti di computer vision? Esplora le nostre opzioni di licenza. Scopri di più sull'IA nel manufacturing e sulla Vision AI nel settore automobilistico nelle nostre pagine delle soluzioni.

Costruiamo insieme il futuro
dell'AI!

Inizia il tuo viaggio con il futuro del machine learning

Inizia gratis
Link copiato negli appunti