Integrazione della visione artificiale nella robotica con Ultralytics YOLO11

Abirami Vina

5 minuti di lettura

18 marzo 2025

Scoprite come i modelli di visione artificiale come Ultralytics YOLO11 rendono i robot più intelligenti e danno forma al futuro della robotica.

I robot hanno fatto molta strada da Unimate, il primo robot industriale, inventato negli anni Cinquanta. Da macchine pre-programmate e basate su regole, oggi sono diventati sistemi intelligenti in grado di svolgere compiti complessi e di interagire perfettamente con il mondo reale. 

Oggi i robot vengono utilizzati in tutti i settori, da quello manifatturiero e sanitario a quello agricolo, per l'automazione di diversi processi. Un fattore chiave nell'evoluzione della robotica è l'IA e la computer vision, una branca dell'IA che aiuta le macchine a comprendere e interpretare le informazioni visive.

Ad esempio, modelli di visione artificiale come Ultralytics YOLO11 stanno migliorando l'intelligenza dei sistemi robotici. Se integrata in questi sistemi, la Vision AI consente ai robot di riconoscere gli oggetti, navigare negli ambienti e prendere decisioni in tempo reale.

In questo articolo vedremo come YOLO11 può migliorare i robot con funzionalità avanzate di visione computerizzata ed esploreremo le sue applicazioni in vari settori.

Una panoramica sull'IA e la computer vision nella robotica

La funzionalità principale di un robot dipende dalla capacità di comprendere l'ambiente circostante. Questa consapevolezza collega l'hardware fisico al processo decisionale intelligente. Senza di essa, i robot possono solo seguire istruzioni fisse e faticano ad adattarsi ad ambienti mutevoli o a gestire compiti complessi. Proprio come gli esseri umani si affidano alla vista per orientarsi, i robot utilizzano la visione computerizzata per interpretare l'ambiente, comprendere la situazione e intraprendere azioni appropriate.

__wf_reserved_inherit
Figura 1. Un robot che gioca una partita a Tic-Tac-Toe utilizzando la computer vision per interpretare il tabellone e fare mosse strategiche.

La computer vision è infatti fondamentale per la maggior parte delle attività robotiche. Aiuta i robot a rilevare gli oggetti e a evitare gli ostacoli durante gli spostamenti. Tuttavia, per farlo, non basta vedere il mondo: i robot devono anche essere in grado di reagire rapidamente. Nelle situazioni reali, anche un leggero ritardo può portare a costosi errori. Modelli come Ultralytics YOLO11 consentono ai robot di raccogliere informazioni in tempo reale e di reagire istantaneamente, anche in situazioni complesse o poco familiari.

Conoscere Ultralytics YOLO11

Prima di scoprire come YOLO11 può essere integrato nei sistemi robotici, analizziamo le caratteristiche principali di YOLO11.

I modelli Ultralytics YOLO supportano diverse attività di computer vision che consentono di ottenere informazioni rapide e in tempo reale. In particolare, Ultralytics YOLO11 offre prestazioni più veloci, costi di calcolo inferiori e una maggiore precisione. Ad esempio, può essere utilizzato per rilevare oggetti in immagini e video con un'elevata precisione, il che lo rende perfetto per applicazioni in campi come la robotica, la sanità e la produzione. 

Ecco alcune caratteristiche di grande impatto che rendono YOLO11 un'ottima opzione per la robotica:

  • Facilità di implementazione: È facile da distribuire e si integra perfettamente in un'ampia gamma di piattaforme software e hardware.
  • Adattabilità: YOLO11 funziona bene in diversi ambienti e configurazioni hardware, offrendo prestazioni costanti anche in condizioni dinamiche.

Facile da usare: la documentazione e l'interfaccia di facile comprensione di YOLO11 riducono la curva di apprendimento, rendendone semplice l'integrazione nei sistemi robotici.

__wf_reserved_inherit
Figura 2. Un esempio di analisi della posa delle persone in un'immagine utilizzando YOLO11.

Esplorazione dei compiti di computer vision abilitati da YOLO11

Ecco un'occhiata più da vicino ad alcuni dei compiti di computer vision supportati da YOLO11: 

  • Rilevamento dell'oggetto: La capacità di rilevamento degli oggetti in tempo reale di YOLO11 consente ai robot di identificare e localizzare istantaneamente gli oggetti nel loro campo visivo. Ciò consente ai robot di evitare gli ostacoli, di eseguire una pianificazione dinamica del percorso e di ottenere una navigazione automatizzata in ambienti interni ed esterni.
  • Segmentazione degli oggetti: Identificando i confini e le forme esatte dei singoli oggetti, YOLO11 consente ai robot di eseguire precise operazioni di pick-and-place e complesse attività di assemblaggio.
  • Stima della posa: Il supporto di YOLO11 per la stima della posa consente ai robot di riconoscere e interpretare i movimenti e i gesti del corpo umano. È fondamentale per i robot collaborativi (cobot) per lavorare in sicurezza accanto all'uomo.
  • Tracciamento dell'oggetto: YOLO11 consente di seguire gli oggetti in movimento nel tempo, rendendolo ideale per le applicazioni di robotica autonoma che devono monitorare l'ambiente circostante in tempo reale.
  • Classificazione delle immagini: YOLO11 è in grado di classificare gli oggetti nelle immagini, consentendo ai robot di classificare gli oggetti, rilevare le anomalie o prendere decisioni in base ai tipi di oggetti, come ad esempio l'identificazione di forniture mediche in ambienti sanitari.
__wf_reserved_inherit
Figura 3. Compiti di visione artificiale supportati da YOLO11.

L'intelligenza artificiale nelle applicazioni robotiche: Alimentato da YOLO11

Dall'apprendimento intelligente all'automazione industriale, modelli come YOLO11 possono contribuire a ridefinire le capacità dei robot. La sua integrazione nella robotica dimostra come i modelli di computer vision stiano guidando i progressi dell'automazione. Esploriamo alcuni settori chiave in cui YOLO11 può avere un impatto significativo.

Insegnare ai robot utilizzando la computer vision 

La computer vision è ampiamente utilizzata nei robot umanoidi, che possono imparare osservando l'ambiente circostante. Modelli come YOLO11 possono contribuire a migliorare questo processo, fornendo un rilevamento avanzato degli oggetti e una stima della posa, che aiuta i robot a interpretare con precisione le azioni e i comportamenti umani.

Analizzando i movimenti e le interazioni più sottili in tempo reale, i robot possono essere addestrati a replicare compiti umani complessi. Questo permette loro di andare oltre le routine pre-programmate e di imparare compiti come l'uso di un telecomando o di un cacciavite, semplicemente osservando una persona.

__wf_reserved_inherit
Figura 4. Un robot che imita un'azione umana.

Questo tipo di apprendimento può essere utile in diversi settori. In agricoltura, ad esempio, i robot possono osservare i lavoratori umani mentre imparano compiti come la semina, il raccolto e la gestione delle colture. Copiando il modo in cui gli esseri umani svolgono questi compiti, i robot possono adattarsi alle diverse condizioni agricole senza dover essere programmati per ogni situazione.

Applicazioni relative alla robotica sanitaria

Allo stesso modo, nel settore sanitario la computer vision sta diventando sempre più importante. Ad esempio, YOLO11 può essere utilizzato nei dispositivi medici per aiutare i chirurghi a eseguire procedure complesse. Grazie a funzioni come il rilevamento degli oggetti e la segmentazione delle istanze, YOLO11 può aiutare i robot a individuare le strutture interne del corpo, a gestire gli strumenti chirurgici e a eseguire movimenti precisi.

Sebbene possa sembrare qualcosa di fantascientifico, una recente ricerca dimostra l'applicazione pratica della computer vision nelle procedure chirurgiche. In un interessante studio sulla dissezione robotica autonoma per la colecistectomia (rimozione della cistifellea), i ricercatori hanno integrato YOLO11 per la segmentazione dei tessuti (classificazione e separazione dei diversi tessuti in un'immagine) e il rilevamento dei punti chiave degli strumenti chirurgici (identificazione di punti di riferimento specifici sugli strumenti). 

Il sistema è stato in grado di distinguere con precisione i diversi tipi di tessuto, anche quando questi si sono deformati (hanno cambiato forma) durante la procedura, e di adattarsi dinamicamente a questi cambiamenti. Ciò ha permesso agli strumenti robotici di seguire precisi percorsi di dissezione (taglio chirurgico).

Produzione intelligente e automazione industriale

I robot in grado di prelevare e posizionare gli oggetti svolgono un ruolo fondamentale nell'automazione delle operazioni di produzione e nell'ottimizzazione delle catene di fornitura. La loro velocità e precisione consente loro di svolgere attività con un minimo di input umano, come l'identificazione e lo smistamento degli articoli. 

Grazie alla precisa segmentazione delle istanze di YOLO11, i bracci robotici possono essere addestrati a rilevare e segmentare gli oggetti che si muovono su un nastro trasportatore, a raccoglierli con precisione e a collocarli in posizioni specifiche in base al loro tipo e alle loro dimensioni.

Ad esempio, le case automobilistiche più famose utilizzano robot basati sulla visione per assemblare diverse parti di automobili, migliorando la velocità e la precisione della catena di montaggio. I modelli di visione computerizzata come YOLO11 possono consentire a questi robot di lavorare a fianco degli operatori umani, garantendo una perfetta integrazione dei sistemi automatizzati in ambienti di produzione dinamici. Questo progresso può portare a tempi di produzione più rapidi, meno errori e prodotti di qualità superiore.

__wf_reserved_inherit
Figura 5. Un braccio robotico basato sulla visione che assembla un'automobile.

Vantaggi dell'integrazione di Ultralytics YOLO11 nella robotica

YOLO11 offre diversi vantaggi chiave che lo rendono ideale per una perfetta integrazione nei sistemi di robotica autonoma. Ecco alcuni dei principali vantaggi:

  • Bassa latenza di inferenza: YOLO11 è in grado di fornire previsioni altamente accurate con una bassa latenza, anche in ambienti dinamici.
  • Modelli leggeri: Progettati per ottimizzare le prestazioni, i modelli leggeri di YOLO11 consentono ai robot più piccoli con una minore potenza di elaborazione di disporre di funzionalità di visione avanzate senza sacrificare l'efficienza.
  • Efficienza energetica: YOLO11 è stato progettato per essere efficiente dal punto di vista energetico, il che lo rende ideale per i robot alimentati a batteria che devono risparmiare energia pur mantenendo prestazioni elevate.

Limiti dell'intelligenza artificiale della visione nella robotica

Sebbene i modelli di visione computerizzata forniscano strumenti potenti per la visione robotica, ci sono alcune limitazioni da considerare quando li si integra nei sistemi robotici del mondo reale. Alcune di queste limitazioni includono:

  • Raccolta dati costosa: L'addestramento di modelli efficaci per compiti specifici dei robot richiede spesso set di dati ampi, diversificati e ben etichettati, che sono costosi da acquisire.
  • Variazioni ambientali: I robot lavorano in ambienti imprevedibili, dove fattori come le condizioni di illuminazione o gli sfondi ingombrati possono influire sulle prestazioni dei modelli di visione.
  • Problemi di calibrazione e allineamento: Garantire che i sistemi di visione siano calibrati e allineati correttamente con gli altri sensori del robot è fondamentale per ottenere prestazioni precise, e un allineamento errato può portare a errori nel processo decisionale.

Il futuro dei progressi della robotica e dell'IA

I sistemi di visione computerizzata non sono solo strumenti per i robot di oggi, ma sono elementi costitutivi di un futuro in cui i robot potranno operare autonomamente. Grazie alle loro capacità di rilevamento in tempo reale e al supporto di molteplici compiti, sono perfetti per la robotica di prossima generazione.

In effetti, le attuali tendenze del mercato mostrano che la computer vision sta diventando sempre più essenziale nella robotica. I rapporti di settore evidenziano che la computer vision è la seconda tecnologia più utilizzata nel mercato globale della robotica AI. 

__wf_reserved_inherit
Figura 6. Quota di mercato globale dei robot AI per tecnologia.

Punti di forza

Grazie alla capacità di elaborare dati visivi in tempo reale, YOLO11 può aiutare i robot a rilevare, identificare e interagire con l'ambiente circostante in modo più accurato. Questo fa una grande differenza in campi come la produzione, dove i robot possono collaborare con gli esseri umani, e la sanità, dove possono assistere in interventi chirurgici complessi. 

Con il continuo progresso della robotica, l'integrazione della computer vision in questi sistemi sarà fondamentale per consentire ai robot di gestire in modo più efficiente un'ampia gamma di compiti. Il futuro della robotica è promettente: l'intelligenza artificiale e la computer vision saranno alla base di macchine sempre più intelligenti e adattabili.

Unitevi alla nostra comunità e consultate il nostro repository GitHub per saperne di più sui recenti sviluppi dell'IA. Esplorate le varie applicazioni dell'IA nella sanità e della computer vision in agricoltura nelle nostre pagine dedicate alle soluzioni. Scoprite i nostri piani di licenza per creare le vostre soluzioni di computer vision.

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti