Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024

Integrazione della computer vision nella robotica con Ultralytics YOLO11

Abirami Vina

5 minuti di lettura

18 marzo 2025

Osserva più da vicino come i modelli di computer vision come Ultralytics YOLO11 stanno rendendo i robot più intelligenti e plasmando il futuro della robotica.

I robot hanno fatto molta strada dai tempi di Unimate, il primo robot industriale, inventato negli anni '50. Ciò che è iniziato come macchine pre-programmate e basate su regole si è ora evoluto in sistemi intelligenti in grado di svolgere compiti complessi e interagire senza problemi con il mondo reale. 

Oggi, i robot vengono utilizzati in tutti i settori, dalla produzione all'assistenza sanitaria, all'agricoltura, per diverse automazioni di processo. Un fattore chiave nell'evoluzione della robotica è l'IA e la computer vision, una branca dell'IA che aiuta le macchine a comprendere e interpretare le informazioni visive.

Ad esempio, i modelli di computer vision come Ultralytics YOLO11 stanno migliorando l'intelligenza dei sistemi robotici. Quando integrata in questi sistemi, la Vision AI consente ai robot di riconoscere gli oggetti, navigare negli ambienti e prendere decisioni in tempo reale.

In questo articolo, daremo un'occhiata a come YOLO11 può migliorare i robot con funzionalità avanzate di computer vision ed esploreremo le sue applicazioni in vari settori.

Una panoramica dell'AI e della computer vision nella robotica

La funzionalità principale di un robot dipende da quanto bene comprende l'ambiente circostante. Questa consapevolezza connette l'hardware fisico al processo decisionale intelligente. Senza di essa, i robot possono solo seguire istruzioni fisse e hanno difficoltà ad adattarsi agli ambienti che cambiano o a gestire compiti complessi. Proprio come gli esseri umani si affidano alla vista per orientarsi, i robot utilizzano la computer vision per interpretare il loro ambiente, comprendere la situazione e intraprendere le azioni appropriate.

__wf_reserved_inherit
Fig. 1. Un robot che gioca a Tris utilizzando la computer vision per interpretare il tabellone ed effettuare mosse strategiche.

Infatti, la computer vision è fondamentale per la maggior parte delle attività robotiche. Aiuta i robot a rilevare oggetti ed evitare ostacoli mentre si muovono. Tuttavia, per farlo, non è sufficiente vedere il mondo; i robot devono anche essere in grado di reagire rapidamente. In situazioni reali, anche un leggero ritardo può portare a errori costosi. Modelli come Ultralytics YOLO11 consentono ai robot di raccogliere informazioni in tempo reale e rispondere istantaneamente, anche in situazioni complesse o sconosciute.

Introduzione a Ultralytics YOLO11

Prima di esaminare come YOLO11 può essere integrato nei sistemi robotici, esploriamo innanzitutto le caratteristiche chiave di YOLO11.

I modelli Ultralytics YOLO supportano varie attività di computer vision che aiutano a fornire informazioni rapide e in tempo reale. In particolare, Ultralytics YOLO11 offre prestazioni più veloci, costi computazionali inferiori e una maggiore precisione. Ad esempio, può essere utilizzato per rilevare oggetti in immagini e video con elevata precisione, rendendolo perfetto per applicazioni in settori come la robotica, la sanità e la produzione. 

Ecco alcune caratteristiche di grande impatto che rendono YOLO11 un'ottima opzione per la robotica:

  • Facilità di implementazione: È facile da implementare e si integra perfettamente con un'ampia gamma di piattaforme software e hardware.
  • Adattabilità: YOLO11 funziona bene in diversi ambienti e configurazioni hardware, offrendo prestazioni costanti anche in condizioni dinamiche.

Facile da usare: La documentazione e l'interfaccia di facile comprensione di YOLO11 aiutano a ridurre la curva di apprendimento, rendendola semplice da integrare nei sistemi robotici.

__wf_reserved_inherit
Fig. 2. Un esempio di analisi della posa di persone in un'immagine utilizzando YOLO11.

Esplorazione delle attività di computer vision abilitate da YOLO11

Ecco uno sguardo più da vicino ad alcune delle attività di computer vision supportate da YOLO11: 

  • Object detection: La capacità di object detection in tempo reale di YOLO11 consente ai robot di identificare e localizzare istantaneamente gli oggetti all'interno del loro campo visivo. Ciò aiuta i robot a evitare ostacoli, eseguire la pianificazione dinamica del percorso e ottenere la navigazione automatizzata sia in ambienti interni che esterni.
  • Segmentazione di istanza: Identificando i confini e le forme esatte dei singoli oggetti, YOLO11 consente ai robot di eseguire operazioni precise di prelievo e posizionamento e complesse attività di assemblaggio.
  • Stima della posa: Il supporto di YOLO11 per la stima della posa consente ai robot di riconoscere e interpretare i movimenti e i gesti del corpo umano. È fondamentale per i robot collaborativi (cobot) per lavorare in sicurezza a fianco degli umani.
  • Object tracking: YOLO11 rende possibile tracciare oggetti in movimento nel tempo, rendendolo ideale per applicazioni relative alla robotica autonoma che necessitano di monitorare l'ambiente circostante in tempo reale.
  • Classificazione delle immagini: YOLO11 può classificare oggetti nelle immagini, consentendo ai robot di categorizzare elementi, rilevare anomalie o prendere decisioni in base ai tipi di oggetti, come l'identificazione di forniture mediche in ambito sanitario.
__wf_reserved_inherit
Fig. 3. Attività di computer vision supportate da YOLO11.

IA nelle applicazioni di robotica: Potenziato da YOLO11

Dall'apprendimento intelligente all'automazione industriale, modelli come YOLO11 possono contribuire a ridefinire le capacità dei robot. La sua integrazione nella robotica dimostra come i modelli di computer vision stiano guidando i progressi nell'automazione. Esploriamo alcuni ambiti chiave in cui YOLO11 può avere un impatto significativo.

Insegnare ai robot usando la computer vision 

La computer vision è ampiamente utilizzata nei robot umanoidi, consentendo loro di apprendere osservando il loro ambiente. Modelli come YOLO11 possono aiutare a migliorare questo processo fornendo rilevamento avanzato di oggetti e stima della posa, il che aiuta i robot a interpretare accuratamente le azioni e i comportamenti umani.

Analizzando movimenti e interazioni sottili in tempo reale, i robot possono essere addestrati a replicare compiti umani complessi. Questo permette loro di andare oltre le routine pre-programmate e imparare compiti, come usare un telecomando o un cacciavite, semplicemente osservando una persona.

__wf_reserved_inherit
Fig. 4. Un robot che imita le azioni di un umano.

Questo tipo di apprendimento può essere utile in diversi settori. Ad esempio, in agricoltura, i robot possono osservare i lavoratori umani mentre imparano compiti come piantare, raccogliere e gestire le colture. Copiando il modo in cui gli umani svolgono questi compiti, i robot possono adattarsi a diverse condizioni agricole senza dover essere programmati per ogni situazione.

Applicazioni relative alla robotica sanitaria

Allo stesso modo, nel settore sanitario, la computer vision sta diventando sempre più importante. Ad esempio, YOLO11 può essere utilizzato nei dispositivi medici per assistere i chirurghi in procedure complesse. Con funzionalità come l'object detection e la segmentazione delle istanze, YOLO11 può aiutare i robot a individuare le strutture interne del corpo, a gestire gli strumenti chirurgici e a effettuare movimenti precisi.

Anche se può sembrare qualcosa di fantascientifico, recenti ricerche dimostrano l'applicazione pratica della computer vision nelle procedure chirurgiche. In un interessante studio sulla dissezione robotica autonoma per colecistectomia (rimozione della cistifellea), i ricercatori hanno integrato YOLO11 per la segmentazione dei tessuti (classificazione e separazione di diversi tessuti in un'immagine) e il rilevamento dei keypoint degli strumenti chirurgici (identificazione di specifici punti di riferimento sugli strumenti). 

Il sistema è stato in grado di distinguere accuratamente tra diversi tipi di tessuto, anche quando i tessuti si deformavano (cambiavano forma) durante la procedura, e si è adattato dinamicamente a questi cambiamenti. Ciò ha permesso agli strumenti robotici di seguire percorsi di dissezione (taglio chirurgico) precisi.

Produzione intelligente e automazione industriale

I robot in grado di prelevare e posizionare oggetti svolgono un ruolo chiave nell'automatizzare le operazioni di produzione e nell'ottimizzare le catene di approvvigionamento. La loro velocità e precisione consentono loro di eseguire attività con un input umano minimo, come l'identificazione e lo smistamento degli articoli. 

Grazie alla precisa instance segmentation di YOLO11, i bracci robotici possono essere addestrati per rilevare e segmentare gli oggetti che si muovono su un nastro trasportatore, prelevarli accuratamente e posizionarli in posizioni designate in base al loro tipo e dimensione.

Ad esempio, i produttori di auto più importanti stanno utilizzando robot basati sulla visione per assemblare diverse parti dell'auto, migliorando la velocità e la precisione della catena di montaggio. Modelli di computer vision come YOLO11 possono consentire a questi robot di lavorare a fianco degli operatori umani, garantendo una perfetta integrazione dei sistemi automatizzati in ambienti di produzione dinamici. Questo progresso può portare a tempi di produzione più rapidi, meno errori e prodotti di qualità superiore.

__wf_reserved_inherit
Fig. 5. Un braccio robotico basato sulla visione artificiale che assembla un'auto.

Vantaggi dell'integrazione di Ultralytics YOLO11 nella robotica

YOLO11 offre diversi vantaggi chiave che lo rendono ideale per una perfetta integrazione nei sistemi di robotica autonoma. Ecco alcuni dei principali vantaggi:

  • Bassa latenza di inferenza: YOLO11 è in grado di fornire previsioni estremamente accurate con bassa latenza, anche in ambienti dinamici.
  • Modelli leggeri: Progettati per l'ottimizzazione delle prestazioni, i modelli leggeri di YOLO11 consentono a robot più piccoli con meno potenza di elaborazione di avere capacità di visione avanzate senza sacrificare l'efficienza.
  • Efficienza energetica: YOLO11 è progettato per essere efficiente dal punto di vista energetico, il che lo rende ideale per i robot alimentati a batteria che devono risparmiare energia pur mantenendo prestazioni elevate.

Limitazioni della Vision AI nella robotica

Sebbene i modelli di computer vision forniscano strumenti potenti per la visione robotica, ci sono alcune limitazioni da considerare quando li si integra in sistemi robotici del mondo reale. Alcune di queste limitazioni includono:

  • Raccolta dati costosa: L'addestramento di modelli efficaci per compiti specifici dei robot spesso richiede dataset ampi, diversificati e ben etichettati, che sono costosi da acquisire.
  • Variazioni ambientali: I robot lavorano in ambienti imprevedibili, dove fattori come le condizioni di illuminazione o gli sfondi disordinati possono influire sulle prestazioni dei modelli di visione.
  • Problemi di calibrazione e allineamento: Assicurarsi che i sistemi di visione siano correttamente calibrati e allineati con gli altri sensori del robot è fondamentale per prestazioni accurate e un disallineamento può portare a errori nel processo decisionale.

Il futuro dei progressi nella robotica e nell'IA

I sistemi di computer vision non sono solo strumenti per i robot di oggi, ma elementi costitutivi per un futuro in cui i robot possono operare autonomamente. Grazie alle loro capacità di rilevamento in tempo reale e al supporto per molteplici attività, sono perfetti per la robotica di nuova generazione.

Infatti, le attuali tendenze del mercato mostrano che la computer vision sta diventando sempre più essenziale nella robotica. I rapporti di settore evidenziano che la computer vision è la seconda tecnologia più utilizzata nel mercato globale della robotica AI. 

__wf_reserved_inherit
Fig. 6. Quota di mercato globale dei robot AI per tecnologia.

Punti chiave

Grazie alla sua capacità di elaborare dati visivi in tempo reale, YOLO11 può aiutare i robot a rilevare, identificare e interagire con l'ambiente circostante in modo più accurato. Questo fa un'enorme differenza in settori come la produzione, dove i robot possono collaborare con gli umani, e l'assistenza sanitaria, dove possono assistere in interventi chirurgici complessi. 

Con il continuo progresso della robotica, l'integrazione della computer vision in tali sistemi sarà fondamentale per consentire ai robot di gestire una vasta gamma di compiti in modo più efficiente. Il futuro della robotica si preannuncia promettente, con l'IA e la computer vision che guidano macchine ancora più intelligenti e adattabili.

Unisciti alla nostra community e controlla il nostro repository GitHub per saperne di più sui recenti sviluppi nell'IA. Esplora le varie applicazioni dell'IA nel settore sanitario e della computer vision in agricoltura nelle nostre pagine delle soluzioni. Dai un'occhiata ai nostri piani di licenza per costruire le tue soluzioni di computer vision.

Costruiamo insieme il futuro
dell'AI!

Inizia il tuo viaggio con il futuro del machine learning

Inizia gratis
Link copiato negli appunti