Controllo verde
Link copiato negli appunti

Esplorare la computer vision nelle applicazioni di navigazione

Scopri come la computer vision nelle soluzioni di navigazione migliora la mappatura in tempo reale, il riconoscimento degli oggetti e la realtà aumentata per esperienze di viaggio più intelligenti e sicure.

Al giorno d'oggi, tirare fuori il telefono, digitare una destinazione e seguire le indicazioni passo-passo per raggiungerla è un'operazione che non richiede alcuno sforzo. È un'operazione che richiede solo pochi secondi. Ma questa comodità quotidiana è il risultato di anni di progressi tecnologici. La navigazione ha fatto molta strada, passando da mappe cartacee e bussole a sistemi intelligenti in grado di capire e rispondere al mondo in tempo reale.

Una delle tecnologie alla base di questo cambiamento è la computer vision, una branca dell'intelligenza artificiale (AI) che consente alle macchine di interpretare le informazioni visive come fanno gli esseri umani. Gli strumenti di navigazione più avanzati ora utilizzano immagini in tempo reale provenienti da satelliti, dashcam e sensori stradali per migliorare la precisione delle mappe, monitorare le condizioni stradali e guidare gli utenti in ambienti complessi.

In questo articolo analizzeremo come la computer vision stia migliorando la navigazione, migliorando le mappe GPS, offrendo aggiornamenti sul traffico in tempo reale e supportando tecnologie come la navigazione in realtà aumentata e i veicoli autonomi.

Sistemi di navigazione AI con mappatura 3D immersiva

L'utilizzo di strumenti come Google Maps per orientarsi nella vita quotidiana è diventato molto comune, sia che tu stia attraversando la città o cercando un caffè nelle vicinanze. Con l'adozione sempre più diffusa delle tecnologie AI, stiamo assistendo a funzionalità sempre più avanzate come la Vista Immersiva, introdotta nel 2023 da Google Maps, che consente agli utenti di visualizzare in anteprima parti del loro percorso in un ambiente 3D. Questo è possibile grazie a una combinazione di AI, fotogrammetria e computer vision.

Figura 1. Vista immersiva di Google Maps.

Tutto inizia con miliardi di immagini ad alta risoluzione catturate da una serie di apparecchiature specializzate. Tra queste ci sono le auto Street View, veicoli dotati di telecamere a 360 gradi che girano per le città, e i dispositivi Trekker, zaini indossabili con telecamere montate utilizzati per catturare immagini in luoghi non raggiungibili dai veicoli, come sentieri o vicoli stretti.

Queste immagini vengono allineate con i dati delle mappe grazie alla fotogrammetria, una tecnica che unisce foto 2D scattate da diverse angolazioni per creare modelli 3D accurati di strade, edifici e terreni.

La computer vision viene poi utilizzata per analizzare questi modelli utilizzando il rilevamento degli oggetti e la segmentazione delle immagini per identificare ed etichettare caratteristiche importanti come i segnali stradali, i marciapiedi, le strisce pedonali e gli ingressi degli edifici.

Figura 2. Immersive View utilizza la segmentazione per segmentare gli oggetti su una strada.

I dati etichettati vengono utilizzati per addestrare sistemi di intelligenza artificiale che riconoscono le differenze tra i segnali visivi nelle varie regioni. Ad esempio, il sistema è in grado di distinguere facilmente tra un cartello "SLOW" negli Stati Uniti, che di solito è un diamante giallo o arancione, e un cartello simile in Giappone, che di solito è un triangolo rosso e bianco. Questo livello di comprensione rende l'esperienza di navigazione più accurata e culturalmente consapevole.

Infine, Immersive View sovrappone i percorsi di navigazione in tempo reale all'ambiente 3D, offrendo un'esperienza fluida e intuitiva che mostra esattamente dove sei diretto.

La realtà aumentata nelle soluzioni di navigazione

Probabilmente tutti abbiamo provato a girare in tondo e a cercare di capire in quale direzione ci sta indicando Google Maps. Questa confusione è esattamente ciò che la navigazione in realtà aumentata (AR), una tecnologia che sovrappone informazioni digitali alla vista reale della telecamera, mira a risolvere. Sta cambiando il modo in cui le persone si orientano in luoghi affollati come le strade cittadine o le grandi aree interne. 

Le normali mappe possono essere difficili da seguire, soprattutto quando il segnale GPS è debole o non funziona bene. La navigazione AR affronta questo problema mostrando indicazioni digitali, frecce ed etichette direttamente sulla vista della telecamera del mondo reale. In questo modo gli utenti vedono indicazioni che corrispondono alle strade e agli edifici che li circondano, rendendo molto più facile sapere dove andare.

Come viene utilizzata la realtà aumentata nella navigazione

La navigazione AR si basa su modelli di computer vision per comprendere l'ambiente attraverso la fotocamera di un dispositivo. Ciò comporta varie attività come la localizzazione delle immagini, che rileva caratteristiche come i bordi degli edifici o i cartelli stradali e li confronta con una mappa memorizzata. La localizzazione e la mappatura simultanea (SLAM) creano una mappa dell'ambiente e al contempo tracciano la posizione del dispositivo in tempo reale.

Ad esempio, l'aeroporto di Zurigo è stato il primo a implementare il Live View di Google Maps per la navigazione interna. I passeggeri possono utilizzare le fotocamere dei loro telefoni per vedere frecce e indicazioni sovrapposte all'ambiente reale, guidandoli attraverso i terminal fino ai gate, ai negozi e ai servizi. Questo migliora l'esperienza dei passeggeri facilitando la navigazione in spazi interni complicati.

Figura 3. L'aeroporto di Zurigo utilizza la computer vision e l'AR per guidare i passeggeri all'interno.

Aumentare la sicurezza stradale con i sistemi di navigazione AI

Le strade cittadine sono ogni giorno più trafficate. Con un numero maggiore di auto in circolazione, marciapiedi affollati e un'attività costante, mantenere il traffico scorrevole e sicuro è una sfida crescente. Per aiutare a gestire il caos, molte città si stanno rivolgendo all'intelligenza artificiale e alla computer vision.

Le telecamere e i sensori intelligenti installati agli incroci e lungo le strade acquisiscono un flusso costante di dati visivi. Questi filmati vengono elaborati in tempo reale per rilevare gli incidenti, monitorare il flusso del traffico, individuare le buche e individuare situazioni come parcheggi illegali o comportamenti rischiosi dei pedoni.

Un esempio interessante è la Smart Airport Expressway di Hangzhou, in Cina. Questa autostrada di 20 chilometri, che collega il centro di Hangzhou all'aeroporto internazionale di Xiaoshan, è stata potenziata con telecamere ad alta risoluzione e radar a onde millimetriche. Questi dispositivi raccolgono continuamente dati video e sensori, che vengono poi analizzati grazie alla computer vision.

Invece di limitarsi a registrare i filmati, il sistema interpreta ciò che accade sulla strada. Gli algoritmi di visione computerizzata rilevano le collisioni tra veicoli, riconoscono le violazioni del traffico e identificano persino i pedoni o i movimenti insoliti in prossimità delle uscite autostradali. In questo modo i funzionari del traffico possono rispondere agli incidenti in pochi secondi, senza dover essere fisicamente sul posto.

I dati confluiscono anche in un gemello digitale: un modello virtuale in 3D della superstrada che mostra le condizioni del traffico in tempo reale, i dettagli dei veicoli e la congestione emergente. Gli addetti al traffico controllano questa interfaccia visiva per gestire il flusso, emettere avvisi intelligenti e rispondere agli incidenti in modo rapido e preciso.

Mobilità autonoma abilitata dalla computer vision nella navigazione 

Oggi la navigazione va ben oltre il semplice spostamento dal punto A al punto B. È ormai una parte fondamentale dei sistemi intelligenti che spostano le persone, gestiscono le merci e prendono decisioni in tempo reale, sia su strada che nei magazzini

Il cuore di molti di questi sistemi è la computer vision, che permette alle macchine di interpretare i dati visivi e di rispondere istantaneamente all'ambiente circostante. Vediamo alcuni esempi per capire come questa tecnologia sta trasformando la navigazione in diversi ambienti.

Robot da magazzino che navigano con la computer vision

I robot stanno diventando essenziali per il futuro della logistica, soprattutto nelle operazioni di magazzino su larga scala. Con la crescita della domanda di e-commerce, le aziende si affidano sempre più a macchine dotate di visione computerizzata per navigare in ambienti complessi, smistare gli articoli e gestire l'inventario con velocità e precisione.

Prendiamo ad esempio i centri di approvvigionamento di Amazon, dove oltre 750.000 robot lavorano a fianco degli esseri umani per mantenere le operazioni in modo efficiente. Questi robot si basano molto sulla visione computerizzata per navigare nei magazzini affollati, identificare gli articoli e prendere decisioni rapide e precise.

Uno di questi sistemi è Sequoia, una piattaforma robotica progettata per velocizzare la gestione dell'inventario. Utilizza una visione computerizzata avanzata per scansionare, contare e organizzare i prodotti in arrivo, aiutando a snellire i processi di stoccaggio e recupero. 

Allo stesso modo, Vulcan, un braccio robotico, utilizza telecamere e analisi delle immagini per prelevare gli articoli dagli scaffali in tutta sicurezza, regolando la presa in base alla forma e alla posizione di ogni oggetto e riconoscendo persino quando è necessaria l'assistenza umana. Nel frattempo, Cardinal, un altro robot dotato di visione, è specializzato nello smistamento: scansiona pile di pacchi misti e li colloca con precisione nei giusti carrelli in uscita.

Figura 4. Cardinale che solleva con precisione i pacchi da una pila.

La visione computerizzata nella navigazione autonoma dei veicoli

Finora abbiamo visto come la computer vision aiuti sia le persone che i robot a orientarsi nell'ambiente circostante. Ma è altrettanto fondamentale per i sistemi autonomi, come le auto a guida autonoma, dove la navigazione dipende interamente da ciò che il veicolo può vedere e capire in tempo reale.

Un buon esempio è il sistema Tesla Vision. Tesla ha adottato un approccio alla guida autonoma basato esclusivamente su telecamere, eliminando radar e altri sensori a favore di una rete di telecamere che forniscono una visione completa a 360 gradi dell'ambiente circostante l'auto. Queste telecamere inviano i dati visivi al computer Full Self-Driving (FSD), che utilizza reti neurali profonde per interpretare l'ambiente e prendere decisioni di guida in una frazione di secondo.

In base a ciò che vede, il sistema decide quando sterzare, accelerare, frenare o cambiare corsia, proprio come farebbe un guidatore umano, ma interamente attraverso input visivi. Tesla migliora continuamente questo sistema raccogliendo e imparando da enormi quantità di dati di guida reali in tutta la sua flotta.

Figura 5. Tesla utilizza la computer vision per una navigazione sicura e autonoma.

Pro e contro della computer vision nella navigazione

Ecco alcuni dei principali vantaggi dell'utilizzo della computer vision nella navigazione, in particolare nei sistemi in cui sono fondamentali l'accuratezza, la sicurezza e il processo decisionale in tempo reale:

  • Riduce il consumo di carburante: Aiutando i conducenti a evitare il traffico e le soste, la computer vision può ridurre il consumo complessivo di carburante e i tempi di viaggio, rendendo più efficienti gli spostamenti quotidiani.
  • Rileva l'usura delle strade e i problemi delle infrastrutture: Le soluzioni basate sulla visione sono in grado di scansionare buche, segnaletica stradale sbiadita, cartelli rotti e infrastrutture danneggiate, fornendo ai team di manutenzione dati affidabili e in tempo reale.
  • Si integra perfettamente con altri strumenti di intelligenza artificiale: La computer vision può essere combinata con assistenti vocali, modelli di previsione comportamentale o algoritmi di ottimizzazione del percorso per creare un'esperienza di navigazione altamente intelligente e personalizzata.

Se da un lato la computer vision apporta molti vantaggi alla navigazione, dall'altro comporta alcune importanti limitazioni da considerare quando si implementano queste soluzioni. Ecco alcune sfide chiave da tenere a mente:

  • Mancanza di generalizzazione: I modelli addestrati su ambienti o scenari specifici spesso faticano quando vengono impiegati in contesti nuovi o mutevoli senza un nuovo addestramento.
  • Limiti di illuminazione: I sistemi di visione si basano su una buona illuminazione e sul tempo sereno per funzionare bene. In caso di nebbia, pioggia battente o buio, le loro prestazioni diminuiscono a meno che non vengano combinati con sensori come LiDAR o radar.
  • Rischi per la privacy: I sistemi di navigazione che utilizzano telecamere possono riprendere persone e proprietà private senza consenso. Questo solleva problemi di privacy che devono essere affrontati con attenzione durante lo sviluppo e l'implementazione.

Punti di forza

La computer vision sta reinventando la navigazione rendendo le mappe più dinamiche, i sistemi di traffico più intelligenti e la mobilità più accessibile. Quelli che una volta erano percorsi statici ora sono esperienze interattive in tempo reale, grazie ad anteprime 3D immersive, indicazioni guidate in AR e tecnologie di trasporto autonomo.

Con il progredire della tecnologia, è probabile che l'attenzione si sposti verso la necessità di rendere questi sistemi più inclusivi, adattivi e responsabili. I continui progressi dipenderanno dal miglioramento della precisione in ambienti diversi, dal mantenimento di prestazioni affidabili e dalla protezione della privacy degli utenti. Il futuro della computer vision nella navigazione risiede nella creazione di soluzioni non solo intelligenti, ma anche attente alla progettazione e all'impatto.

Unisciti alla nostra comunità in crescita! Esplora il nostro repository GitHub per conoscere l'IA e scopri le nostre opzioni di licenza per avviare i tuoi progetti di Vision AI. Sei interessato a innovazioni come l'IA nella vendita al dettaglio e la computer vision in agricoltura? Visita le nostre pagine dedicate alle soluzioni per saperne di più!

Logo di LinkedInLogo di TwitterLogo di FacebookSimbolo di copia-link

Leggi tutto in questa categoria

Costruiamo insieme il futuro
di AI!

Inizia il tuo viaggio nel futuro dell'apprendimento automatico