Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Vision AI

Esplorazione della computer vision nelle applicazioni di navigazione

Guarda come la computer vision nelle soluzioni di navigazione migliora la mappatura in tempo reale, il riconoscimento degli oggetti e la realtà aumentata per esperienze di viaggio più intelligenti e sicure.

ABAbirami Vina
5 min read
Computer vision nelle applicazioni di navigazione

Oggi, prendere il telefono, digitare una destinazione e seguire le indicazioni passo dopo passo per arrivarci sembra naturale. È un'operazione che richiede solo pochi secondi. Ma questa comodità quotidiana è il risultato di anni di progresso tecnologico. La navigazione ha fatto molta strada, dalle mappe cartacee e le bussole ai sistemi intelligenti in grado di comprendere e rispondere al mondo in tempo reale.

Una delle tecnologie alla base di questo cambiamento è la computer vision, un ramo dell'intelligenza artificiale (AI) che permette alle macchine di interpretare le informazioni visive proprio come fanno gli esseri umani. I moderni strumenti di navigazione utilizzano immagini in tempo reale provenienti da satelliti, dashcam e sensori a livello stradale per migliorare la precisione delle mappe, monitorare le condizioni del traffico e guidare gli utenti attraverso ambienti complessi.

In questo articolo esploreremo come la computer vision stia potenziando la navigazione, migliorando le mappe GPS, offrendo aggiornamenti sul traffico in tempo reale e supportando tecnologie come la navigazione in realtà aumentata e i veicoli autonomi.

Link to this sectionSistemi di navigazione AI con mappatura 3D immersiva#

Usare strumenti come Google Maps per orientarsi nella vita quotidiana è diventato molto comune, che tu stia attraversando la città o cercando un bar nelle vicinanze. Con la crescente adozione delle tecnologie AI, stiamo assistendo a funzionalità sempre più avanzate come la Immersive View, introdotta nel 2023 da Google Maps, che consente agli utenti di visualizzare in anteprima parti del proprio viaggio in un ambiente 3D. Ciò è reso possibile da una combinazione di AI, fotogrammetria e computer vision.

Immersive View di Google Maps

Fig 1. Immersive View di Google Maps.

Tutto ha inizio con miliardi di immagini ad alta risoluzione catturate da una serie di attrezzature specializzate. Questo include le auto di Street View, veicoli dotati di telecamere a 360 gradi che circolano per le città, e i dispositivi Trekker, zaini indossabili con fotocamere montate utilizzati per acquisire immagini in luoghi non raggiungibili dai veicoli, come sentieri escursionistici o vicoli stretti.

Queste immagini vengono allineate ai dati cartografici tramite la fotogrammetria, una tecnica che unisce foto 2D scattate da diverse angolazioni per creare modelli 3D accurati di strade, edifici e terreno.

La computer vision viene poi utilizzata per analizzare questi modelli tramite il rilevamento di oggetti e l'image segmentation per identificare ed etichettare caratteristiche importanti come segnali stradali, marciapiedi, strisce pedonali e ingressi di edifici.

Immersive View che utilizza la segmentazione per segmentare gli oggetti in una strada

Fig 2. Immersive View utilizza la segmentazione per distinguere gli oggetti su una strada.

I dati etichettati vengono utilizzati per addestrare sistemi AI che riconoscono come i segnali visivi differiscano tra le varie regioni. Ad esempio, il sistema può facilmente distinguere tra un segnale di "SLOW" (rallentare) negli Stati Uniti, che di solito è un rombo giallo o arancione, e un segnale simile in Giappone, che è solitamente un triangolo rosso e bianco. Questo livello di comprensione rende l'esperienza di navigazione più precisa e consapevole del contesto culturale.

Infine, Immersive View sovrappone i percorsi di navigazione dal vivo all'ambiente 3D, offrendo un'esperienza fluida e intuitiva che mostra esattamente dove sei diretto.

Link to this sectionRealtà aumentata nelle soluzioni di navigazione#

Probabilmente è capitato a tutti di girare in tondo cercando di capire in quale direzione Google Maps ci stia indicando di andare. Questa confusione è esattamente ciò che la navigazione in realtà aumentata (AR), una tecnologia che sovrappone informazioni digitali alla vista della telecamera del mondo reale, mira a risolvere. Sta cambiando il modo in cui le persone trovano la strada in luoghi affollati come le strade cittadine o le grandi aree interne.

Le mappe normali possono essere difficili da seguire, specialmente quando i segnali GPS sono deboli o non funzionano bene. La navigazione AR risolve questo problema mostrando indicazioni digitali, frecce ed etichette direttamente sulla vista della fotocamera in tempo reale del mondo circostante. Ciò significa che gli utenti vedono una guida che corrisponde alle strade e agli edifici intorno a loro, rendendo molto più facile sapere dove andare.

Link to this sectionCome viene utilizzata la realtà aumentata nella navigazione#

La navigazione AR si basa su computer vision models per comprendere l'ambiente attraverso la fotocamera di un dispositivo. Ciò comporta vari compiti come la localizzazione delle immagini, che rileva caratteristiche come i bordi degli edifici o i segnali stradali e li abbina a una mappa memorizzata. La SLAM (Simultaneous Localization and Mapping) crea una mappa dell'ambiente tracciando contemporaneamente la posizione del dispositivo in tempo reale.

Ad esempio, l'Aeroporto di Zurigo è stato il primo a implementare la funzione Live View di Google Maps per la navigazione indoor. I passeggeri possono utilizzare le fotocamere dei loro telefoni per vedere frecce e indicazioni sovrapposte all'ambiente reale, che li guidano attraverso i terminal fino ai gate, ai negozi e ai servizi. Ciò migliora l'esperienza del passeggero rendendo la navigazione in spazi interni complessi più semplice.

L'aeroporto di Zurigo utilizza la computer vision e la realtà aumentata per guidare i passeggeri al chiuso

Fig 3. L'Aeroporto di Zurigo utilizza la computer vision e la realtà aumentata per guidare i passeggeri all'interno.

Link to this sectionMigliorare la sicurezza stradale con i sistemi di navigazione AI#

Le strade cittadine diventano ogni giorno più trafficate. Con più auto in circolazione, marciapiedi affollati e un'attività costante, mantenere il traffico fluido e sicuro è una sfida crescente. Per aiutare a gestire il caos, molte città si stanno rivolgendo all'AI e alla computer vision.

Le smart cameras e i sensori installati agli incroci e lungo le strade catturano un flusso costante di dati visivi. Quel filmato viene elaborato in tempo reale per rilevare incidenti, monitorare il flusso del traffico, individuare buche e segnalare comportamenti come il parcheggio illegale o il comportamento rischioso dei pedoni.

Un esempio interessante è la Smart Airport Expressway di Hangzhou, in Cina. Questa autostrada di 20 chilometri, che collega il centro di Hangzhou all'Aeroporto Internazionale di Xiaoshan, è stata aggiornata con telecamere ad alta risoluzione e radar a onde millimetriche. Questi dispositivi raccolgono continuamente video e dati dai sensori, che vengono poi analizzati tramite la computer vision.

Piuttosto che limitarsi a registrare i filmati, il sistema interpreta ciò che accade sulla strada. Gli algoritmi di computer vision rilevano collisioni tra veicoli, riconoscono le violazioni del codice della strada e identificano persino pedoni o movimenti insoliti vicino alle uscite autostradali. Ciò consente ai responsabili del traffico di rispondere agli incidenti in pochi secondi, senza dover essere fisicamente sul posto.

I dati alimentano anche un gemello digitale (digital twin): un modello virtuale 3D in tempo reale dell'autostrada che mostra le condizioni del traffico attuali, i dettagli dei veicoli e la congestione emergente. Gli agenti del traffico monitorano questa interfaccia visiva per gestire il flusso, emettere avvisi intelligenti e rispondere agli incidenti in modo rapido e preciso.

Link to this sectionMobilità autonoma abilitata dalla computer vision nella navigazione#

Oggi la navigazione va ben oltre il semplice spostarsi dal punto A al punto B. È diventata una parte fondamentale di sistemi intelligenti che spostano persone, gestiscono merci e prendono decisioni in tempo reale, sia su strada che all'interno di magazzini.

Al centro di molti di questi sistemi c'è la computer vision, che consente alle macchine di interpretare i dati visivi e rispondere istantaneamente all'ambiente circostante. Analizziamo alcuni esempi per vedere come questa tecnologia stia trasformando la navigazione in diversi ambienti.

Link to this sectionRobot di magazzino che navigano con la computer vision#

Robot stanno diventando essenziali per il futuro della logistica, specialmente nelle operazioni di magazzino su larga scala. Con la crescita della domanda di e-commerce, le aziende si affidano sempre più a macchine basate sulla computer vision per navigare in ambienti complessi, smistare articoli e gestire l'inventario con velocità e precisione.

Prendi, ad esempio, i centri di distribuzione Amazon, dove oltre 750.000 robot lavorano a fianco degli esseri umani per mantenere efficienti le operazioni. Questi robot si affidano pesantemente alla computer vision per navigare nei trafficati piani dei magazzini, identificare gli articoli e prendere decisioni rapide e accurate.

Uno di questi sistemi è Sequoia, una piattaforma robotica progettata per velocizzare la gestione dell'inventario. Utilizza una computer vision avanzata per scansionare, contare e organizzare i prodotti in arrivo, contribuendo a semplificare i processi di stoccaggio e recupero.

Allo stesso modo, Vulcan, un braccio robotico, utilizza telecamere e analisi delle immagini per prelevare oggetti in sicurezza dagli scaffali, regolando la presa in base alla forma e alla posizione di ogni oggetto e riconoscendo persino quando è necessaria l'assistenza umana. Nel frattempo, Cardinal, un altro robot dotato di visione, è specializzato nello smistamento: scansiona cumuli misti di pacchi e li posiziona con precisione nei corretti carrelli in uscita.

Cardinal solleva con precisione i pacchi da una pila

Fig 4. Cardinal che solleva con precisione i pacchi da una pila.

Link to this sectionComputer vision nella navigazione dei veicoli autonomi#

Finora abbiamo visto come la computer vision aiuti sia le persone che i robot a navigare nei loro ambienti. Ma è altrettanto cruciale per i sistemi autonomi, come le auto a guida autonoma, dove la navigazione dipende interamente da ciò che il veicolo può vedere e comprendere in tempo reale.

Un buon esempio è il sistema Tesla Vision. Tesla ha adottato un approccio basato solo su telecamere per la guida autonoma, rimuovendo radar e altri sensori a favore di una rete di telecamere che fornisce una vista completa a 360 gradi dell'ambiente circostante l'auto. Queste telecamere alimentano i dati visivi nel computer del sistema Full Self-Driving (FSD), che utilizza reti neurali profonde per interpretare l'ambiente e prendere decisioni di guida in frazioni di secondo.

In base a ciò che vede, il sistema decide quando sterzare, accelerare, frenare o cambiare corsia, proprio come farebbe un guidatore umano, ma interamente attraverso input visivi. Tesla migliora continuamente questo sistema raccogliendo e imparando da enormi quantità di dati di guida nel mondo reale attraverso la sua flotta.

Tesla utilizza la computer vision per la navigazione autonoma

Fig 5. Tesla utilizza la computer vision per una navigazione sicura e autonoma (Fonte: Tesla).

Link to this sectionPro e contro della computer vision nella navigazione#

Ecco alcuni vantaggi chiave dell'utilizzo della computer vision nella navigazione, specialmente nei sistemi in cui la precisione, la sicurezza e il processo decisionale in tempo reale sono essenziali:

  • Riduce il consumo di carburante: Aiutando i conducenti a evitare il traffico e i percorsi con continui stop-and-go, la computer vision può ridurre il consumo complessivo di carburante e i tempi di viaggio, rendendo gli spostamenti quotidiani più efficienti.
  • Rileva l'usura stradale e i problemi infrastrutturali: Le soluzioni basate sulla visione possono scansionare buche, segnaletica stradale sbiadita, segnali danneggiati e infrastrutture deteriorate, fornendo ai team di manutenzione dati affidabili in tempo reale.
  • Si integra perfettamente con altri strumenti AI: La computer vision può essere combinata con assistenti vocali, modelli di previsione comportamentale o algoritmi di ottimizzazione dei percorsi per creare un'esperienza di navigazione altamente intelligente e personalizzata.

Sebbene la computer vision porti molti benefici alla navigazione, presenta anche alcune limitazioni importanti da considerare durante l'implementazione di tali soluzioni. Ecco alcune sfide chiave da tenere a mente:

  • Mancanza di generalizzazione: I modelli addestrati su ambienti o scenari specifici spesso faticano quando vengono distribuiti in contesti nuovi o mutevoli senza un nuovo addestramento.
  • Limitazioni di illuminazione: I sistemi di visione si basano su una buona illuminazione e condizioni meteorologiche chiare per funzionare bene. In caso di nebbia, pioggia intensa o oscurità, le loro prestazioni diminuiscono a meno che non siano combinati con sensori come LiDAR o radar.
  • Rischi per la privacy: i sistemi di navigazione che utilizzano telecamere possono riprendere persone e proprietà private senza consenso. Ciò solleva questioni di privacy che devono essere affrontate con attenzione durante lo sviluppo e la distribuzione.

Link to this sectionPunti chiave#

La computer vision sta reinventando la navigazione rendendo le mappe più dinamiche, i sistemi di traffico più intelligenti e la mobilità più accessibile. Quelli che un tempo erano percorsi statici sono ora esperienze interattive in tempo reale, alimentate da anteprime 3D immersive, indicazioni guidate da AR e tecnologie di trasporto autonomo.

Con l'avanzare della tecnologia, è probabile che l'attenzione si sposterà verso la creazione di sistemi più inclusivi, adattivi e responsabili. Il progresso continuo dipenderà dal miglioramento della precisione in ambienti diversi, dal mantenimento di prestazioni affidabili e dalla protezione della privacy degli utenti. Il futuro della computer vision nella navigazione risiede nella creazione di soluzioni che non siano solo intelligenti, ma anche attente nel loro design e impatto.

Unisciti alla nostra community in crescita! Esplora il nostro repository GitHub per saperne di più sull'AI e controlla le nostre opzioni di licenza per iniziare i tuoi progetti di vision AI. Ti interessano innovazioni come l'AI nel retail e la computer vision nell'agricoltura? Visita le nostre pagine dedicate alle soluzioni per scoprirne di più!

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning