Come calcolare la distanza utilizzando modelli di visione computerizzata?

Abirami Vina

4 minuti di lettura

3 aprile 2025

Scoprite come il calcolo della distanza nelle applicazioni di visione computerizzata con Ultralytics YOLO11 aiuta a misurare la vicinanza degli oggetti in tempo reale.

Quando si attraversa la strada e si vede un'auto che viene verso di noi, si capisce immediatamente quanto è lontana. Questo giudizio rapido, quasi istintivo, è dovuto alla comprensione spaziale dell'ambiente circostante. In base a questa percezione, si può decidere se accelerare, fermarsi o continuare a camminare. 

Analogamente, la computer vision è una branca dell'intelligenza artificiale (AI) che consente alle macchine di sviluppare una comprensione dell'ambiente circostante interpretando i dati visivi. Proprio come si può valutare la vicinanza di un'auto per prendere decisioni rapide, i modelli di computer vision possono analizzare immagini e video, aiutando le macchine a percepire e reagire al mondo che le circonda.

Ad esempio, Ultralytics YOLO11 è un modello di visione computerizzata in grado di rilevare e tracciare oggetti in immagini e video in tempo reale. In parole povere, YOLO11 lavora esaminando l'intera immagine in una volta sola, anziché in parti, il che lo rende più veloce ed efficiente. È inoltre in grado di gestire compiti di computer vision come la segmentazione delle istanze, la stima della posa e la classificazione delle immagini.

In particolare, le capacità di YOLO11 possono essere utilizzate per calcolare la distanza tra gli oggetti, utile in molti settori come la produzione, la vendita al dettaglio e la gestione delle folle, contribuendo a migliorare la sicurezza e l'efficienza.

In questo articolo analizzeremo come YOLO11 può essere utilizzato per il calcolo della distanza nelle applicazioni di computer vision, perché è importante e il suo impatto in diversi settori.

__wf_reserved_inherit
Figura 1. Esempio di utilizzo di YOLO per il calcolo della distanza di atterraggio di un aereo.

Una panoramica sul calcolo della distanza nella visione artificiale

Il calcolo della distanza nella computer vision implica il rilevamento, la localizzazione e la misurazione dei pixel tra due oggetti in un'immagine. I pixel sono le singole unità che compongono un'immagine digitale, ognuna delle quali rappresenta un singolo punto con uno specifico colore o valore di intensità. 

Per convertire le misure dei pixel in distanze reali, la calibrazione è fondamentale. È come usare un righello per misurare qualcosa e poi usare quella misura per capire le dimensioni di altri oggetti. Facendo riferimento a oggetti di dimensioni note, la calibrazione crea un collegamento tra i pixel e le distanze fisiche reali.

Vediamo un esempio per capire come funziona. Nell'immagine sottostante, la moneta è l'oggetto di riferimento e le sue dimensioni (0,9 pollici per 1,0 pollici) sono note. Confrontando le misure dei pixel degli altri oggetti con le dimensioni della moneta, possiamo calcolare le loro dimensioni reali.

__wf_reserved_inherit
Figura 2. Una moneta può essere usata come riferimento per misurare le dimensioni reali di altri oggetti.

Tuttavia, il calcolo della distanza avviene su un piano bidimensionale (2D), cioè misura solo le distanze orizzontali e verticali tra gli oggetti. Ciò è diverso dalla stima della profondità, che misura la distanza degli oggetti nello spazio tridimensionale, compresa la loro distanza dalla telecamera.

Sebbene le telecamere di profondità possano misurare la profondità reale e fornire informazioni spaziali più dettagliate, in molti casi è sufficiente una semplice distanza calibrata. Ad esempio, sapere a che distanza si trovano gli oggetti in un piano 2D funziona bene per attività come il tracciamento degli oggetti o la gestione delle code, quindi la stima della profondità non è necessaria in queste situazioni.

Capire come funziona il calcolo della distanza con YOLO11

Vediamo quindi come calcolare la distanza tra due oggetti utilizzando il supporto di YOLO11 per il rilevamento e il tracciamento degli oggetti. Ecco la ripartizione:

  • Rilevamento e tracciamento degli oggetti: YOLO11 può essere utilizzato per rilevare gli oggetti riconoscendoli in un fotogramma e seguendone il movimento attraverso i fotogrammi di un video. Assegna un ID traccia univoco a ciascun oggetto, consentendo al sistema di monitorarne la posizione e il movimento nel corso del video.
  • Caselle di delimitazione: I riquadri di delimitazione vengono disegnati intorno agli oggetti rilevati in base ai risultati del rilevamento degli oggetti di YOLO11, che definiscono la loro posizione nell'immagine.
  • Selezione degli oggetti: È possibile selezionare due oggetti da mettere a fuoco e YOLO11 aggiorna i riquadri di delimitazione mentre gli oggetti si muovono in tempo reale.
  • Calcolo del centroide: I centroidi (i punti centrali dei riquadri di delimitazione dei due oggetti) vengono calcolati in base alle coordinate degli angoli dei riquadri di delimitazione, che rappresentano le posizioni degli oggetti.
  • Calcolo della distanza: I centroidi dei due oggetti possono essere utilizzati per calcolare la distanza euclidea tra di essi. La distanza euclidea è la distanza in linea retta tra due punti in un piano 2D, calcolata utilizzando le differenze nelle direzioni orizzontale e verticale. Fornisce la distanza tra i due oggetti in pixel.

È importante tenere presente che le distanze calcolate con questo metodo sono solo stime, poiché si basano su misurazioni di pixel 2D.

__wf_reserved_inherit
Figura 3. Utilizzo di Ultralytics YOLO per rilevare una persona e calcolare le distanze. 

L'impatto della stima della distanza YOLO

Considerando che il calcolo delle distanze con YOLO11 è una stima, ci si potrebbe chiedere: Dove può essere utilizzato e come può fare la differenza? 

Poiché per ottenere queste stime della distanza vengono utilizzate delle calibrazioni, esse sono sufficientemente precise da essere utili in molte situazioni pratiche. La stima della distanza di YOLO11 è particolarmente utile in ambienti dinamici, come i magazzini, dove gli oggetti sono in continuo movimento e sono necessarie regolazioni in tempo reale per mantenere il funzionamento regolare.

Un esempio interessante è l'utilizzo di YOLO11 per tracciare i colli su un nastro trasportatore e stimare la distanza tra di essi in tempo reale. Questo aiuta i responsabili del magazzino ad assicurarsi che i colli siano distanziati in modo corretto, evitando collisioni e facendo in modo che le cose funzionino senza intoppi. 

In questi casi, la distanza esatta non è sempre necessaria. In genere, si stabilisce un intervallo o una soglia per la distanza ottimale, quindi una stima funziona bene per questo tipo di applicazioni.

__wf_reserved_inherit
Figura 4. Rilevamento dei pacchetti con YOLO11 e calcolo della distanza tra di essi.

Calcolo della distanza nelle applicazioni di visione artificiale

Diverse applicazioni di computer vision possono trarre vantaggio dal calcolo della distanza tra gli oggetti utilizzando YOLO11. Nel settore della vendita al dettaglio, ad esempio, aiuta a migliorare la gestione delle code, tracciando le posizioni dei clienti in tempo reale. Ciò consente alle aziende di allocare meglio le risorse, ridurre i tempi di attesa e creare un'esperienza di acquisto più fluida. Regolando dinamicamente i livelli di personale e gestendo il flusso dei clienti, i negozi possono evitare il sovraffollamento e ottimizzare l'uso dello spazio.

Analogamente, nella gestione del traffico, la stima della distanza aiuta a monitorare la distanza tra i veicoli e ad analizzare i modelli di traffico. Questo può essere utilizzato per rilevare comportamenti pericolosi, come la coda, e regolare i segnali stradali per mantenere il traffico scorrevole. Può contribuire a rendere le strade più sicure, identificando potenziali problemi e migliorando la gestione complessiva del traffico in tempo reale.

__wf_reserved_inherit
Figura 5. Il calcolo della distanza abilitato dalla visione può essere utilizzato per monitorare il traffico.

Un altro utilizzo unico di questa tecnologia è avvenuto durante la pandemia di COVID-19, quando ha contribuito a promuovere la distanza sociale. In questo modo le persone si sono tenute a distanza di sicurezza negli spazi pubblici, nei negozi e negli ospedali, riducendo il rischio di diffusione del virus. 

Tracciando le distanze in tempo reale, è possibile inviare avvisi in caso di eccessiva vicinanza, rendendo più facile per le aziende e gli operatori sanitari reagire rapidamente e mantenere un ambiente più sicuro per tutti.

Pro e contro del calcolo della distanza nella visione artificiale

Dopo aver discusso alcune delle applicazioni del calcolo della distanza mediante la visione artificiale, ecco un'analisi più approfondita dei vantaggi che ne derivano:

  • Automazione: L'intelligenza artificiale di visione può automatizzare le attività di calcolo della distanza che altrimenti richiederebbero il tracciamento manuale, riducendo gli errori umani e i costi di manodopera e aumentando la produttività.
  • Ottimizzazione delle risorse: Conoscendo la distanza e la vicinanza approssimativa degli oggetti, è possibile ottimizzare le risorse (come il personale o i macchinari), riducendo gli sprechi e migliorando i flussi di lavoro.
  • Minima complessità di configurazione: Una volta impostati, i sistemi di calcolo della distanza basati sulla visione richiedono una manutenzione relativamente ridotta e un minore intervento umano rispetto ad altri sistemi che si basano su input manuali o su macchinari complessi.

Nonostante questi vantaggi, ci sono anche alcune limitazioni da tenere presenti quando si implementano questi sistemi. Ecco una rapida panoramica dei fattori chiave da considerare quando si tratta di calcolare la distanza con la visione artificiale:

  • Sensibilità ai fattori ambientali: L'accuratezza del calcolo della distanza può essere influenzata da condizioni di illuminazione, ombre, riflessi o ostruzioni, con conseguenti potenziali errori o incongruenze.
  • Privacy: L'utilizzo della computer vision per tracciare oggetti o persone può sollevare problemi di privacy, soprattutto in spazi pubblici o ambienti sensibili in cui potrebbero essere coinvolti dati personali.
  • Complessità in scenari con più oggetti: In ambienti con numerosi oggetti in movimento, il calcolo accurato delle distanze tra più oggetti contemporaneamente può generare confusione, soprattutto se questi sono vicini o si intersecano.

Punti di forza

Il calcolo della distanza tra gli oggetti con YOLO11 è una soluzione affidabile che può supportare il processo decisionale. È particolarmente utile in ambienti dinamici come i magazzini, la vendita al dettaglio e la gestione del traffico, dove tenere traccia della vicinanza degli oggetti può migliorare l'efficienza e la sicurezza. 

YOLO11 consente di automatizzare attività che normalmente richiederebbero uno sforzo manuale. Anche se ci sono alcune sfide, come la sensibilità ai fattori ambientali e le preoccupazioni per la privacy, i vantaggi, come l'automazione, la scalabilità e la facilità di integrazione, la rendono di grande impatto. Con il continuo miglioramento della computer vision, soprattutto in aree come il calcolo della distanza, è probabile che assisteremo a un vero e proprio cambiamento nel modo in cui le macchine interagiscono e comprendono l'ambiente circostante.

Unisciti alla nostra comunità! Esplorate il nostro repository GitHub per saperne di più su Vision AI. Se siete interessati a sfruttare la computer vision, date un'occhiata alle nostre opzioni di licenza. Scoprite come la computer vision nel settore sanitario migliora l'efficienza e l'impatto dell'IA in agricoltura visitando le nostre pagine dedicate alle soluzioni! 

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti