Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Stima della profondità

Scoprite come la stima della profondità crea mappe di profondità da immagini stereo, ToF, LiDAR e deep learning monoculare per alimentare robotica, AR/VR e percezione 3D.

La stima della profondità è un'attività fondamentale della computer vision che prevede il calcolo della distanza dei vari oggetti in una scena dal punto di vista di una telecamera. A differenza delle immagini 2D standard che catturano solo l'altezza e la larghezza, la stima della profondità aggiunge una terza dimensione, consentendo a un sistema di percepire il mondo in 3D. Questo processo genera una mappa di profondità, che è essenzialmente un'immagine in cui il valore di ogni pixel corrisponde alla sua distanza dalla telecamera. Questa capacità è fondamentale per consentire alle macchine di comprendere le relazioni spaziali e interagire con l'ambiente in modo più significativo, simile alla visione umana.

Come funziona la stima della profondità

Esistono diverse tecniche per ottenere la stima della profondità, dai metodi tradizionali che utilizzano hardware specializzato agli approcci moderni basati sul deep learning.

  • Visione stereo: Questo metodo imita la visione binoculare umana utilizzando due telecamere poste a breve distanza l'una dall'altra. Analizzando le lievi differenze (disparità) tra le due immagini, è possibile triangolare la distanza dei punti della scena. Si tratta di un approccio classico e affidabile per acquisire informazioni sulla profondità.
  • Telecamere a tempo di volo (ToF): Questi sensori specializzati emettono un segnale luminoso (di solito a infrarossi) e misurano il tempo impiegato dalla luce per rimbalzare su un oggetto e tornare al sensore. Le telecamere ToF possono creare mappe di profondità molto accurate in tempo reale.
  • LiDAR (Light Detection and Ranging): Spesso utilizzato nei veicoli autonomi, il LiDAR funziona emettendo impulsi laser e misurandone il tempo di ritorno per creare una nuvola di punti 3D dettagliata dell'ambiente circostante. La tecnologia LiDAR fornisce dati precisi sulla profondità, rendendola preziosa per una navigazione sicura.
  • Stima della profondità monoculare: Un progresso significativo nell'IA riguarda la stima della profondità da una singola immagine 2D. I modelli di apprendimento profondo, in particolare le reti neurali convoluzionali (CNN), sono addestrati su vasti set di dati per dedurre gli indizi di profondità da texture, ombreggiature e dimensioni degli oggetti, proprio come fa il cervello umano.

Applicazioni della stima della profondità

La capacità di percepire la profondità è fondamentale per un'ampia gamma di applicazioni che richiedono consapevolezza spaziale.

Nella robotica, la stima della profondità è fondamentale per la navigazione e la manipolazione. Un robot industriale in una catena di montaggio utilizza i dati di profondità per afferrare e spostare con precisione gli oggetti, migliorando l'efficienza dell'automazione produttiva. Allo stesso modo, un robot mobile utilizza una mappa di profondità per evitare gli ostacoli e pianificare il proprio percorso in un ambiente dinamico come un magazzino. Questa percezione 3D consente un'interazione precisa e sicura con il mondo fisico.

La Realtà Aumentata (AR) e la Realtà Virtuale (VR) si basano molto sulla stima della profondità per creare esperienze immersive. Affinché un'applicazione AR su smartphone possa posizionare un mobile virtuale in una stanza reale, deve prima comprendere la geometria della stanza. Creando una mappa dettagliata della profondità, il sistema può garantire che l'oggetto virtuale si occluda e interagisca realisticamente con gli oggetti del mondo reale, rendendo l'illusione perfetta e credibile.

Stima della profondità e concetti correlati

È importante distinguere la stima della profondità da termini simili nella computer vision.

  • Calcolo della distanza: Sebbene sia correlato, il calcolo della distanza nella computer vision si riferisce spesso alla misurazione della distanza tra due oggetti all'interno di un piano di immagine 2D (cioè in pixel). La stima della profondità, invece, misura la distanza degli oggetti nello spazio 3D dalla telecamera stessa. Mentre una semplice distanza calibrata può essere sufficiente per alcuni compiti, la stima della profondità fornisce informazioni spaziali più dettagliate.
  • Rilevamento di oggetti 3D: La stima della profondità è un fattore chiave per il rilevamento di oggetti 3D. Mentre il rilevamento di oggetti 2D disegna un riquadro di delimitazione intorno a un oggetto su un'immagine piatta, il rilevamento di oggetti 3D posiziona un cuboide 3D intorno all'oggetto, definendone la posizione, le dimensioni e l'orientamento nello spazio tridimensionale. Questo rilevamento avanzato è possibile solo con informazioni precise sulla profondità.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti