Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Rilevamento di oggetti 3D

Esplora il rilevamento di oggetti 3D: come LiDAR, nuvole di punti e deep learning creano caselle di delimitazione 3D accurate per veicoli autonomi, robotica e AR.

Il rilevamento di oggetti 3D è una tecnica avanzata di visione artificiale (CV) per identificare e localizzare gli oggetti in uno spazio tridimensionale. A differenza del rilevamento di oggetti 2D, che opera su immagini piatte, il rilevamento 3D fornisce informazioni cruciali sulla profondità, consentendo a un sistema di comprendere le dimensioni, la posizione e l'orientamento di un oggetto nel mondo reale. Questa capacità consente una consapevolezza spaziale molto più profonda e accurata, essenziale per molte applicazioni moderne di intelligenza artificiale.

Come funziona il rilevamento degli oggetti 3D

I sistemi di rilevamento di oggetti 3D si basano tipicamente su sensori specializzati per catturare la geometria dell'ambiente circostante. Le fonti di dati comuni includono:

  • LiDAR (Light Detection and Ranging): Questa tecnologia utilizza impulsi laser per misurare le distanze esatte degli oggetti, creando una mappa 3D dettagliata chiamata nuvola di punti. Una nuvola di punti è una raccolta di punti di dati nello spazio 3D, che rappresenta con precisione le superfici esterne degli oggetti.
  • Telecamere stereo: Simili alla visione umana, le telecamere stereo utilizzano due o più lenti per acquisire immagini da angolazioni leggermente diverse. Confrontando queste immagini, il sistema può calcolare la profondità e creare una rappresentazione 3D della scena.
  • Mappe di profondità: Possono essere generate da vari sensori, tra cui telecamere stereo o telecamere a tempo di volo (ToF), e forniscono un valore di distanza per pixel.

Una volta acquisiti questi dati 3D, modelli specializzati di deep learning li analizzano per identificare e localizzare gli oggetti. Modelli come VoxelNet e VoteNet sono progettati per elaborare nuvole di punti non strutturate o griglie di voxel (equivalenti 3D dei pixel) per prevedere i riquadri di delimitazione 3D intorno agli oggetti.

Rilevamento di oggetti 3D e 2D

La differenza principale tra il rilevamento di oggetti 2D e 3D è la dimensione dello spazio in cui operano. Il rilevamento 2D identifica la posizione di un oggetto su un'immagine piatta utilizzando un riquadro rettangolare definito da coordinate X e Y. Tuttavia, manca la percezione della profondità, il che rende difficile giudicare le reali dimensioni o la distanza di un oggetto. Ad esempio, in un'immagine 2D, un grande camion lontano potrebbe apparire della stessa dimensione di una piccola auto molto più vicina.

Il rilevamento di oggetti 3D supera questa limitazione aggiungendo l'asse Z per la profondità. Ciò consente di determinare non solo cosa sia un oggetto e dove si trovi nell'inquadratura, ma anche quanto sia lontano, le sue dimensioni fisiche e il suo orientamento nello spazio 3D. Se da un lato questo permette una comprensione molto più ricca dell'ambiente, dall'altro comporta costi di calcolo più elevati e requisiti di dati più complessi.

Applicazioni nel mondo reale

Le informazioni spaziali dettagliate fornite dal rilevamento di oggetti 3D sono preziose in molti campi.

  1. Veicoli autonomi: Questa è una delle applicazioni più critiche. Le auto a guida autonoma di aziende come Waymo utilizzano LiDAR e telecamere per costruire un modello 3D in tempo reale dell'ambiente circostante. Ciò consente al veicolo di rilevare con precisione altre auto, pedoni e ciclisti, prevedendo i loro movimenti e navigando in sicurezza.
  2. Robotica e automazione: Nei magazzini e negli impianti di produzione, i robot utilizzano il rilevamento 3D per identificare, afferrare e spostare gli oggetti con grande precisione. È inoltre fondamentale per le applicazioni di realtà aumentata (AR), che consentono di posizionare in modo realistico gli oggetti virtuali e di interagire con il mondo fisico.

Sebbene il rilevamento di oggetti in 3D sia più complesso e richieda più risorse rispetto ai metodi 2D, la sua capacità di fornire una comprensione spaziale precisa lo rende una tecnologia indispensabile per la prossima generazione di sistemi intelligenti.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti