Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Vision AI

Comprendere il rilevamento oggetti 3D e le sue applicazioni

Esplora come funzionano il rilevamento oggetti 2D e 3D, le loro differenze chiave e le loro applicazioni in campi come i veicoli autonomi, la robotica e la realtà aumentata.

ABAbirami Vina
4 min read
Rilevamento oggetti 3D di veicoli e dintorni

Nel corso degli anni, il rilevamento di oggetti è diventato sempre più avanzato. Si è evoluto dal riconoscimento di oggetti in semplici immagini bidimensionali (2D) all'identificazione di oggetti nel complesso mondo tridimensionale (3D) che ci circonda. Le prime tecniche come il template matching, che consisteva nel trovare oggetti confrontando parti di un'immagine con immagini di riferimento memorizzate, sono state sviluppate negli anni '70 e hanno gettato le basi per il rilevamento di oggetti 2D. Negli anni '90, l'introduzione di tecnologie come il LIDAR (Light Detection and Ranging) ha permesso ai sistemi di acquisire più facilmente informazioni su profondità e spazio. Oggi, i metodi di fusione multimodale, che combinano immagini 2D con dati 3D, hanno aperto la strada a sistemi di rilevamento di oggetti 3D estremamente accurati.

Esempio di rilevamento oggetti 3D

Fig 1. Un esempio di rilevamento di oggetti 3D.

In questo articolo, esploreremo cos'è il rilevamento di oggetti 3D, come funziona e in cosa differisce dal rilevamento di oggetti 2D. Discuteremo anche alcune delle applicazioni del rilevamento di oggetti 3D. Iniziamo!

Link to this sectionUna panoramica del rilevamento di oggetti 2D#

Prima di dare un'occhiata al rilevamento di oggetti 3D, cerchiamo di capire come funziona quello 2D. Il rilevamento di oggetti 2D è una tecnica di computer vision che consente ai computer di riconoscere e individuare oggetti all'interno di immagini piatte e bidimensionali. Funziona analizzando la posizione orizzontale (X) e verticale (Y) di un oggetto in un'immagine. Ad esempio, se invii l'immagine di alcuni giocatori su un campo da calcio a un modello di rilevamento di oggetti 2D come Ultralytics YOLOv8, questo può analizzare l'immagine e disegnare bounding box attorno a ogni oggetto (in questo caso, i giocatori), identificandone precisamente la posizione.

Rilevamento oggetti 2D YOLOv8 di giocatori su un campo da calcio

Fig 2. Rilevamento di oggetti 2D YOLOv8 utilizzato per rilevare giocatori su un campo da calcio.

Tuttavia, il rilevamento di oggetti 2D ha i suoi limiti. Poiché considera solo due dimensioni, non comprende la profondità. Questo può rendere difficile giudicare quanto sia lontano o grande un oggetto. Ad esempio, un oggetto grande lontano potrebbe apparire delle stesse dimensioni di un oggetto più piccolo che si trova più vicino, il che può creare confusione. La mancanza di informazioni sulla profondità può causare imprecisioni in applicazioni come la robotica o la realtà aumentata, dove è necessario conoscere la dimensione reale e la distanza degli oggetti. È qui che nasce la necessità del rilevamento di oggetti 3D.

Link to this sectionOttenere consapevolezza spaziale con il rilevamento di oggetti 3D#

Il rilevamento di oggetti 3D è una tecnica avanzata di computer vision che consente ai computer di identificare oggetti in uno spazio tridimensionale, conferendo loro una comprensione molto più profonda del mondo circostante. A differenza del rilevamento di oggetti 2D, quello 3D prende in considerazione anche i dati relativi alla profondità. Le informazioni sulla profondità forniscono maggiori dettagli, come dove si trova un oggetto, quanto è grande, quanto è lontano e come è posizionato nel mondo reale 3D. Interessante notare che il rilevamento 3D può anche gestire meglio le situazioni in cui un oggetto ne nasconde parzialmente un altro (occlusioni) e rimane affidabile anche quando la prospettiva cambia. È uno strumento potente per i casi d'uso che richiedono una precisa consapevolezza spaziale.

Il rilevamento di oggetti 3D è fondamentale per applicazioni come veicoli a guida autonoma, robotica e sistemi di realtà aumentata. Funziona utilizzando sensori come LiDAR o fotocamere stereo. Questi sensori creano mappe 3D dettagliate dell'ambiente, note come nuvole di punti o mappe di profondità. Queste mappe vengono poi analizzate per rilevare oggetti in un ambiente 3D.

Rilevamento oggetti 3D di un'auto

Fig 3. Rilevamento di oggetti 3D di un'auto.

Esistono molti modelli di computer vision avanzati progettati specificamente per gestire dati 3D, come le nuvole di punti. Ad esempio, VoteNet è un modello che utilizza un metodo chiamato Hough voting per prevedere dove si trova il centro di un oggetto in una nuvola di punti, rendendo più facile rilevare e classificare gli oggetti con precisione. Allo stesso modo, VoxelNet è un modello che converte le nuvole di punti in una griglia di piccoli cubi chiamati voxel per semplificare l'analisi dei dati.

Link to this sectionDifferenze chiave tra il rilevamento di oggetti 2D e 3D#

Ora che abbiamo compreso il rilevamento di oggetti 2D e 3D, esploriamo le loro differenze principali. Il rilevamento di oggetti 3D è più complicato del rilevamento di oggetti 2D perché lavora con nuvole di punti. L'analisi di dati 3D, come le nuvole di punti generate dal LiDAR, richiede molta più memoria e potenza di calcolo. Un'altra differenza è la complessità degli algoritmi coinvolti. I modelli di rilevamento di oggetti 3D devono essere più complessi per poter gestire la stima della profondità, l'analisi della forma 3D e l'analisi dell'orientamento di un oggetto.

Confronto tra rilevamento oggetti 2D e 3D

Fig 4. Rilevamento di oggetti 2D vs 3D.

I modelli di rilevamento di oggetti 3D comportano un lavoro matematico e computazionale più pesante rispetto a quelli 2D. Elaborare dati 3D in tempo reale può essere impegnativo senza hardware avanzato e ottimizzazioni. Tuttavia, queste differenze rendono il rilevamento di oggetti 3D più adatto ad applicazioni che richiedono una migliore comprensione spaziale. D'altra parte, il rilevamento di oggetti 2D viene spesso utilizzato per applicazioni più semplici come i sistemi di sicurezza che necessitano di riconoscimento di immagini o analisi video.

Link to this sectionPro e contro del rilevamento di oggetti 3D#

Il rilevamento di oggetti 3D offre diversi vantaggi che lo rendono superiore ai metodi tradizionali di rilevamento 2D. Acquisendo tutte e tre le dimensioni di un oggetto, fornisce dettagli precisi sulla sua posizione, dimensione e orientamento rispetto al mondo reale. Tale precisione è cruciale per applicazioni come i veicoli a guida autonoma, dove conoscere l'esatta posizione degli ostacoli è vitale per la sicurezza. Un altro vantaggio dell'utilizzo del rilevamento di oggetti 3D è che può aiutarti a ottenere una comprensione molto migliore di come i diversi oggetti si relazionano tra loro nello spazio 3D.

Risoluzione delle occlusioni con il rilevamento oggetti 3D

Fig 5. Risolvere le occlusioni con il rilevamento di oggetti 3D.

Nonostante i numerosi vantaggi, ci sono anche limitazioni legate al rilevamento di oggetti 3D. Ecco alcune delle sfide principali da tenere a mente:

  • Costi computazionali più elevati: Lavorare con dati 3D richiede risorse hardware più potenti e i costi possono aumentare rapidamente.
  • Requisiti di dati più complessi: Il rilevamento di oggetti 3D spesso si basa su sensori avanzati come il LiDAR, che può essere costoso e non necessariamente disponibile in tutti gli ambienti.
  • Raccolta ed elaborazione dei dati: I complessi requisiti di dati del rilevamento di oggetti 3D rendono la raccolta, la preparazione e l'elaborazione dei grandi dataset necessari per addestrare i modelli operazioni che richiedono tempo e molte risorse.
  • Aumento della complessità del modello: I modelli utilizzati per il rilevamento di oggetti 3D sono generalmente più complicati, con più livelli e parametri rispetto a quelli utilizzati per il rilevamento di oggetti 2D.

Link to this sectionApplicazioni del rilevamento di oggetti 3D#

Ora che abbiamo discusso i pro e i contro del rilevamento di oggetti 3D, esaminiamo più da vicino alcuni dei suoi casi d'uso.

Link to this sectionVeicoli autonomi#

Nei veicoli a guida autonoma, il rilevamento di oggetti 3D è fondamentale per percepire l'ambiente circostante il veicolo. Consente ai mezzi di rilevare pedoni, altre auto e ostacoli. Fornisce inoltre informazioni precise sulla loro posizione, dimensione e orientamento nel mondo reale. I dati dettagliati ottenuti attraverso i sistemi di rilevamento di oggetti 3D sono utili per un'esperienza di guida autonoma molto più sicura per i passeggeri a bordo.

Utilizzo del rilevamento oggetti 3D nei veicoli autonomi

Fig 6. Utilizzo del rilevamento di oggetti 3D nei veicoli autonomi. (fonte: towardsdatascience.com)

Link to this sectionRobotica#

I sistemi robotici utilizzano il rilevamento di oggetti 3D per diverse applicazioni. Lo impiegano per navigare attraverso diversi tipi di ambienti, raccogliere e posizionare oggetti e interagire con ciò che li circonda. Tali casi d'uso sono particolarmente importanti in contesti dinamici come magazzini o impianti di produzione, dove i robot devono comprendere layout tridimensionali per funzionare efficacemente.

Un robot mobile che utilizza il rilevamento oggetti 3D

Fig 7. Un robot mobile che utilizza il rilevamento di oggetti 3D.

Link to this sectionRealtà aumentata e virtuale (AR/VR)#

Un altro interessante caso d'uso del rilevamento di oggetti 3D riguarda le applicazioni di realtà aumentata e virtuale. Il rilevamento di oggetti 3D viene utilizzato per posizionare accuratamente oggetti virtuali in un ambiente VR o AR realistico. Farlo migliora l'esperienza utente complessiva di tali tecnologie. Consente inoltre ai sistemi VR/AR di riconoscere e tracciare oggetti fisici, creando ambienti immersivi in cui elementi digitali e fisici interagiscono senza soluzione di continuità. Ad esempio, i giocatori che utilizzano visori AR/VR possono ottenere un'esperienza molto più immersiva con l'aiuto del rilevamento di oggetti 3D. Rende le interazioni con oggetti virtuali in spazi 3D molto più coinvolgenti.

Riconoscimento oggetti 3D utilizzato per un'applicazione AR

Fig 8. Un esempio di riconoscimento di oggetti 3D utilizzato per un'applicazione AR.

Link to this sectionConsiderazioni finali sul rilevamento di oggetti 3D#

Il rilevamento di oggetti 3D consente ai sistemi di comprendere la profondità e lo spazio in modo più efficace rispetto ai metodi di rilevamento 2D. Svolge un ruolo chiave in applicazioni come veicoli a guida autonoma, robot e AR/VR, dove conoscere la dimensione, la distanza e la posizione di un oggetto è importante. Sebbene il rilevamento di oggetti 3D richieda maggiore potenza di elaborazione e dati complessi, la sua capacità di fornire informazioni accurate e dettagliate lo rende uno strumento molto prezioso in molti campi. Con l'avanzare della tecnologia, l'efficienza e l'accessibilità del rilevamento di oggetti 3D probabilmente miglioreranno, aprendo la strada a un'adozione e un'innovazione ancora più ampie in vari settori.

Resta in contatto con la nostra community per rimanere aggiornato sulle ultime novità nell'IA! Visita il nostro repository GitHub per vedere come utilizziamo l'IA per creare soluzioni all'avanguardia in settori come la produzione e la sanità. 🚀

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning