Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

3D Object Detection

Esplora il rilevamento di oggetti 3D per padroneggiare la consapevolezza spaziale nell'IA. Scopri come Ultralytics YOLO26 gestisce la profondità, l'orientamento e la stima dei bounding box 3D nel mondo reale.

Il rilevamento di oggetti 3D è un sofisticato compito di computer vision che consente alle macchine di identificare, localizzare e determinare le dimensioni degli oggetti all'interno di uno spazio tridimensionale. A differenza del tradizionale rilevamento oggetti 2D, che disegna un riquadro di delimitazione piatto attorno a un elemento in un'immagine, il rilevamento oggetti 3D stima un cuboide (un riquadro 3D) che racchiude l'oggetto. Ciò fornisce informazioni critiche sulla profondità, l'orientamento (direzione) e le dimensioni spaziali precise, consentendo ai sistemi di comprendere non solo cosa sia un oggetto, ma esattamente dove si trovi rispetto al sensore nel mondo reale. Questa capacità è fondamentale per le tecnologie che devono interagire fisicamente con il proprio ambiente.

Link to this sectionCome funziona il rilevamento oggetti 3D#

Per percepire profondità e volume, i modelli di rilevamento 3D solitamente si basano su input di dati più ricchi di quelli forniti dalle telecamere standard. Mentre alcuni metodi avanzati possono dedurre strutture 3D da immagini monoculari (a lente singola), la maggior parte dei sistemi robusti utilizza dati provenienti da sensori LiDAR, radar o telecamere stereo. Questi sensori generano nuvole di punti—massicce collezioni di punti dati che rappresentano la superficie esterna degli oggetti.

Il processo comporta diversi passaggi chiave:

  • Acquisizione dati: I sensori catturano la geometria della scena. Il LiDAR, per esempio, utilizza impulsi laser per misurare le distanze, creando una mappa 3D precisa.
  • Estrazione delle caratteristiche: I modelli di deep learning, spesso basati su Reti Neurali Convoluzionali (CNN) o Transformer, elaborano la nuvola di punti o i dati immagine fusi per identificare schemi.
  • Predizione del riquadro di delimitazione: Il modello produce un riquadro di delimitazione 3D definito dalle sue coordinate centrali (x, y, z), dimensioni (lunghezza, larghezza, altezza) e angolo di rotazione (imbardata).
  • Classificazione: Simile alla classificazione delle immagini, il sistema assegna un'etichetta (es. "pedone", "veicolo") all'oggetto rilevato.

Link to this sectionDifferenza tra rilevamento 2D e 3D#

È importante distinguere tra questi due concetti correlati.

  • Rilevamento oggetti 2D: Opera su immagini piatte (pixel). Ti dice che un oggetto si trova in "alto a sinistra" o "in basso a destra" di un fotogramma ma non può giudicare efficacemente la distanza o le dimensioni nel mondo reale senza marcatori di riferimento. È ideale per compiti come identificare difetti di produzione o analizzare feed video dove la profondità è meno critica.
  • Rilevamento oggetti 3D: Opera nello spazio volumetrico (voxel o punti). Fornisce la distanza dalla telecamera (profondità), le dimensioni fisiche dell'oggetto e il suo orientamento. Questo è essenziale per prevenire collisioni in ambienti dinamici.

Link to this sectionApplicazioni nel mondo reale#

La transizione dalla percezione 2D alla 3D sblocca potenti casi d'uso in settori in cui la sicurezza e la consapevolezza spaziale sono fondamentali.

  • Guida autonoma: Le auto a guida autonoma si affidano pesantemente al rilevamento 3D per navigare in sicurezza. Elaborando i dati da LiDAR e telecamere, il veicolo può rilevare altre auto, pedoni e ostacoli, calcolando la loro distanza e velocità esatta. Questo consente al sistema di percezione di prevedere traiettorie e prendere decisioni di frenata o sterzata in scenari di inferenza in tempo reale. Aziende come Waymo utilizzano queste suite di sensori pesanti per mappare istantaneamente gli ambienti urbani.
  • Robotica e prelievo da cassetta (Bin Picking): Nella logistica e nel magazzinaggio, i robot devono prelevare oggetti di forme e dimensioni variabili dai contenitori. Il rilevamento 3D consente a un braccio robotico di comprendere l'orientamento di un pacco, determinare il miglior punto di presa e pianificare un percorso senza collisioni per spostare l'articolo. Ciò migliora l'efficienza nell'IA nella logistica automatizzando compiti manuali complessi.

Link to this sectionImplementare il rilevamento oggetti con Ultralytics#

Sebbene il rilevamento 3D completo richieda spesso architetture specializzate per nuvole di punti, i moderni rilevatori 2D come YOLO26 vengono sempre più utilizzati come componente in flussi di lavoro pseudo-3D o per stimare la profondità attraverso il ridimensionamento dei riquadri di delimitazione. Per gli sviluppatori che desiderano addestrare modelli sui propri set di dati, la piattaforma Ultralytics offre un ambiente semplificato per annotazione e addestramento.

Ecco un semplice esempio di come eseguire il rilevamento standard utilizzando l'API Python di Ultralytics, che è spesso il primo passo in una pipeline di percezione più ampia:

import cv2
from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Perform inference on a local image
results = model("path/to/image.jpg")

# Visualize the results
for result in results:
    # Plot predictions on the image (returns a numpy array)
    im_array = result.plot()

    # Display using OpenCV
    cv2.imshow("Detections", im_array)
    cv2.waitKey(0)  # Press any key to close
    cv2.destroyAllWindows()

Link to this sectionSfide e tendenze future#

Nonostante la sua utilità, il rilevamento oggetti 3D affronta sfide riguardanti il costo computazionale e la spesa per i sensori. Elaborare milioni di punti in una nuvola di punti richiede una potenza GPU significativa, rendendo difficile la distribuzione su dispositivi edge. Tuttavia, le innovazioni nella quantizzazione del modello e le architetture neurali efficienti stanno riducendo questo onere.

Inoltre, tecniche come la fusione dei sensori stanno migliorando l'accuratezza combinando le ricche informazioni a colori delle telecamere con i precisi dati di profondità dei LiDAR. Man mano che queste tecnologie maturano, possiamo aspettarci di vedere la percezione 3D integrata in dispositivi più accessibili, dagli occhiali per realtà aumentata agli elettrodomestici smart home.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning