Glossaire

Détection d'objets en 3D

Explorez la détection d'objets en 3D : comment le LiDAR, les nuages de points et l'apprentissage profond construisent des boîtes de délimitation 3D précises pour les véhicules autonomes, la robotique et la réalité augmentée.

La détection d'objets en 3D est une technique avancée de vision par ordinateur qui permet d'identifier et de localiser des objets dans un espace tridimensionnel. Contrairement à la détection d'objets en 2D, qui fonctionne sur des images planes, la détection en 3D fournit des informations cruciales sur la profondeur, permettant à un système de comprendre la taille, la position et l'orientation d'un objet dans le monde réel. Cette capacité permet une conscience spatiale beaucoup plus profonde et plus précise, ce qui est essentiel pour de nombreuses applications modernes de l'intelligence artificielle.

Comment fonctionne la détection d'objets en 3D

Les systèmes de détection d'objets en 3D s'appuient généralement sur des capteurs spécialisés pour capturer la géométrie de l'environnement. Les sources de données courantes sont les suivantes

LiDAR (Light Detection and Ranging): Cette technologie utilise des impulsions laser pour mesurer les distances exactes entre les objets, créant ainsi une carte 3D détaillée appelée nuage de points. Un nuage de points est une collection de points de données dans l'espace 3D, qui représente précisément les surfaces externes des objets.
Caméras stéréo : Semblables à la vision humaine, les caméras stéréo utilisent deux objectifs ou plus pour capturer des images sous des angles légèrement différents. En comparant ces images, le système peut calculer la profondeur et créer une représentation 3D de la scène.
Cartes de profondeur : Elles peuvent être générées par divers capteurs, notamment des caméras stéréo ou des caméras à temps de vol, et fournissent une valeur de distance par pixel.

Une fois ces données 3D capturées, des modèles d'apprentissage profond spécialisés les analysent pour identifier et localiser les objets. Des modèles tels que VoxelNet et VoteNet sont conçus pour traiter des nuages de points non structurés ou des grilles de voxels (équivalents 3D des pixels) afin de prédire les boîtes de délimitation 3D autour des objets.

Détection d'objets en 3D ou en 2D

La principale différence entre la détection d'objets en 2D et en 3D est la dimension de l'espace dans lequel ils opèrent. La détection 2D identifie l'emplacement d'un objet sur une image plane à l'aide d'une boîte rectangulaire définie par les coordonnées X et Y. La détection 3D ne permet pas d'évaluer la taille ou la distance réelle d'un objet. Cependant, elle ne dispose pas de la perception de la profondeur, ce qui rend difficile l'évaluation de la taille ou de la distance réelle d'un objet. Par exemple, sur une image en 2D, un gros camion éloigné peut sembler de la même taille qu'une petite voiture beaucoup plus proche.

La détection d'objets en 3D surmonte cette limitation en ajoutant l'axe Z pour la profondeur. Cela permet de déterminer non seulement ce qu'est un objet et où il se trouve dans l'image, mais aussi à quelle distance il se trouve, ses dimensions physiques et son orientation dans l'espace 3D. Bien que cette méthode permette une compréhension beaucoup plus riche de l'environnement, elle s'accompagne de coûts de calcul plus élevés et d'exigences plus complexes en matière de données.

Applications concrètes

Les informations spatiales détaillées fournies par la détection d'objets en 3D sont inestimables dans de nombreux domaines.

Véhicules autonomes: Il s'agit de l'une des applications les plus critiques. Les voitures autonomes d'entreprises comme Waymo utilisent le LiDAR et des caméras pour construire un modèle 3D en temps réel de leur environnement. Cela permet au véhicule de détecter avec précision les autres voitures, les piétons et les cyclistes, de prédire leurs mouvements et de naviguer en toute sécurité.
Robotique et automatisation : Dans les entrepôts et les usines, les robots utilisent la détection 3D pour identifier, saisir et déplacer des objets avec une grande précision. La détection 3D est également fondamentale pour les applications de réalité augmentée (RA), car elle permet de placer des objets virtuels de manière réaliste et d'interagir avec le monde physique.

Bien que la détection d'objets en 3D soit plus complexe et plus gourmande en ressources que les méthodes en 2D, sa capacité à fournir une compréhension spatiale précise en fait une technologie indispensable pour la prochaine génération de systèmes intelligents.

Détection d'objets en 3D

Entraînez les modèles Ultralytics YOLO pour rationaliser les flux de travail dans tous les secteurs

Solution de licence d'entreprise flexible pour dynamiser votre innovation

Entraînez des modèles d'IA en quelques secondes avec Ultralytics YOLO

Comment fonctionne la détection d'objets en 3D

Détection d'objets en 3D ou en 2D

Applications concrètes

En savoir plus dans cette catégorie

Des bits aux qubits : Comment l'optimisation quantique remodèle l'IA

Un guide rapide pour les débutants sur la façon d'entraîner un modèle d'IA

De Dubaï avec des idées : Principaux enseignements du GDG MENA-T Summit 2025

Rejoignez la communauté Ultralytics