Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

Spatial Intelligence

Explore comment l'intelligence spatiale permet à l'IA de percevoir et de naviguer dans le monde 3D. Apprends à construire des systèmes spatialement conscients avec Ultralytics YOLO26 et la plateforme Ultralytics.

L'intelligence spatiale fait référence à la capacité d'un système d'intelligence artificielle à percevoir, comprendre et naviguer dans le monde physique en trois dimensions. Contrairement à la vision par ordinateur traditionnelle, qui analyse souvent les images 2D comme des instantanés statiques, l'intelligence spatiale implique de raisonner sur la profondeur, la géométrie, le mouvement et les relations entre les objets dans un environnement dynamique. Elle permet aux machines non seulement de « voir » des pixels, mais de comprendre le contexte physique d'une scène, leur permettant ainsi d'interagir plus efficacement avec le monde réel. Cette capacité est le pont entre les données visuelles numériques et l'action physique, servant de pierre angulaire aux AI agents avancés et aux systèmes robotiques.

Link to this sectionLes composants essentiels de l'intelligence spatiale#

Pour parvenir à une compréhension de l'espace semblable à celle de l'humain, un système d'IA s'appuie sur plusieurs technologies et concepts interconnectés.

  • Perception de la profondeur et reconstruction 3D : Les systèmes doivent convertir les entrées 2D des caméras en représentations 3D. Des techniques comme la monocular depth estimation permettent aux modèles de prédire la distance à partir d'une seule image, tandis que la 3D object detection aide à identifier le volume et l'orientation des objets dans cet espace.
  • SLAM (Simultaneous Localization and Mapping) : Cela permet à un appareil, tel qu'un robot ou un drone, de cartographier un environnement inconnu tout en suivant sa propre position à l'intérieur. Les approches modernes intègrent souvent le visual SLAM au deep learning pour améliorer la robustesse dans des conditions d'éclairage changeantes.
  • Raisonnement géométrique : Au-delà de la détection, le système doit comprendre les contraintes physiques — savoir qu'une tasse repose sur une table ou qu'une porte doit être ouverte pour passer au travers. Cela implique souvent la pose estimation pour suivre l'orientation des objets ou des articulations humaines en temps réel.
  • Embodied AI : Ce concept relie la perception à l'action. Un agent incarné ne se contente pas d'observer ; il utilise des données spatiales pour planifier ses mouvements, éviter les obstacles et manipuler des objets, de manière similaire au fonctionnement de l'AI in robotics sur une ligne de production.

Link to this sectionApplications concrètes#

L'intelligence spatiale transforme les industries en permettant aux machines de fonctionner de manière autonome dans des environnements complexes.

  • Autonomous Robotics and Logistics: In warehousing, robots use spatial intelligence to navigate crowded aisles, identify specific packages using object detection, and place them precisely onto conveyors. They must calculate the spatial relationship between their gripper and the box to ensure a secure hold without crushing the item.
  • Augmented Reality (AR) and Mixed Reality: Devices like smart glasses use spatial computing to anchor digital content to the physical world. For instance, an AR maintenance app might overlay repair instructions directly onto a specific engine part. This requires precise object tracking to ensure the graphics stay aligned as the user moves their head.

Link to this sectionIntelligence spatiale vs vision par ordinateur#

Bien qu'étroitement liés, il est utile de distinguer l'spatial intelligence vs. computer vision. La Computer Vision est le domaine plus large axé sur l'extraction d'informations significatives à partir d'images numériques, de vidéos et d'autres entrées visuelles. Il inclut des tâches comme la classification ou la détection 2D de base. L'Intelligence spatiale est un sous-ensemble spécialisé ou une évolution de la vision par ordinateur qui ajoute spécifiquement la dimension de l'espace et de la physique. Elle passe de « Qu'est-ce que cet objet ? » (Vision) à « Où se trouve cet objet, comment est-il orienté et comment puis-je interagir avec lui ? » (Intelligence spatiale).

Link to this sectionMise en œuvre de la conscience spatiale avec Ultralytics#

Les développeurs peuvent construire les fondations de systèmes d'intelligence spatiale en utilisant la Ultralytics Platform. En entraînant des modèles comme Ultralytics YOLO26 sur des tâches telles que la détection par boîte englobante orientée (OBB) ou l'estimation de pose, les ingénieurs peuvent fournir les données géométriques nécessaires aux applications de robotique ou d'AR en aval.

Voici un exemple simple d'extraction de points clés spatiaux à l'aide d'un modèle d'estimation de pose, ce qui constitue une étape critique dans la compréhension du mouvement humain au sein d'un espace 3D :

from ultralytics import YOLO

# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image to detect human keypoints
results = model("path/to/image.jpg")

# Access the keypoints (x, y coordinates and confidence)
for result in results:
    # keypoints.xy returns a tensor of shape (N, 17, 2)
    keypoints = result.keypoints.xy
    print(f"Detected keypoints for {len(keypoints)} persons.")

Les avancées récentes dans les Vision Transformers (ViT) et les foundation models accélèrent davantage ce domaine, permettant aux systèmes de généraliser la compréhension spatiale à travers différents environnements sans réentraînement approfondi. À mesure que les recherches de groupes comme Stanford's HAI et Google DeepMind se poursuivent, nous pouvons nous attendre à ce que l'intelligence spatiale devienne une fonctionnalité standard dans la prochaine génération d'appareils intelligents.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique