Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Réalité fusionnée

Découvrez la réalité fusionnée (MR) et comment elle combine les mondes physique et numérique. Découvrez comment Ultralytics optimise la MR grâce à la détection et à la segmentation d'objets en temps réel.

La réalité fusionnée (MR), également connue sous le nom de réalité mixte, décrit la convergence du monde physique avec le contenu numérique généré par ordinateur. Contrairement aux environnements strictement virtuels ou augmentés, la réalité fusionnée crée un espace homogène où les objets physiques et numériques coexistent et interagissent en temps réel. Cette technologie s'appuie fortement sur la vision par ordinateur avancée et l'informatique spatiale pour cartographier avec précision l'environnement réel, permettant ainsi aux artefacts numériques d'être ancrés à des surfaces physiques et de réagir aux changements physiques. En exploitant des capteurs, des caméras et des algorithmes d'apprentissage profond, les systèmes de RM peuvent comprendre la profondeur, la géométrie et l'éclairage, créant ainsi des expériences immersives qui semblent tangibles et ancrées dans l'environnement réel de l'utilisateur .

Pertinence dans l'IA et l'apprentissage automatique

L'évolution de la réalité fusionnée est intrinsèquement liée aux progrès de l'intelligence artificielle. Pour réussir à fusionner les mondes numérique et physique, un système doit posséder une compréhension sophistiquée de l'environnement. C'est là que les tâches de perception visuelle deviennent essentielles. Des techniques telles que la détection d'objets permettent au système de reconnaître des meubles ou des personnes, tandis que le SLAM (Simultaneous Localization and Mapping) permet à l'appareil de track propre position par rapport à ces objets.

Les applications MR modernes utilisent des modèles d'apprentissage profond pour traiter instantanément des données sensorielles complexes . Par exemple, l'estimation de la pose est utilisée pour track les mouvements track afin de contrôler les gestes, éliminant ainsi le besoin de contrôleurs physiques. De plus, la segmentation sémantique aide le système à faire la distinction entre un sol, un mur et une table, garantissant ainsi qu'un personnage numérique marche sur le sol plutôt que de flotter à travers une table.

Applications concrètes

La réalité fusionnée transforme les industries en améliorant la productivité et la formation grâce à des simulations immersives.

  • Maintenance industrielle et formation : dans le secteur manufacturier, les techniciens portent des casques MR qui superposent des schémas numériques sur les machines physiques. Si un ouvrier regarde une pièce spécifique d'un moteur, le système utilise l'inférence en temps réel pour identifier le composant et afficher les instructions de réparation ou les spécifications de couple directement sur la pièce. Ce guidage mains libres réduit les erreurs et accélère les tâches complexes.
  • Chirurgie médicale et planification : les chirurgiens utilisent la RM pour superposer des images médicales en 3D (telles que des données IRM ou TDM ) directement sur le corps du patient pendant les opérations. Cela permet une visualisation précise de l'anatomie interne sans avoir à pratiquer de grandes incisions. En intégrant des modèles de segmentation, le système peut mettre en évidence des organes ou des tumeurs spécifiques en temps réel, ce qui facilite la navigation et améliore les résultats chirurgicaux.

Différencier les termes clés

Il est important de distinguer la réalité fusionnée des concepts connexes dans le spectre « XR » (réalité étendue) :

  • Réalité augmentée (RA): La RA superpose généralement des informations numériques sur l'image d'une caméra (comme un filtre de smartphone) sans interaction spatiale profonde. La RM va plus loin en garantissant que les objets numériques interagissent physiquement avec le monde réel (par exemple, une balle numérique rebondissant sur une table réelle).
  • Réalité virtuelle (RV): la RV crée un environnement entièrement synthétique, bloquant complètement le monde physique. La RM maintient l'utilisateur présent dans son environnement physique tout en l'améliorant.

Application de la vision par ordinateur à la RM

Pour créer un composant de base d'un système de réalité mixte, tel que la détection de surfaces ou d'objets pour ancrer du contenu numérique, les développeurs utilisent souvent des modèles de détection à grande vitesse. Le modèle Ultralytics est particulièrement bien adapté à cette tâche en raison de sa faible latence et de sa grande précision, qui sont essentielles pour maintenir l'illusion de la réalité.

L'exemple suivant montre comment effectuer une segmentation d'instance sur un flux vidéo. Dans un contexte de réalité mixte, ce masque au niveau des pixels pourrait définir la zone « praticable » pour un personnage numérique.

from ultralytics import YOLO

# Load the YOLO26 segmentation model
model = YOLO("yolo26n-seg.pt")

# Predict on a video source to identify physical objects and their boundaries
# This data helps anchor digital assets to real-world objects
results = model.predict(source="room_scan.mp4", show=True, stream=True)

for result in results:
    # Process masks to determine occlusion or physics interactions
    if result.masks:
        print(f"Detected {len(result.masks)} physical segments for interaction.")

L'avenir de la réalité fusionnée

À mesure que le matériel devient plus léger et que les capacités de l'informatique de pointe s'améliorent, la réalité mixte devrait devenir omniprésente. L'intégration de l' IA générative permettra probablement aux environnements de réalité mixte de se peupler de manière dynamique, créant automatiquement des jumeaux numériques d' espaces du monde réel. Grâce à des outils tels que Ultralytics , les développeurs peuvent facilement former des modèles personnalisés pour reconnaître des objets spécifiques dans ces environnements fusionnés, repoussant ainsi les limites de notre interaction avec les informations dans un espace tridimensionnel.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant