Merged Reality
Explore la réalité fusionnée (MR) et comment elle mélange les mondes physique et numérique. Apprends comment Ultralytics YOLO26 alimente la MR avec la détection d'objets et la segmentation en temps réel.
La réalité fusionnée (MR), également largement connue sous le nom de réalité mixte, décrit la convergence du monde physique avec du contenu numérique généré par ordinateur. Contrairement aux environnements strictement virtuels ou augmentés, la réalité fusionnée crée un espace fluide où les objets physiques et numériques coexistent et interagissent en temps réel. Cette technologie repose largement sur une vision par ordinateur avancée et sur l'informatique spatiale pour cartographier avec précision l'environnement réel, permettant aux artefacts numériques d'être ancrés sur des surfaces physiques et de réagir aux changements physiques. En tirant parti de capteurs, de caméras et d'algorithmes de deep learning, les systèmes MR peuvent comprendre la profondeur, la géométrie et l'éclairage, créant des expériences immersives qui semblent tangibles et ancrées dans l'environnement réel de l'utilisateur.
Link to this sectionPertinence pour l'IA et le Machine Learning#
L'évolution de la réalité fusionnée est intrinsèquement liée aux progrès de l'intelligence artificielle. Pour fusionner avec succès les mondes numérique et physique, un système doit posséder une compréhension sophistiquée de l'environnement. C'est là que les tâches de perception visuelle deviennent critiques. Des techniques telles que la détection d'objets permettent au système de reconnaître des meubles ou des personnes, tandis que le SLAM (Simultaneous Localization and Mapping) permet à l'appareil de suivre sa propre position par rapport à ces objets.
Les applications MR modernes utilisent des modèles de deep learning pour traiter instantanément des données sensorielles complexes. Par exemple, l'estimation de pose est utilisée pour suivre les mouvements des mains pour le contrôle gestuel, éliminant ainsi le besoin de contrôleurs physiques. De plus, la segmentation sémantique aide le système à distinguer un sol, un mur et une table, garantissant qu'un personnage numérique marche sur le sol plutôt que de flotter à travers une table.
Link to this sectionApplications concrètes#
La réalité fusionnée transforme les industries en améliorant la productivité et la formation grâce à des simulations immersives.
- Maintenance et formation industrielle : Dans la fabrication, les techniciens portent des casques MR qui superposent des schémas numériques sur des machines physiques. Si un travailleur regarde une pièce de moteur spécifique, le système utilise l'inférence en temps réel pour identifier le composant et afficher les instructions de réparation ou les spécifications de couple directement sur la pièce. Ce guidage mains libres réduit les erreurs et accélère les tâches complexes.
- Chirurgie et planification médicale : Les chirurgiens utilisent la MR pour superposer des scans d'imagerie médicale en 3D (comme des données d'IRM ou de scanner) directement sur le corps d'un patient pendant les opérations. Cela permet une visualisation précise de l'anatomie interne sans effectuer de larges incisions. En intégrant des modèles de segmentation, le système peut mettre en évidence des organes ou des tumeurs spécifiques en temps réel, facilitant la navigation et améliorant les résultats chirurgicaux.
Link to this sectionDifférencier les termes clés#
Il est important de distinguer la réalité fusionnée des concepts connexes dans le spectre « XR » (réalité étendue) :
- Réalité Augmentée (AR) : L'AR superpose généralement des informations numériques sur un flux de caméra (comme un filtre de smartphone) sans interaction spatiale profonde. La MR va plus loin en garantissant que les objets numériques interagissent physiquement avec le monde réel (par exemple, une balle numérique rebondissant sur une table réelle).
- Réalité Virtuelle (VR) : La VR crée un environnement totalement synthétique, bloquant complètement le monde physique. La MR maintient l'utilisateur présent dans son environnement physique tout en l'améliorant.
Link to this sectionAppliquer la vision par ordinateur pour la MR#
Pour construire un composant de base d'un système MR, tel que la détection de surfaces ou d'objets pour ancrer du contenu numérique, les développeurs utilisent souvent des modèles de détection haute vitesse. Le modèle Ultralytics YOLO26 est particulièrement bien adapté à cela en raison de sa faible latence et de sa grande précision, qui sont essentielles pour maintenir l'illusion de réalité.
L'exemple suivant montre comment effectuer une segmentation d'instance sur un flux vidéo. Dans un contexte MR, ce masque au niveau du pixel pourrait définir la zone « praticable » pour un personnage numérique.
from ultralytics import YOLO
# Load the YOLO26 segmentation model
model = YOLO("yolo26n-seg.pt")
# Predict on a video source to identify physical objects and their boundaries
# This data helps anchor digital assets to real-world objects
results = model.predict(source="room_scan.mp4", show=True, stream=True)
for result in results:
# Process masks to determine occlusion or physics interactions
if result.masks:
print(f"Detected {len(result.masks)} physical segments for interaction.")Link to this sectionAvenir de la réalité fusionnée#
À mesure que le matériel devient plus léger et que les capacités d'edge computing s'améliorent, la MR devrait devenir omniprésente. L'intégration de l'IA générative permettra probablement aux environnements MR de se peupler dynamiquement, créant automatiquement des jumeaux numériques d'espaces réels. Avec des outils comme la plateforme Ultralytics, les développeurs peuvent facilement entraîner des modèles personnalisés pour reconnaître des objets spécifiques au sein de ces environnements fusionnés, repoussant ainsi les limites de notre manière d'interagir avec l'information dans un espace tridimensionnel.






