Découvrez la réalité fusionnée (MR) et comment elle combine les mondes physique et numérique. Découvrez comment Ultralytics optimise la MR grâce à la détection et à la segmentation d'objets en temps réel.
La réalité fusionnée (MR), également connue sous le nom de réalité mixte, décrit la convergence du monde physique avec le contenu numérique généré par ordinateur. Contrairement aux environnements strictement virtuels ou augmentés, la réalité fusionnée crée un espace homogène où les objets physiques et numériques coexistent et interagissent en temps réel. Cette technologie s'appuie fortement sur la vision par ordinateur avancée et l'informatique spatiale pour cartographier avec précision l'environnement réel, permettant ainsi aux artefacts numériques d'être ancrés à des surfaces physiques et de réagir aux changements physiques. En exploitant des capteurs, des caméras et des algorithmes d'apprentissage profond, les systèmes de RM peuvent comprendre la profondeur, la géométrie et l'éclairage, créant ainsi des expériences immersives qui semblent tangibles et ancrées dans l'environnement réel de l'utilisateur .
L'évolution de la réalité fusionnée est intrinsèquement liée aux progrès de l'intelligence artificielle. Pour réussir à fusionner les mondes numérique et physique, un système doit posséder une compréhension sophistiquée de l'environnement. C'est là que les tâches de perception visuelle deviennent essentielles. Des techniques telles que la détection d'objets permettent au système de reconnaître des meubles ou des personnes, tandis que le SLAM (Simultaneous Localization and Mapping) permet à l'appareil de track propre position par rapport à ces objets.
Les applications MR modernes utilisent des modèles d'apprentissage profond pour traiter instantanément des données sensorielles complexes . Par exemple, l'estimation de la pose est utilisée pour track les mouvements track afin de contrôler les gestes, éliminant ainsi le besoin de contrôleurs physiques. De plus, la segmentation sémantique aide le système à faire la distinction entre un sol, un mur et une table, garantissant ainsi qu'un personnage numérique marche sur le sol plutôt que de flotter à travers une table.
La réalité fusionnée transforme les industries en améliorant la productivité et la formation grâce à des simulations immersives.
Il est important de distinguer la réalité fusionnée des concepts connexes dans le spectre « XR » (réalité étendue) :
Pour créer un composant de base d'un système de réalité mixte, tel que la détection de surfaces ou d'objets pour ancrer du contenu numérique, les développeurs utilisent souvent des modèles de détection à grande vitesse. Le modèle Ultralytics est particulièrement bien adapté à cette tâche en raison de sa faible latence et de sa grande précision, qui sont essentielles pour maintenir l'illusion de la réalité.
L'exemple suivant montre comment effectuer une segmentation d'instance sur un flux vidéo. Dans un contexte de réalité mixte, ce masque au niveau des pixels pourrait définir la zone « praticable » pour un personnage numérique.
from ultralytics import YOLO
# Load the YOLO26 segmentation model
model = YOLO("yolo26n-seg.pt")
# Predict on a video source to identify physical objects and their boundaries
# This data helps anchor digital assets to real-world objects
results = model.predict(source="room_scan.mp4", show=True, stream=True)
for result in results:
# Process masks to determine occlusion or physics interactions
if result.masks:
print(f"Detected {len(result.masks)} physical segments for interaction.")
À mesure que le matériel devient plus léger et que les capacités de l'informatique de pointe s'améliorent, la réalité mixte devrait devenir omniprésente. L'intégration de l' IA générative permettra probablement aux environnements de réalité mixte de se peupler de manière dynamique, créant automatiquement des jumeaux numériques d' espaces du monde réel. Grâce à des outils tels que Ultralytics , les développeurs peuvent facilement former des modèles personnalisés pour reconnaître des objets spécifiques dans ces environnements fusionnés, repoussant ainsi les limites de notre interaction avec les informations dans un espace tridimensionnel.