词汇表

融合现实

探索融合现实 (MR)，这项技术可将虚拟对象与现实世界无缝融合。了解 AI 和计算机视觉如何为这种互动体验提供支持。

融合现实 (MR) 代表了一种高级的混合现实形式，其中真实世界和虚拟对象融合到一个单一的、交互式的环境中。与简单地将数字信息叠加到物理世界上的早期技术不同，MR 使数字内容能够感知空间并对真实环境做出反应。这意味着虚拟对象可以被真实对象遮挡，与物理表面交互，并被用户操纵，就像它们实际存在一样。这种无缝集成是通过复杂的环境映射、传感器融合和实时渲染实现的，从而创造出真正沉浸式和交互式的体验。

融合现实与相关概念

区分融合现实与现实-虚拟连续体上的其他相关技术非常重要：

增强现实 (AR)： AR 通常将数字信息（如文本、图标或简单图形）叠加到现实世界的实时视图上，通常通过智能手机屏幕。数字元素通常不与物理环境交互。
虚拟现实 (VR)： VR 创建一个完全沉浸式的人工环境，取代用户的真实世界环境。用户完全沉浸在数字世界中，不与他们的物理空间互动。
混合现实 (XR)： 这是一个包含 AR、VR 和 MR 的总称。虽然有时与 MR 互换使用，但融合现实 (Merged Reality) 专门指光谱中最先进的终端，其中数字和物理现实深度交织并具有交互性。

人工智能在融合现实中的作用

人工智能（AI），特别是计算机视觉（CV），是驱动真正融合现实的引擎。为了使虚拟对象能够令人信服地与现实世界互动，系统必须首先感知和理解其物理环境。这就是机器学习（ML）模型至关重要的地方。

AI 算法使 MR 设备（例如 Microsoft HoloLens 2）能够实时执行复杂任务。这包括空间映射、手部和眼睛跟踪以及场景理解。例如，目标检测模型（如 Ultralytics YOLO11）可以识别和定位真实世界的对象，从而使数字内容能够与它们交互。类似地，实例分割有助于系统理解对象的精确形状和边界，从而实现逼真的遮挡，例如虚拟球可以滚到现实生活中的椅子后面。这种程度的环境感知对于创造可信的 MR 体验至关重要。

实际应用

融合现实正在从研究实验室走向各个行业的实际应用，这通常是由专业 AI 驱动的。

交互式工业辅助： 在制造业中的人工智能领域，技术人员可以佩戴 MR 头显来维修复杂的机械。使用在自定义数据集上训练的目标检测模型，系统可以识别特定的零件，并将交互式 3D 图表、逐步说明或诊断数据直接叠加到设备上。这减少了错误和维修时间。这是一种增强人类能力而不是取代人类能力的机器人技术。
高级手术导航： 在人工智能医疗领域，混合现实技术正在变革外科手术流程。外科医生可以将患者的 3D 医学扫描图像（如 CT 或 MRI）叠加到手术中的身体上，从而提供内部结构的实时交互式地图。姿态估计可以跟踪手术工具相对于虚拟解剖结构的位置，从而提高精确性和安全性。

关键技术与未来发展方向

MR 的基础依赖于硬件和软件的结合。设备需要先进的传感器，包括深度摄像头和 IMU，并在强大的边缘 AI 硬件上进行处理，以确保低推理延迟。软件堆栈在很大程度上依赖于深度学习框架（如 PyTorch 和 TensorFlow）来运行感知模型。诸如 Ultralytics HUB 之类的平台可以简化构建必要的自定义视觉模型的过程。

融合现实的未来指向与我们日常生活的更无缝集成，从协作远程工作到沉浸式教育体验。多模态模型的进步能够处理视觉数据以及语言和其他输入，这将实现更丰富的交互。随着计算能力的增长和设备变得不那么突兀，物理世界和数字世界之间的界限将继续模糊，使融合现实成为人机界面的一个基本组成部分，正如南加州大学的混合现实实验室等机构所设想的那样。这项技术的开发也是自动驾驶汽车和高级人机交互应用的关键一步。

融合现实

训练 Ultralytics YOLO 模型，以简化各行业的流程

灵活的企业许可解决方案，助力您的创新

使用 Ultralytics YOLO 在几秒钟内训练 AI 模型

融合现实与相关概念

人工智能在融合现实中的作用

实际应用

关键技术与未来发展方向

阅读更多此类别的内容

视觉人工智能为驾驶员注意力监控系统提供动力

从比特到量子比特：量子优化如何重塑人工智能

如何训练人工智能模型的初学者快速指南

加入 Ultralytics 社区