深圳尤洛视觉
深圳
立即加入
词汇表

融合现实

探索融合现实 (MR),这项技术可将虚拟对象与现实世界无缝融合。了解 AI 和计算机视觉如何为这种互动体验提供支持。

融合现实 (MR) 代表了一种高级的混合现实形式,其中真实世界和虚拟对象融合到一个单一的、交互式的环境中。与简单地将数字信息叠加到物理世界上的早期技术不同,MR 使数字内容能够感知空间并对真实环境做出反应。这意味着虚拟对象可以被真实对象遮挡,与物理表面交互,并被用户操纵,就像它们实际存在一样。这种无缝集成是通过复杂的环境映射、传感器融合和实时渲染实现的,从而创造出真正沉浸式和交互式的体验。

融合现实与相关概念

区分融合现实与现实-虚拟连续体上的其他相关技术非常重要:

  • 增强现实 (AR): AR 通常将数字信息(如文本、图标或简单图形)叠加到现实世界的实时视图上,通常通过智能手机屏幕。 数字元素通常不与物理环境交互。
  • 虚拟现实 (VR): VR 创建一个完全沉浸式的人工环境,取代用户的真实世界环境。用户完全沉浸在数字世界中,不与他们的物理空间互动。
  • 混合现实 (XR): 这是一个包含 AR、VR 和 MR 的总称。虽然有时与 MR 互换使用,但融合现实 (Merged Reality) 专门指光谱中最先进的终端,其中数字和物理现实深度交织并具有交互性。

人工智能在融合现实中的作用

人工智能(AI),特别是计算机视觉(CV),是驱动真正融合现实的引擎。 为了使虚拟对象能够令人信服地与现实世界互动,系统必须首先感知和理解其物理环境。 这就是机器学习(ML)模型至关重要的地方。

AI 算法使 MR 设备(例如 Microsoft HoloLens 2)能够实时执行复杂任务。这包括空间映射、手部和眼睛跟踪以及场景理解。例如,目标检测模型(如 Ultralytics YOLO11)可以识别和定位真实世界的对象,从而使数字内容能够与它们交互。类似地,实例分割有助于系统理解对象的精确形状和边界,从而实现逼真的遮挡,例如虚拟球可以滚到现实生活中的椅子后面。这种程度的环境感知对于创造可信的 MR 体验至关重要。

实际应用

融合现实正在从研究实验室走向各个行业的实际应用,这通常是由专业 AI 驱动的。

  1. 交互式工业辅助:制造业中的人工智能 领域,技术人员可以佩戴 MR 头显来维修复杂的机械。使用 在自定义数据集上训练的目标检测模型,系统可以识别特定的零件,并将交互式 3D 图表、逐步说明或诊断数据直接叠加到设备上。这减少了错误和维修时间。这是一种增强人类能力而不是取代人类能力的 机器人技术
  2. 高级手术导航:人工智能医疗领域,混合现实技术正在变革外科手术流程。外科医生可以将患者的 3D 医学扫描图像(如 CT 或 MRI)叠加到手术中的身体上,从而提供内部结构的实时交互式地图。姿态估计可以跟踪手术工具相对于虚拟解剖结构的位置,从而提高精确性和安全性。

关键技术与未来发展方向

MR 的基础依赖于硬件和软件的结合。设备需要先进的传感器,包括深度摄像头和 IMU,并在强大的 边缘 AI 硬件上进行处理,以确保低推理延迟。软件堆栈在很大程度上依赖于 深度学习 框架(如 PyTorchTensorFlow)来运行感知模型。诸如 Ultralytics HUB 之类的平台可以简化构建必要的自定义视觉模型的过程。

融合现实的未来指向与我们日常生活的更无缝集成,从协作远程工作到沉浸式教育体验。多模态模型的进步能够处理视觉数据以及语言和其他输入,这将实现更丰富的交互。随着计算能力的增长和设备变得不那么突兀,物理世界和数字世界之间的界限将继续模糊,使融合现实成为人机界面的一个基本组成部分,正如南加州大学的混合现实实验室等机构所设想的那样。这项技术的开发也是自动驾驶汽车和高级人机交互应用的关键一步。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板