术语表

融合的现实

探索融合现实(MR)技术,它能将虚拟物体与现实世界无缝融合。了解人工智能和计算机视觉如何为这种互动体验提供动力。

混合现实(MR)是混合现实的一种高级形式,它将现实世界和虚拟对象融合到一个单一的交互式环境中。早期的技术只是将数字信息叠加到物理世界上,与之不同的是,MR 使数字内容具有空间感知能力,并能对真实环境做出响应。这意味着虚拟对象可以被真实对象遮挡,与物理表面互动,并由用户进行操作,就像它们真的存在一样。这种无缝整合是通过复杂的环境映射、传感器融合和实时渲染来实现的,从而创造出真正身临其境的互动体验。

合并现实与相关概念

必须将 "融合现实"与现实-虚拟连续体上的其他相关技术区分开来:

  • 增强现实(AR):增强现实通常通过智能手机屏幕,在现实世界的实时视图上叠加数字信息,如文本、图标或简单的图形。数字元素通常不与物理环境互动。
  • 虚拟现实(VR):VR 创造了一个完全身临其境的人工环境,取代了用户的现实环境。用户被完全封闭在数字世界中,无法与物理空间进行互动。
  • 混合现实(XR):这是一个包含 AR、VR 和 MR 的总括术语。虽然有时可以与 MR 互换使用,但混合现实特指最先进的混合现实,即数字和物理现实深度交织和互动。

人工智能在融合现实中的作用

人工智能(AI),尤其是计算机视觉(CV),是推动真正融合现实的引擎。要使虚拟对象与现实世界进行令人信服的交互,系统必须首先感知和理解其物理环境。这正是机器学习(ML)模型的关键所在。

人工智能算法使微软 HoloLens 2 等 MR 设备能够实时执行复杂的任务。这包括空间映射、手眼跟踪和场景理解。例如,物体检测模型(如Ultralytics YOLO11)可以识别和定位现实世界中的物体,使数字内容能够与之互动。同样,实例分割可以帮助系统了解物体的精确形状和边界,从而实现逼真的遮挡,使虚拟球可以滚动到现实生活中的椅子后面。这种环境感知水平对于创造可信的 MR 体验至关重要。

实际应用

融合现实技术正从研究实验室走向各行各业的实际应用,而这通常是由专业人工智能驱动的。

  1. 交互式工业辅助:制造领域的人工智能中,技术人员可以佩戴磁共振头戴式耳机为复杂的机器提供服务。系统利用在定制数据集上训练的物体检测模型,识别特定部件,并直接在设备上叠加交互式三维图、分步说明或诊断数据。这就减少了错误和维修时间。这是一种增强人的能力而非取代人的能力的机器人技术
  2. 先进的手术导航:人工智能推动的医疗保健领域,磁共振技术正在改变外科手术程序。外科医生可以在手术过程中将病人的 3D 医学扫描(如 CT 或 MRI)叠加到其身体上。这就提供了一个实时、交互式的内部结构地图。姿势估计可以跟踪手术工具相对于虚拟解剖结构的位置,从而提高精确度和安全性。

关键技术和未来方向

磁共振技术的基础依赖于硬件和软件的结合。设备需要先进的传感器,包括深度摄像头和 IMU,并在强大的边缘人工智能硬件上进行处理,以确保较低的推理延迟。软件堆栈在很大程度上依赖于PyTorchTensorFlow深度学习框架来运行感知模型。Ultralytics HUB等平台可以简化建立必要的定制视觉模型的过程。

未来的混合现实技术将与我们的日常生活更加紧密地结合在一起,从远程协作工作到身临其境的教育体验。能够在处理视觉数据的同时处理语言和其他输入的多模态模型的进步将带来更丰富的互动。正如南加州大学混合现实实验室(Mixed Reality Lab)等机构所设想的那样,随着计算能力的提高和设备的普及,物理世界和数字世界之间的界限将继续变得模糊,从而使混合现实技术成为人机交互界面的基本组成部分。这项技术的开发也是向自动驾驶汽车和先进的人机交互应用迈出的关键一步。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板