Глоссарий

Объединенная реальность

Откройте для себя Merged Reality (MR) - технологию, которая позволяет плавно соединять виртуальные объекты с реальным миром. Узнайте, как искусственный интеллект и компьютерное зрение обеспечивают этот интерактивный опыт.

Объединенная реальность (MR) представляет собой усовершенствованную форму смешанной реальности, в которой реальные и виртуальные объекты сливаются в единую интерактивную среду. В отличие от более ранних технологий, которые просто накладывали цифровую информацию на физический мир, MR позволяет цифровому контенту быть пространственно осознанным и реагировать на реальное окружение. Это означает, что виртуальные объекты могут быть закрыты реальными объектами, взаимодействовать с физическими поверхностями и управляться пользователями так, как если бы они физически присутствовали. Такая бесшовная интеграция достигается за счет сложного отображения окружающей среды, слияния датчиков и рендеринга в реальном времени, создавая по-настоящему захватывающий и интерактивный опыт.

Слияние реальности и смежных понятий

Важно отличать Merged Reality от других технологий, связанных с континуумом реальности-виртуальности:

  • Дополненная реальность (AR): AR обычно накладывает цифровую информацию - текст, значки или простую графику - на живое изображение реального мира, часто через экран смартфона. Цифровые элементы обычно не взаимодействуют с физической средой.
  • Виртуальная реальность (VR): VR создает полностью иммерсивную искусственную среду, которая заменяет реальное окружение пользователя. Пользователи полностью погружаются в цифровой мир и не взаимодействуют с физическим пространством.
  • Смешанная реальность (XR): Это зонтичный термин, объединяющий AR, VR и MR. Хотя иногда его используют как взаимозаменяемый с MR, смешанная реальность относится к наиболее продвинутой части спектра, где цифровая и физическая реальности тесно переплетаются и взаимодействуют.

Роль искусственного интеллекта в объединенной реальности

Искусственный интеллект (ИИ), в частности компьютерное зрение (КВ), - это движущая сила настоящей объединенной реальности. Чтобы виртуальные объекты убедительно взаимодействовали с реальным миром, система должна сначала воспринять и понять свое физическое окружение. Именно здесь решающую роль играют модели машинного обучения (ML).

Алгоритмы искусственного интеллекта позволяют МР-устройствам, таким как Microsoft HoloLens 2, выполнять сложные задачи в режиме реального времени. К ним относятся пространственное отображение, отслеживание движения рук и глаз, а также понимание сцены. Например, модели обнаружения объектов, такие как Ultralytics YOLO11, могут идентифицировать и определять местоположение объектов реального мира, позволяя цифровому контенту взаимодействовать с ними. Аналогично, сегментация объектов помогает системе понять точную форму и границы объектов, что позволяет реалистично накладывать окклюзию, когда виртуальный мяч может закатиться за реальный стул. Такой уровень осведомленности об окружающей среде необходим для создания правдоподобного опыта MR.

Применение в реальном мире

Слияние реальностей переходит из исследовательских лабораторий в практическое применение в различных отраслях, часто благодаря специализированному искусственному интеллекту.

  1. Интерактивная промышленная помощь: При использовании ИИ на производстве техник может надеть гарнитуру MR для обслуживания сложного оборудования. Используя модели обнаружения объектов, обученные на пользовательских наборах данных, система определяет конкретные детали и накладывает интерактивные 3D-схемы, пошаговые инструкции или диагностические данные непосредственно на оборудование. Это сокращает количество ошибок и время ремонта. Это одна из форм робототехники, которая расширяет возможности человека, а не заменяет его.
  2. Усовершенствованная хирургическая навигация: В здравоохранении на основе ИИ магнитно-резонансная томография преобразует хирургические операции. Во время операции хирург может наложить 3D-сканы пациента (например, КТ или МРТ) на его тело. Это позволяет получить живую интерактивную карту внутренних структур. Оценка позы позволяет отслеживать положение хирургических инструментов относительно виртуальной анатомии, повышая точность и безопасность.

Ключевые технологии и будущие направления

В основе MR лежит сочетание аппаратного и программного обеспечения. Устройствам требуются передовые датчики, включая камеры глубины и IMU, обрабатываемые на мощном аппаратном обеспечении краевого ИИ для обеспечения низкой задержки выводов. Программный стек в значительной степени зависит от фреймворков глубокого обучения, таких как PyTorch и TensorFlow, для запуска моделей восприятия. Платформы, подобные Ultralytics HUB, позволяют упростить процесс создания необходимых пользовательских моделей зрения.

Будущее объединенной реальности указывает на еще более тесную интеграцию в нашу повседневную жизнь, от совместной удаленной работы до погружения в образовательный процесс. Достижения в области мультимодальных моделей, способных обрабатывать визуальные данные наряду с языковыми и другими данными, обеспечат более насыщенное взаимодействие. По мере роста вычислительных мощностей и уменьшения навязчивости устройств грань между физическим и цифровым миром будет стираться, делая объединенную реальность фундаментальной частью интерфейса "человек-компьютер", как предполагают такие организации, как Mixed Reality Lab в Университете Южной Калифорнии. Развитие этой технологии также является ключевым шагом к применению в автономных транспортных средствах и продвинутом взаимодействии человека и робота.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена