Yolo Vision Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Thực tế hợp nhất

Khám phá Thực tế hợp nhất (Merged Reality - MR), công nghệ kết hợp liền mạch các đối tượng ảo với thế giới thực. Tìm hiểu cách AI và thị giác máy tính cung cấp sức mạnh cho trải nghiệm tương tác này.

Thực tế hợp nhất (Merged Reality - MR) thể hiện một hình thức thực tế hỗn hợp nâng cao, trong đó các đối tượng thực và ảo được pha trộn vào một môi trường tương tác duy nhất. Không giống như các công nghệ trước đây chỉ đơn giản là phủ thông tin kỹ thuật số lên thế giới vật chất, MR cho phép nội dung kỹ thuật số nhận biết không gian và phản ứng với môi trường thực. Điều này có nghĩa là các đối tượng ảo có thể bị che khuất bởi các đối tượng thực, tương tác với các bề mặt vật lý và được người dùng thao tác như thể chúng hiện diện về mặt vật lý. Sự tích hợp liền mạch này đạt được thông qua ánh xạ môi trường phức tạp, kết hợp cảm biến và kết xuất thời gian thực, tạo ra trải nghiệm thực sự sống động và tương tác.

Thực tế hợp nhất so với các khái niệm liên quan

Điều quan trọng là phải phân biệt Merged Reality với các công nghệ liên quan khác trên chuỗi liên tục thực tế-ảo:

  • Thực tế tăng cường (AR): AR thường phủ thông tin kỹ thuật số—như văn bản, biểu tượng hoặc đồ họa đơn giản—lên chế độ xem trực tiếp của thế giới thực, thường là thông qua màn hình điện thoại thông minh. Các yếu tố kỹ thuật số thường không tương tác với môi trường vật lý.
  • Thực tế ảo (VR): VR tạo ra một môi trường nhân tạo, hoàn toàn nhập vai, thay thế môi trường thế giới thực của người dùng. Người dùng hoàn toàn được bao bọc trong một thế giới kỹ thuật số và không tương tác với không gian vật lý của họ.
  • Thực tế hỗn hợp (XR): Đây là một thuật ngữ bao trùm bao gồm AR, VR và MR. Mặc dù đôi khi được sử dụng thay thế cho MR, Thực tế hợp nhất (Merged Reality) đặc biệt đề cập đến đầu cuối tiên tiến nhất của quang phổ, nơi thực tế kỹ thuật số và vật lý được đan xen và tương tác sâu sắc.

Vai trò của AI trong Thực Tế Hợp Nhất

Trí tuệ nhân tạo (AI), đặc biệt là Thị giác máy tính (CV), là động cơ thúc đẩy Merged Reality (Thực tế hỗn hợp). Để các đối tượng ảo tương tác một cách thuyết phục với thế giới thực, hệ thống trước tiên phải nhận thức và hiểu được môi trường vật lý xung quanh. Đây là nơi các mô hình Học máy (ML) trở nên quan trọng.

Các thuật toán AI cho phép các thiết bị MR, chẳng hạn như Microsoft HoloLens 2, thực hiện các tác vụ phức tạp trong thời gian thực. Điều này bao gồm lập bản đồ không gian, theo dõi tay và mắt, và hiểu cảnh. Ví dụ: các mô hình nhận diện đối tượng, như Ultralytics YOLO11, có thể xác định và định vị các đối tượng trong thế giới thực, cho phép nội dung kỹ thuật số tương tác với chúng. Tương tự, phân vùng thể hiện giúp hệ thống hiểu hình dạng và ranh giới chính xác của các đối tượng, cho phép che khuất thực tế, trong đó một quả bóng ảo có thể lăn phía sau một chiếc ghế ngoài đời thực. Mức độ nhận biết môi trường này là rất cần thiết để tạo ra trải nghiệm MR đáng tin cậy.

Các Ứng dụng Thực tế

Thực tế hợp nhất đang chuyển từ các phòng thí nghiệm nghiên cứu sang các ứng dụng thực tế trong nhiều ngành công nghiệp khác nhau, thường được thúc đẩy bởi AI chuyên dụng.

  1. Hỗ trợ Công nghiệp Tương tác: Trong AI trong sản xuất, một kỹ thuật viên có thể đeo kính MR để bảo trì máy móc phức tạp. Sử dụng các mô hình phát hiện đối tượng được huấn luyện trên bộ dữ liệu tùy chỉnh, hệ thống xác định các bộ phận cụ thể và phủ các sơ đồ 3D tương tác, hướng dẫn từng bước hoặc dữ liệu chẩn đoán trực tiếp lên thiết bị. Điều này làm giảm lỗi và thời gian sửa chữa. Đây là một hình thức robot học giúp tăng cường khả năng của con người thay vì thay thế nó.
  2. Điều hướng Phẫu thuật Nâng cao: Trong chăm sóc sức khỏe được hỗ trợ bởi AI, MR đang thay đổi các quy trình phẫu thuật. Bác sĩ phẫu thuật có thể phủ các bản quét y tế 3D của bệnh nhân (như CT hoặc MRI) lên cơ thể của họ trong quá trình phẫu thuật. Điều này cung cấp một bản đồ trực tiếp, tương tác về các cấu trúc bên trong. Ước tính tư thế có thể theo dõi vị trí của các dụng cụ phẫu thuật so với giải phẫu ảo, nâng cao độ chính xác và an toàn.

Các công nghệ chính và định hướng tương lai

Nền tảng của MR dựa trên sự kết hợp giữa phần cứng và phần mềm. Các thiết bị yêu cầu cảm biến tiên tiến, bao gồm camera đo chiều sâu và IMU, được xử lý trên phần cứng AI biên mạnh mẽ để đảm bảo độ trễ suy luận thấp. Phần mềm phụ thuộc nhiều vào các framework học sâu như PyTorchTensorFlow để chạy các mô hình nhận thức. Các nền tảng như Ultralytics HUB có thể hợp lý hóa quy trình xây dựng các mô hình thị giác tùy chỉnh cần thiết.

Tương lai của Merged Reality hướng tới sự tích hợp liền mạch hơn nữa với cuộc sống hàng ngày của chúng ta, từ công việc từ xa hợp tác đến trải nghiệm giáo dục nhập vai. Những tiến bộ trong các mô hình đa phương thức có thể xử lý dữ liệu trực quan cùng với ngôn ngữ và các đầu vào khác sẽ cho phép các tương tác phong phú hơn. Khi sức mạnh tính toán tăng lên và các thiết bị trở nên kín đáo hơn, ranh giới giữa thế giới vật chất và kỹ thuật số sẽ tiếp tục mờ đi, khiến Merged Reality trở thành một phần cơ bản của giao diện người-máy tính, như được hình dung bởi các tổ chức như Mixed Reality Lab tại Đại học Nam California. Sự phát triển của công nghệ này cũng là một bước quan trọng hướng tới các ứng dụng trong xe tự hành và tương tác người-robot tiên tiến.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard