Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Thực tế hợp nhất

Khám phá Thực tế hợp nhất (Merged Reality - MR), công nghệ kết hợp liền mạch các đối tượng ảo với thế giới thực. Tìm hiểu cách AI và thị giác máy tính cung cấp sức mạnh cho trải nghiệm tương tác này.

Thực tế Hợp nhất (MR) đại diện cho một sự tiến hóa tinh vi trong cách con người tương tác với nội dung số, tạo ra một môi trường nơi thế giới thực và thế giới ảo trở nên gắn kết chặt chẽ. Không giống như các lớp phủ cơ bản trong Thực tế Tăng cường (AR) , Thực tế Hợp nhất đảm bảo rằng các vật thể kỹ thuật số không chỉ xuất hiện trong tầm nhìn của người dùng mà còn tương tác vật lý với môi trường thực. Trong bối cảnh MR, một quả bóng ảo có thể lăn khỏi bàn thực và nảy trên sàn thực, hoặc một nhân vật kỹ thuật số có thể ẩn sau ghế sofa ngoài đời thực, thể hiện sự hiểu biết về chiều sâu, sự che khuất và các ranh giới vật lý. Sự tích hợp liền mạch này chủ yếu dựa vào Thị giác Máy tính (CV) tiên tiến và Trí tuệ Nhân tạo (AI) để lập bản đồ môi trường xung quanh theo thời gian thực.

Công nghệ đằng sau sự đắm chìm

Để Thực Tế Hợp Nhất trở nên thuyết phục, hệ thống phải sở hữu sự hiểu biết ngữ nghĩa sâu sắc về thế giới vật lý. Điều này đạt được thông qua sự kết hợp giữa phần cứng chuyên dụng, chẳng hạn như cảm biến LiDAR và camera độ sâu, cùng các thuật toán phần mềm mạnh mẽ. Công nghệ cốt lõi thường bao gồm Định vị và Lập bản đồ Đồng thời (SLAM) , cho phép thiết bị track chuyển động riêng của nó trong khi xây dựng bản đồ về môi trường chưa biết.

Trong quy trình này, các mô hình Học Sâu (DL) đóng vai trò then chốt. Cụ thể, phát hiện đối tượng xác định các mục trong cảnh, trong khi phân đoạn thực thể xác định ranh giới chính xác của chúng. Độ chính xác đến từng pixel này rất quan trọng đối với "sự che khuất" - hiệu ứng hình ảnh khi một vật thể thật che khuất tầm nhìn của một vật thể ảo, duy trì ảo giác về chiều sâu. Các mô hình hiệu suất cao như Ultralytics YOLO11 thường được sử dụng để cung cấp độ trễ suy luận thấp cần thiết để giữ cho các tương tác này mượt mà và không gây khó chịu cho người dùng.

Thực tế hợp nhất so với các khái niệm liên quan

Việc tìm hiểu thuật ngữ điện toán không gian có thể khá khó khăn. Việc xem xét các công nghệ này theo chuỗi liên tục của tính ảo sẽ rất hữu ích:

  • Thực tế tăng cường (AR): Các yếu tố kỹ thuật số được chồng lên thế giới thực nhưng thường thiếu nhận thức về không gian. Một mũi tên GPS nổi trên màn hình điện thoại là một ví dụ điển hình.
  • Thực tế ảo (VR): Người dùng hoàn toàn đắm chìm trong môi trường kỹ thuật số tổng hợp, cắt đứt tiếp xúc trực quan với thế giới vật lý.
  • Thực tế Hợp nhất (MR): Thường được dùng thay thế cho Thực tế Hỗn hợp, thuật ngữ này đặc biệt nhấn mạnh tính tương tác và khả năng phản hồi của các vật thể ảo với vật lý và ánh sáng trong thế giới thực. Nó tạo ra một Bản sao Kỹ thuật số của môi trường xung quanh để neo nội dung một cách an toàn.

Các Ứng dụng Thực tế

Merged Reality đang chuyển đổi các ngành công nghiệp bằng cách thu hẹp khoảng cách giữa dữ liệu kỹ thuật số và hành động thực tế.

  1. Điều hướng Phẫu thuật Nâng cao: Trong AI trong Chăm sóc Sức khỏe , kính MR cho phép bác sĩ phẫu thuật "nhìn xuyên thấu" bệnh nhân. Bằng cách phủ dữ liệu quét MRI hoặc CT 3D trực tiếp lên cơ thể bệnh nhân, bác sĩ có thể hình dung giải phẫu bên trong, chẳng hạn như mạch máu hoặc khối u, trước khi rạch da. Điều này đòi hỏi phải ước tính tư thế chính xác để căn chỉnh hình ảnh y tế với vị trí thực tế của bệnh nhân trên bàn mổ.
  2. Bảo trì và Đào tạo Công nghiệp: Trong lĩnh vực AI trong Sản xuất , các kỹ thuật viên sử dụng MR để sửa chữa máy móc phức tạp. Thay vì tham khảo sách hướng dẫn giấy, kỹ thuật viên sẽ thấy các hướng dẫn 3D tương tác, từng bước được gắn chặt vào các bộ phận máy. Nếu cần thay thế một bộ phận, hệ thống có thể làm nổi bật bu lông cụ thể cần tháo. Ứng dụng robot và tăng cường con người này giúp giảm đáng kể thời gian đào tạo và sai sót.

Triển khai nhận thức cho MR

Một khối xây dựng cơ bản cho bất kỳ hệ thống Thực tế Hợp nhất nào là khả năng detect và định vị các đối tượng trong thế giới thực để nội dung ảo có thể phản ứng với chúng. Ví dụ sau đây cho thấy cách sử dụng ultralytics để thực hiện phát hiện đối tượng theo thời gian thực, cung cấp dữ liệu tọa độ cần thiết để neo tài sản ảo.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Perform inference on an image (or video frame from an MR headset)
results = model("path/to/scene.jpg")

# Display results
# In an MR app, the bounding box coordinates (results[0].boxes.xyxy)
# would be used to anchor 3D graphics to the detected object.
results[0].show()

Định hướng tương lai

Tương lai của Thực tế Hợp nhất gắn liền chặt chẽ với sự phát triển của Trí tuệ Nhân tạo Biên (Edge AI) . Khi tai nghe và kính trở nên nhẹ hơn, việc xử lý dữ liệu hình ảnh nặng nề phải diễn ra trực tiếp trên thiết bị để giảm thiểu độ trễ. Những tiến bộ trong lượng tử hóa mô hình cho phép các mạng nơ-ron phức tạp hoạt động hiệu quả trên phần cứng di động. Hơn nữa, việc tích hợp AI tạo sinh cho phép tạo ra các tài sản ảo động ngay lập tức, đưa chúng ta đến gần hơn với tầm nhìn về Điện toán Không gian rộng rãi, nơi vật lý và kỹ thuật số không thể phân biệt được.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay