Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Cài đặt Cookie
Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Tìm hiểu về Google Beam, công cụ hội nghị truyền hình 3D thế hệ tiếp theo. Khám phá cách công cụ này sử dụng hình ảnh 3D và AI để tạo ra các cuộc họp ảo sống động và nhập vai.
Cuộc gọi video và cuộc họp ảo đã giúp làm việc từ xa trở nên khả thi, giúp các nhóm luôn kết nối với nhau qua nhiều quốc gia và múi giờ. Chúng đã trở thành một phần thường xuyên trong cuộc sống của chúng ta và đã thay đổi cách chúng ta giao tiếp.
Tuy nhiên, mặc dù được sử dụng rộng rãi, công nghệ cốt lõi đằng sau hội nghị truyền hình vẫn hầu như không thay đổi trong nhiều năm. Nhờ những tiến bộ gần đây, các nền tảng hội nghị truyền hình đang bắt đầu thay đổi, hướng đến mục tiêu mang lại cảm giác tự nhiên và chân thực hơn.
Thật thú vị, tại hội nghị dành cho nhà phát triển thường niên (Google I/O 2025), Google đã giới thiệu công cụ giao tiếp video mới của mình, được gọi là Google Beam. Beam sử dụng trí tuệ nhân tạo (AI) và công nghệ hội nghị truyền hình 3D để vượt ra ngoài màn hình phẳng truyền thống và tạo ra trải nghiệm nhập vai, trực tiếp hơn.
Hình 1. Tổng giám đốc điều hành của Google, Sundar Pichai, giới thiệu Google Beam ( Nguồn ).
Trên thực tế, Google Beam được thiết kế để tạo cảm giác như người bạn đang nói chuyện đang ở ngay trước mặt bạn. Không giống như các cuộc gọi video thông thường, nó mang lại những tín hiệu tinh tế của con người, như giao tiếp bằng mắt và chuyển động tự nhiên thay đổi theo góc nhìn của bạn, những chi tiết thường bị mất trên màn hình phẳng.
Trong bài viết này, chúng ta sẽ đi sâu vào Google Beam là gì, cách phát triển, cách hoạt động và các ứng dụng của nó. Hãy bắt đầu nào!
Chuyển từ Dự án Starline sang Google Beam
Trước khi tìm hiểu sâu hơn về Google Beam, chúng ta hãy cùng tìm hiểu rõ hơn về dự án tiền nhiệm của nó, Project Starline.
Được giới thiệu tại Google I/O 2021, Dự án Starline là một sáng kiến nghiên cứu nhằm mục đích làm cho giao tiếp từ xa trở nên sống động hơn, gần như thể bạn đang ở trong cùng một phòng. Nó hoạt động bằng cách tạo ra hình ảnh 3D có kích thước bằng người thật của mọi người theo thời gian thực. Mặc dù công nghệ này thu hút được nhiều sự chú ý, nhưng nó đòi hỏi các thiết lập phức tạp và phần cứng nặng.
Qua nhiều năm, khi công nghệ phát triển, Google đã tinh chỉnh phần mềm và hợp lý hóa phần cứng. Sau bốn năm phát triển, Dự án Starline đã phát triển thành Google Beam - một giải pháp nhỏ gọn và thân thiện với người dùng hơn.
Google Beam sử dụng AI để nâng cao cuộc gọi video bằng cách tạo ra hình ảnh giống 3D thực tế hơn về những người bạn đang nói chuyện. Nó biến video 2D thông thường thành chế độ xem điều chỉnh theo các góc khác nhau, giúp duy trì giao tiếp bằng mắt và giúp biểu cảm khuôn mặt dễ nhìn hơn. Nó cũng bao gồm các tính năng như dịch thời gian thực, theo dõi đầu và âm thanh không gian.
Tổng quan về Google Beam
Google Beam được phát triển để hoạt động mà không cần các phụ kiện bổ sung như tai nghe thực tế tăng cường (AR) hoặc thực tế ảo (VR). Thay vào đó, nó đi kèm với màn hình, hệ thống camera và phần cứng tích hợp riêng để tạo hình ảnh 3D. Điều này khiến các cuộc gọi video trở nên tự nhiên, thoải mái và hấp dẫn hơn so với các cuộc họp video thông thường.
Hình 3. Ví dụ về việc sử dụng Google Beam ( Nguồn ).
Cách Google Beam tạo ra các cuộc họp ảo thực tế
Bây giờ chúng ta đã thảo luận về sự ra đời của Google Beam, hãy cùng xem xét kỹ hơn cách thức hoạt động của nó.
Chụp ảnh để cộng tác từ xa đắm chìm
Tất cả bắt đầu bằng việc thu thập thông tin hình ảnh. Beam sử dụng sáu camera có độ phân giải cao để chụp ảnh từ nhiều góc độ khác nhau cùng một lúc.
Những camera này giúp theo dõi các đặc điểm khuôn mặt, ngôn ngữ cơ thể và các chuyển động nhỏ theo thời gian thực. AI đóng vai trò quan trọng bằng cách tối ưu hóa cài đặt camera và giữ cho tất cả các nguồn cấp dữ liệu video được đồng bộ hóa hoàn hảo. Điều này chuẩn bị hệ thống cho giai đoạn tiếp theo: xử lý dữ liệu.
Hội nghị truyền hình từ hình ảnh 2D sang 3D
Tiếp theo, AI được sử dụng để kết hợp sáu nguồn cấp dữ liệu camera 2D để tạo ra mô hình 3D thời gian thực của người trong tầm nhìn. Thay vì chỉ xếp lớp các hình ảnh 2D, nó tái tạo độ sâu, bóng tối và mối quan hệ không gian để tạo ra một bản sao kỹ thuật số 3D đầy đủ.
Để xây dựng mô hình 3D này, Beam sử dụng AI và các kỹ thuật thị giác máy tính như ước tính độ sâu và theo dõi chuyển động. Các phương pháp này giúp xác định khoảng cách của một người so với máy ảnh, cách họ di chuyển và cách cơ thể họ được định vị. Với dữ liệu này, hệ thống có thể lập bản đồ các đặc điểm khuôn mặt và các bộ phận cơ thể một cách chính xác trong không gian 3D.
Mô hình AI đằng sau Beam cập nhật hình ảnh 3D ở tốc độ 60 khung hình/giây (FPS) để giữ cho cuộc trò chuyện diễn ra mượt mà và sống động. Nó cũng thực hiện các điều chỉnh theo thời gian thực để phản ánh chính xác chuyển động của người đó.
Hình 4. Sáu camera của Google Beam chụp ảnh từ nhiều góc độ khác nhau ( Nguồn ).
Hệ thống hiển thị trường ánh sáng của Google Beam
Mô hình 3D được hiển thị trên hệ thống Beam của máy thu bằng màn hình trường sáng. Không giống như màn hình thông thường hiển thị cùng một hình ảnh cho cả hai mắt, màn hình trường sáng phát ra hình ảnh hơi khác nhau cho mỗi mắt, mô phỏng cách chúng ta cảm nhận độ sâu trong cuộc sống thực. Điều này tạo ra trải nghiệm hình ảnh ba chiều thực tế hơn.
Hình 5. Trao đổi cái bắt tay ảo thông qua Google Beam ( Nguồn ).
Theo dõi đầu chính xác đến từng milimet theo thời gian thực
Một trong những tính năng ấn tượng nhất của Google Beam là khả năng theo dõi AI theo thời gian thực. Hệ thống sử dụng tính năng theo dõi đầu và mắt chính xác để theo dõi chuyển động đến từng chi tiết nhỏ nhất.
Ví dụ, công cụ AI của Beam có thể liên tục theo dõi vị trí đầu của người dùng và thực hiện các điều chỉnh tinh tế cho hình ảnh theo thời gian thực . Điều này tạo ra ấn tượng rằng người trên màn hình thực sự đang ngồi đối diện với bạn. Khi bạn di chuyển đầu, hình ảnh 3D sẽ thay đổi tương ứng, giống như trong một cuộc trò chuyện trực tiếp thực sự.
Xử lý âm thanh cho giao tiếp ảo được tăng cường bằng AI
Beam cũng cải thiện trải nghiệm âm thanh bằng cách sử dụng âm thanh không gian khớp với vị trí người đó xuất hiện trên màn hình. Nếu ai đó ở bên trái màn hình, giọng nói của họ sẽ nghe như thể phát ra từ bên trái. Khi họ thay đổi vị trí, âm thanh sẽ điều chỉnh theo họ. Điều này khiến cuộc trò chuyện trở nên tự nhiên hơn và giúp não bạn theo dõi người đang nói mà không cần nỗ lực thêm.
Điều này hoạt động bằng cách kết hợp các kỹ thuật âm thanh định hướng với theo dõi thời gian thực . Beam sử dụng âm thanh không gian để mô phỏng cách chúng ta cảm nhận âm thanh tự nhiên trong thế giới thực (dựa trên hướng âm thanh đến và cách âm thanh đến từng tai). Hệ thống cũng theo dõi chuyển động đầu của người xem và điều chỉnh đầu ra âm thanh cho phù hợp, do đó âm thanh vẫn "gắn chặt" với người trên màn hình.
Ứng dụng của Google Beam
Google Beam, mặc dù vẫn đang trong giai đoạn đầu, cho thấy tiềm năng đầy hứa hẹn trong không gian hội nghị truyền hình. Sau đây là một số ứng dụng chính của nó:
Cộng tác từ xa: Google Beam có thể giúp các cuộc họp, đặc biệt là các cuộc thảo luận về lãnh đạo hoặc các cuộc đàm phán quan trọng, trở nên cá nhân và hiệu quả hơn. Bằng cách nắm bắt các yếu tố tinh tế như ngôn ngữ cơ thể và giao tiếp bằng mắt, nó giúp mọi người cảm thấy hiện diện hơn, ngay cả khi họ ở xa nhau.
Giáo dục: Beam có tiềm năng giúp việc học trực tuyến trở nên thú vị và dễ tiếp cận hơn. Hãy tưởng tượng một nhà khoa học đang giảng bài trực tiếp cho sinh viên ở cách xa nửa vòng trái đất, và thực sự có cảm giác như họ đang ở trong cùng một phòng.
Chăm sóc sức khỏe: Beam có thể khiến các buổi tư vấn từ xa trở nên cá nhân hơn. Khi bác sĩ và bệnh nhân có thể nhìn thấy nhau rõ ràng và giao tiếp bằng mắt tự nhiên, điều đó sẽ xây dựng lòng tin và khiến tương tác trở nên gần gũi hơn.
Ngành công nghiệp sáng tạo: Đối với những người trong lĩnh vực sáng tạo, như họa sĩ hoạt hình, nghệ sĩ và nhà sản xuất, Beam có thể giúp làm việc nhóm từ xa trở nên dễ dàng và tự nhiên hơn. Cho dù đó là động não ý tưởng hay xem xét một dự án, cảm giác giống như ngồi cùng nhau trong một studio hơn là gọi điện video.
Ưu và nhược điểm của Google Beam
Sau đây là một số lợi ích chính mà một sáng kiến như Google Beam mang lại:
Không cần tai nghe: Không giống như nhiều công nghệ nhập vai khác, Beam hoạt động mà không cần tai nghe AR hoặc VR. Điều này giúp trải nghiệm thoải mái hơn và tránh các vấn đề thường gặp như say tàu xe hoặc sự bất tiện khi đeo thêm thiết bị.
Giảm mỏi mắt khi nhìn màn hình : Màn hình 3D mang lại trải nghiệm xem tự nhiên và thoải mái hơn, giúp giảm mỏi mắt so với việc nhìn chằm chằm vào màn hình phẳng trong thời gian dài.
Dịch ngôn ngữ theo thời gian thực: Beam có thể tích hợp tính năng dịch thời gian thực hỗ trợ bởi AI, giúp những người nói nhiều ngôn ngữ khác nhau dễ dàng giao tiếp tự nhiên trong các cuộc họp hoặc môi trường học tập quốc tế.
Beam là một bước tiến đầy hứa hẹn, nhưng giống như bất kỳ công nghệ mới nào, nó cũng có một số hạn chế. Sau đây là một số điều cần cân nhắc:
Yêu cầu về phần cứng: Beam yêu cầu thiết bị chuyên dụng, cao cấp, chẳng hạn như màn hình trường sáng và nhiều camera, khiến công nghệ này đắt tiền và khó tiếp cận đối với cá nhân và các tổ chức nhỏ.
Không di động: Hệ thống Beam được thiết kế để lắp đặt cố định và không dễ di chuyển, điều này hạn chế tính linh hoạt và khả năng sử dụng trong môi trường di động hoặc thay đổi.
Những điểm chính
Google Beam là một bước tiến hấp dẫn hướng đến việc khiến giao tiếp ảo trở nên gần gũi hơn với con người. Mặc dù vẫn đang trong giai đoạn đầu, nhưng nó có tiềm năng biến đổi cách chúng ta gặp gỡ, kết nối và cộng tác. Bằng cách kết hợp AI tiên tiến, hình ảnh 3D và âm thanh không gian, nó tạo ra trải nghiệm từ xa sống động và hấp dẫn hơn.
Khi Google tiếp tục cải thiện phần cứng của Beam, làm cho nó nhỏ hơn nữa và có thể đưa nó đến với người dùng hàng ngày, nó mang lại những khả năng thú vị cho tương lai của giao tiếp ảo. Cùng với các xu hướng công nghệ mới như các cuộc họp ba chiều và hình đại diện 3D, Beam đang thiết lập một tiêu chuẩn mới cho các cuộc họp ảo.