Mô hình thế giới AI Genie 3 của DeepMind chuyển đổi văn bản hoặc hình ảnh thành môi trường 3D. Bước tiến này đánh dấu một bước tiến nữa hướng tới trí thông minh giống như con người.
.webp)
Mô hình thế giới AI Genie 3 của DeepMind chuyển đổi văn bản hoặc hình ảnh thành môi trường 3D. Bước tiến này đánh dấu một bước tiến nữa hướng tới trí thông minh giống như con người.
.webp)
Ngày 5 tháng 8 năm 2025, Google DeepMind đã phát hành phiên bản mới nhất của mô hình Genie, được gọi là Genie 3. Đây là mô hình AI mới có thể chuyển đổi lời nhắc văn bản của người dùng thành môi trường tương tác, năng động.
Những môi trường này, hay thế giới AI, cho phép người dùng điều hướng và tương tác với chúng trong thời gian thực, giống như trong một trò chơi điện tử. Người dùng cũng có thể mở rộng hoặc sửa đổi môi trường bằng cách cung cấp thêm các lời nhắc bằng văn bản, cho phép thay đổi nhanh chóng mà không cần khởi động lại mô phỏng.
Điều gì làm nên Genie mới nhất Google Mô hình này đặc biệt có tác động lớn vì nó có thể được sử dụng để huấn luyện các tác nhân AI. Điều này bao gồm việc dạy các tác nhân AI đưa ra quyết định hoặc thực hiện nhiệm vụ bằng cách sử dụng dữ liệu và phản hồi. Bằng cách sử dụng môi trường 3D mô phỏng thay vì thế giới thực, các nhà nghiên cứu có thể tránh được nhiều thách thức, chi phí và rủi ro của việc đào tạo trong thế giới thực.
Google Genie 3 cũng có thể mô phỏng các tình huống phức tạp, chẳng hạn như thử nghiệm xe tự lái trong thời tiết khắc nghiệt hoặc thử nghiệm bộ đồ bay lướt qua địa hình đồi núi.
Trong bài viết này, chúng ta sẽ khám phá Google Genie 3 và các tính năng của nó. Hãy cùng bắt đầu nhé!

Trước khi chúng ta đi sâu vào Google Mô hình Genie của DeepMind giúp chúng ta hiểu rõ hơn về mô hình thế giới.
Mô hình thế giới là các hệ thống AI học các quy tắc của thế giới thực như vật lý, chuyển động và quan hệ không gian từ văn bản, hình ảnh, video và tập dữ liệu chuyển động. Điều này cho phép chúng tạo ra các cảnh thực tế và dự đoán cách chúng phát triển. Các mô hình Genie là những ví dụ về các hệ thống như vậy.
Đây là một cái nhìn thoáng qua về trước đó Google Các mô hình Genie mở đường cho Genie 3:
Dựa trên các mô hình Genie trước đó, Genie 3 là phiên bản mới nhất và tiên tiến nhất trong series. Nó được xây dựng đặc biệt dựa trên Genie 2, có khả năng tạo ra các môi trường ảo mới, và Veo 3 , Google Mô hình tạo video mới nhất của DeepMind. Veo 3 thể hiện sự hiểu biết sâu sắc về vật lý và cách các vật thể tương tác trong thế giới thực.
Trong khi Veo 3 sử dụng một công cụ vật lý được mã hóa cứng, Google Genie 3 tự học cách vận hành vật lý bằng một phương pháp được gọi là học tự giám sát. Đây là một kỹ thuật học tập AI , trong đó mô hình AI học các mẫu hình và mối quan hệ từ dữ liệu chưa được gắn nhãn bằng cách tự tạo ra các tín hiệu học tập của riêng nó.
Google Khả năng tự học của Genie 3 rất quan trọng trong việc đào tạo các hệ thống AI, chẳng hạn như tác nhân AI hoặc robot AI, để xử lý nhiều nhiệm vụ khác nhau. Trên thực tế, các nhà nghiên cứu tại Google DeepMind coi Genie 3 là một bước tiến quan trọng hướng tới việc tạo ra Trí tuệ nhân tạo tổng quát (AGI) .

AGI là một dạng AI lý thuyết có thể hiểu và học bất kỳ nhiệm vụ hoặc chủ đề nào và áp dụng kiến thức đó trong các tình huống khác nhau, giống như con người. Không giống như các mô hình trí tuệ nhân tạo ngày nay, vốn được xây dựng cho các nhiệm vụ cụ thể và gặp khó khăn trong việc chuyển giao các kỹ năng của chúng sang các vấn đề mới, AGI có thể thích ứng và học hỏi trong một loạt các bối cảnh.
Dưới đây là một số tính năng chính được Genie 3 hỗ trợ:

Google Genie 3 có thể giúp việc học tập, nghiên cứu và đào tạo trở nên nhập vai và hấp dẫn hơn. Ví dụ, trong lớp học, nó có thể thổi hồn vào lịch sử, khoa học hoặc địa lý bằng cách cho phép học sinh khám phá các thành phố cổ hoặc du hành xuyên không gian . Tương tự, đối với các nhà phát triển trí tuệ nhân tạo, nó cung cấp thế giới ảo chân thực để thực hành chiến lược, vượt qua thử thách và cải thiện kỹ năng ra quyết định.
Các nhà khoa học cũng có thể sử dụng nó để tạo ra các mô phỏng có kiểm soát để kiểm tra ý tưởng, nghiên cứu hệ sinh thái hoặc quan sát hành vi của các đối tượng. Một ứng dụng thú vị khác là trong phát triển trò chơi điện tử. Các nhà phát triển trò chơi có thể biến các lời nhắc văn bản thành các thế giới trò chơi chi tiết, tăng tốc độ phát triển và giảm nhu cầu về các nhóm lớn.

Trong khi Google Genie 3 cung cấp nhiều tính năng và lợi ích, nhưng cũng cần cân nhắc đến những nhược điểm của nó.
Dưới đây là một số hạn chế cần xem xét:
Google Genie 3 đại diện cho một bước tiến đáng kể trong việc tạo ra thế giới 3D tương tác, chân thực bằng AI. Nó có thể hiện thực hóa ý tưởng từ những lời nhắc văn bản đơn giản, mô phỏng vật lý và thậm chí đào tạo các hệ thống AI trong không gian ảo an toàn.
Mặc dù vẫn còn những giới hạn, nhưng nó mở ra nhiều khả năng cho nghiên cứu, trò chơi và phát triển AI. Nó cũng là một bước quan trọng hướng tới các hệ thống AGI có thể suy nghĩ và học hỏi giống con người hơn.
Xem kho lưu trữ GitHub của chúng tôi để khám phá thêm về AI. Tham gia cộng đồng năng động của chúng tôi và khám phá những đổi mới trong các lĩnh vực như AI trong ngành bán lẻ và Vision AI trong sản xuất. Để bắt đầu với thị giác máy tính ngay hôm nay, hãy xem các tùy chọn cấp phép của chúng tôi.