DeepMindのGenie 3 AIワールドモデルは、テキストまたは画像のプロンプトを3D環境に変換します。この進歩は、人間のような知能に向けたもう1つのステップとなります。
.webp)
DeepMindのGenie 3 AIワールドモデルは、テキストまたは画像のプロンプトを3D環境に変換します。この進歩は、人間のような知能に向けたもう1つのステップとなります。
2025年8月5日、Google DeepMindはGenieモデルの最新バージョンであるGenie 3をリリースしました。これは、ユーザーのテキストプロンプトを動的でインタラクティブな環境に変換できる新しいAIモデルです。
これらの環境、つまりAIの世界では、ユーザーはビデオゲームのように、リアルタイムでナビゲートして操作できます。ユーザーは、追加のテキストプロンプトを提供して環境を拡張または変更することもでき、シミュレーションを再開せずにオンザフライで変更できます。
最新のGenie Googleモデルが特に影響力があるのは、AIエージェントのトレーニングに使用できることです。これには、データとフィードバックを使用してAIエージェントに意思決定やタスクの実行を教えることが含まれます。現実世界の代わりにシミュレートされた3D環境を使用することで、研究者は現実世界のトレーニングの課題、コスト、リスクの多くを回避できます。
Google Genie 3は、悪天候の中を走行する自動運転車や、山岳地帯を滑空するウィングスーツなど、複雑なシナリオをシミュレートすることもできます。
この記事では、Google Genie 3とその機能について解説します。それでは始めましょう!
Google DeepMindのGenieモデルについて掘り下げる前に、ワールドモデルとは何かをより深く理解しましょう。
ワールドモデルは、テキスト、画像、動画、および動きのデータセットから、物理、運動、空間関係といった現実世界のルールを学習するAIシステムです。これにより、現実的なシーンを作成し、それらがどのように進化するかを予測できます。Genieモデルは、そのようなシステムの例です。
Genie 3の道を切り開いた、初期のGoogle Genieモデルを簡単にご紹介します。
以前のGenieモデルを基盤として、Genie 3はシリーズ最新かつ最先端です。特に、新しい仮想環境を生成できるGenie 2と、Google DeepMindの最新ビデオ生成モデルであるVeo 3を基に構築されています。Veo 3は、物理学と現実世界でのオブジェクトの相互作用について深い理解を示しています。
Veo 3はハードコードされた物理エンジンを使用していますが、Google Genie 3は自己教師あり学習と呼ばれる方法を使用して、物理がどのように機能するかを自ら学習します。これは、AIモデルが独自の学習シグナルを生成することにより、ラベルなしデータからパターンと関係を学習するAI学習テクニックです。
Google Genie 3の自己教師あり学習能力は、AIエージェントやAIロボットなどのAIシステムがさまざまなタスクを処理できるようにトレーニングする上で非常に重要です。実際、Google DeepMindの研究者たちは、Genie 3を汎用人工知能(AGI)の創造に向けた重要な一歩と捉えています。
AGIは、あらゆるタスクや主題を理解して学習し、その知識を人間のようにさまざまな状況に適用できる、AIの理論的な形態です。特定のタスクのために構築され、そのスキルを新しい問題に転送するのに苦労する今日の人工知能モデルとは異なり、AGIは幅広いコンテキストで適応して学習することができます。
Genie 3でサポートされている主な機能を以下に示します。
Google Genie 3は、学習、研究、トレーニングをより没入型で魅力的なものにすることができます。たとえば、教室では、学生が古代都市を探索したり、宇宙を旅したりできるようにすることで、歴史、科学、地理を生き生きとさせることができます。同様に、人工知能開発者にとっては、戦略を実践し、課題を乗り越え、意思決定スキルを向上させるための現実的な仮想世界を提供します。
科学者はまた、アイデアをテストしたり、生態系を研究したり、オブジェクトの挙動を観察したりするための制御されたシミュレーションを作成するためにもそれを使用できます。もう1つの興味深いアプリケーションは、ビデオゲーム開発です。ゲーム開発者は、テキストプロンプトを詳細なゲーム世界に変え、開発をスピードアップし、大規模なチームの必要性を減らすことができます。
Google Genie 3は多くの機能と利点を提供しますが、その欠点も考慮することが重要です。
考慮すべきいくつかの制限事項を以下に示します。
Google Genie 3は、AIを活用してリアルでインタラクティブな3Dワールドを構築する上で、大きな進歩を遂げています。簡単なテキストプロンプトからアイデアを具現化し、物理演算をシミュレートし、安全な仮想空間でAIシステムをトレーニングすることも可能です。
まだ限界はありますが、研究、ゲーム、AI開発に多くの可能性が開かれています。また、人間のように考え、学習できるAGIシステムに向けた重要なステップでもあります。
AIに関する詳細については、GitHubリポジトリをご覧ください。活発なコミュニティに参加して、小売業におけるAIや製造業におけるVision AIなどの分野におけるイノベーションを発見してください。今日からコンピュータビジョンを始めるには、ライセンスオプションをご確認ください。