Google は最近、生成された世界の「一貫性」の向上に焦点を当てた、生成 AI 世界モデル Genie 3 の最新の進歩を実証しました。ただし、全体的な機能は、プロのゲーム開発プロセスを真にサポートできるにはまだ程遠いです。
Google が数か月前に Project Genie を初めて導入したとき、このプロジェクトはゲーム開発と仮想世界構築のプロセスを変える可能性のある「ゲームチェンジャー」になる可能性があると見られていました。しかし、GDC での Google の最新の紹介によれば、Project Genie の中核エンジンである Genie 3 モデルは、「業界を転覆する」、さらには「業界の仕組みを大きく変える」までにはまだ遠いとのことです。
Google は、Project Genie を、インタラクティブな世界をリアルタイムで生成できるツールのセットとして位置づけています。開発者はテキストによる説明を提供するだけでよく、Genie 3 のユニバーサル モデルは、「フォトリアリスティック」な 3 次元環境を生成し、これに基づいて物理的および論理的制約を追加できるため、ユーザーはリアルタイムで探索できます。 Google DeepMind はまた、Genie 3 を汎用人工知能 (AGI) 戦略の長期追求における重要なモデルの 1 つとみなしており、「マトリックス」と同様の高度な推論機能を備えた仮想エージェントに移行することを望んでいます。
現実はビジョンよりもはるかに抑制されています。 Googleは、「Playable Worlds」をテーマとしたGDCの講演で、Genie 3の初期バージョンでは3次元世界の一貫性を数秒しか維持できないことを明らかにした。最近の一連のアップグレードにより、現在のモデルのワールド一貫性のパフォーマンスは約 1 分に向上しました。この時間を超えると、写真や場面は急速に崩壊し、混沌とした歪んだ「幻覚」画像に発展します。

技術的には、Genie 3 によって生成される「世界」は、従来の意味での安定したシーンとオブジェクトで構成される 3D 環境ではなく、フレームごとにつなぎ合わされたビデオ ストリームに近いものです。言い換えれば、これは完全に構造化されたゲーム レベルや、継続的にロードして編集できるオープンワールドというよりも、テキスト プロンプトに即座に反応する動的なビデオに似ています。 DeepMindの研究者Alexandre Moufarek氏は、Googleはゲーム業界全体を置き換えることを目標にGenie 3やProject Genieを開発しているわけではないが、モデルが進化し続けるにつれ、将来的にはそこからゲームを生成する能力が「自然に成長する」可能性があると強調した。
公式声明の中で、AGI が依然として Genie プロジェクトの主な目標であるが、Moufarek 氏はまた、適切な段階でこの種の生成世界テクノロジーをゲーム開発者に公開し、最初に「プレイ」して「試してみる」機会を提供したいと明言しました。現在の成熟度から判断すると、Genie 3 は「ゲーム作成に直接使用する」というレベルには程遠く、短期的にはスタジオの制作パイプラインの信頼できるリンクにはなり得ないでしょう。
Project Genie はゲーム業界を直接「転覆」するように設計されたものではありませんでしたが、関連ニュースが発表されると、生成ワールド技術に対する市場の敏感な期待を反映して、依然として一部のゲーム会社の株価の変動を引き起こしました。 Genie は、世界の一貫性という技術的な問題に加えて、実用化の過程で大きな障害、特に任天堂のような権利保護の姿勢が強いメーカーと取引する場合、著作権と知的財産の所有権の問題に直面する可能性があります。このテクノロジーに基づいた実用化は、長期的な法的課題や不確実性に直面する可能性があります。
Google の現在の行動から判断すると、同社は依然として生成 AI 機能全体の反復に重点を置いています。この GDC で、Google は SIMA 2 のアップグレード バージョンもデモしました。この AI エージェントは、複雑なスクリプトを必要とせずに自律的にビデオ ゲームをプレイするように設計されています。これは、「ゲームをプレイできるAI」を探求するGoogleのもう一つの試みです。
業界の観点から見ると、Genie 3 の進歩は、短期間でジェネレーティブ ワールド モデルによってなされた目に見える改善を反映しているだけでなく、実際の制作との間に大きなギャップがあることも明らかにしています。一貫性が 1 分であるということは、現時点では、長期サイクルで信頼性の高い商用ゲーム プロジェクトに取り組むよりも、技術的なデモンストレーションや概念実証に適していることを意味します。著作権、責任の定義、業界の生態が明確になる前は、この種のテクノロジーは、既存のゲーム エンジンやコンテンツ パイプラインを置き換える「究極のソリューション」というよりは、補助的なクリエイティブおよびプロトタイピング ツールとして存在する可能性が高くなります。