Google は最近、Gemini チャットボットのメジャー アップグレードを開始しました。ユーザーが質問すると、システムはテキストで答えるだけでなく、インタラクティブな 3D モデルや物理シミュレーション シーンを直接生成することもできます。これは、ユーザーが「問題を確認」したい場合、Gemini はパラメーター コントロールを備えた回転可能でスケーラブルな 3D 視覚化を通じてそれを実行できることを意味します。

Google によると、新機能を有効にした後、Gemini は 3D モデルまたはシミュレーションを生成するときに複数のインタラクション方法を同時に提供する予定です。ユーザーはドラッグしてモデルを回転し、詳細を拡大できるだけでなく、スライダーを使用して手動で変数を調整したり、別の値を入力して変化をリアルタイムで観察したりすることもできます。物理的なプロセスや抽象的な概念を含む質問の場合、このタイプのインタラクティブな視覚化は新しいタイプの回答形式になることが期待されます。
実際に記者は「地球の周りを周回する月のシミュレーションの生成」を例としてテストを行った。その後、Gemini は視覚的な 3 次元シーンを生成します。ユーザーはスライダーで月の公転速度を調整し、スイッチで軌道を表す軌道線を表示または非表示にし、ボタンでデモンストレーションを一時停止または継続することができます。同時に、ユーザーは 3D モデルのセット全体をズームおよび回転して、さまざまな視点から動きのプロセスを観察することもできます。
これに先立って、Gemini はユーザー プロンプトに基づいたインタラクティブなフラット イメージの生成をサポートしていましたが、それは依然としてイメージ レベルのインタラクションに限定されていました。このアップグレードにより、機能が 3D モデルと動的シミュレーションに拡張され、AI 支援による複雑な概念の理解とプレゼンテーションの手段がさらに充実しました。このアップデートは、大規模なモデル ベンダー間の「視覚的な答え」をめぐる競争の最中にも行われました。つい最近、Anthropic は、Claude 向けにチャート、回路図、その他のインタラクティブな視覚化を自動的に生成する機能を導入しました。一方、OpenAI も数学的および科学的概念のための視覚化ツールを ChatGPT に追加しました。
現在、すべての Gemini アプリ ユーザーは、「Pro」モデルを選択することでこの新機能を体験できます。操作パスは、アプリケーションでモデルを Pro に切り替えてから、Gemini に「二重振り子システムを表示」や「ドップラー効果の視覚化を手伝って」などのリクエストを送信します。 Gemini がテキストの説明を返すと、インターフェイスの下部に [ビジュアライゼーションを表示] ボタンが表示されます。クリックすると、対応する 3D モデルまたはシミュレーション シーンが生成されます。