OpenAI の ChatGPT は世界的な現象となり、史上最も急速に成長している消費者向け製品の 1 つですが、Google の Bard は後付けのように感じられます。チャットボットは、他の Google サービス全体でのデータへのアクセスなどの新機能を追加し続けていますが、その回答や情報は、ChatGPT や GPT-3 および GPT-4 を使用する他のボットと比較することはほとんどないようです。
しかし、Bard の主張はさらに強まる可能性がある。本日より、170 か国の英語圏ユーザーを対象に、Bard は Google の新しい Gemini モデルを利用することになる。Google によれば、このモデルは多くの点で OpenAI の技術と同等か、それ以上であるという。 (Google は、Gemini は「近い将来」さらに多くの言語と国で利用可能になるだろうと述べています。)
Bard は現在、Gemini シリーズの中間レベルである GeminiPro を実行しています。 Ultra は最大で最も遅いですが、最も強力です。 Nano は小型かつ高速で、デバイスのタスクを実行するために使用されます。プロはその中間です。実際、これは高速かつ効率的で、可能な限り強力です。
GoogleでBardの責任者であるSissie Hsiao氏は記者会見で、GeminiはこれまでのBardに対する最大かつ最良のアップグレードであると述べた。グーグルのサンダー・ピチャイ最高経営責任者(CEO)は「すべての機能が大幅に改善される。人々は製品がより良くなったと感じるだろう」と語った。 「ユーザーの意図をよりよく理解し、より適切に答えます。」それはより事実に基づいており、より高品質です。コードを書きたい場合は、さらに良いです。 」
現時点では、Bard は単なるチャットボットです。メッセージを入力すると、応答します。しかし、今後登場する Bard の新バージョンはさらに強力になる可能性があります。来年、GoogleはGeminiUltraを搭載した「BardAdvanced」のプレビュー版を発売する予定だ。 GeminiUltra はモデルのマルチモーダル バージョンでもあり、テキストに加えて、画像、オーディオ、ビデオを受け入れて作成できることを意味します。
テキスト以外のインタラクションこそが双子座の真価を発揮するところです
Google DeepMindの責任者であるデミス・ハサビス氏は、テキスト以外のインタラクションがGeminiの真のハイライトであると述べた。 「私たちは最初からネイティブにマルチモーダルになるように構築しました」と彼は言いました。 「これは新しい機能の 1 つです。モダリティ全体でのシームレスな統合と推論が可能になります。」
Googleのデモには、YouTubeユーザーのMark Rober氏がBard氏を使って完璧な紙飛行機の作り方をガイドする様子(デザインの写真を撮ってAIからフィードバックを得るなど)や、保護者が子供の宿題の写真をアップロードして数学の問題のどこに焦点を当てるべきかを理解する手助けを求めるものが含まれている。
ただし、これらは単なるデモとプロモーションビデオです。ピチャイ氏は、この打ち上げがバードにとって大きな瞬間であるとともに、ジェミニ時代の始まりであると考えていると語った。それでも、Google のベンチマークが正しければ、新しいモデルによって Bard は ChatGPT と同じくらい優れたチャットボットになった可能性があります。これはすでに非常に注目に値する成果です。