フィナンシャル・タイムズ紙がこの件に詳しい関係者の話として伝えたところによると、グーグルは今年3月ごろ、メタに対し、ジェミニ・モデルの大規模な計算能力と容量のニーズをもはや満たすことができず、ソーシャル巨人はその使用量を削減し、複数の社内AIプロジェクトを延期せざるを得なくなったと警告した。関連する制限は現在も継続中です。メタ社は社内従業員に対し、AIトークンの消費を「注意深く監視」し、モデルの入力、出力、全体的な使用状況を呼び出すためにより抑制的なアプローチを使用するよう求めている。これは、過去1年間、社内でAIの使用を精力的に推進し、特定のシナリオではAIの使用を「義務化」さえしてきた同社の姿勢とは対照的だ。

同報告書は、Metaが近年独自のLlamaオープンソースモデルの構築に多額の投資を行っており、CEOのマーク・ザッカーバーグ氏はAIが同社の次世代コアプラットフォームになると継続的に宣言しているにもかかわらず、実際には多くの重要なビジネスリンクにおいてGoogleのGeminiに大きく依存していると指摘した。事情に詳しい関係者によると、Meta はカスタマー サービス、広告主のチャットボット、コード生成、疑わしいまたは有害なコンテンツの削除、不正行為の検出などのシナリオで Gemini を広く使用しており、Gemini が社内で推奨されるソリューションとして選ばれたのは、まさにそのパフォーマンスが Meta 自身のモデルより優れているためです。同時に、Anthropic の Claude も競合し、いくつかのビジネスでそれを使用しています。
Google の供給逼迫は Meta だけでなく、Google Cloud や Gemini を使用している他の顧客にも影響を及ぼしますが、Meta が際立っているのは、同様の顧客よりも需要がはるかに高いためです。 Google、Microsoft、Amazon とは異なり、Meta は独自のクラウド コンピューティング ビジネスを運営していません。つまり、社内で自社開発した AI システムに加えて、外部のコンピューティング能力とモデル サービスを競合他社から購入する必要があります。内需の急速な拡大を背景に、この構造的依存の問題はさらに増幅される。
AIの需要の急増に対応するため、Googleは近年、データセンターや専用ハードウェアへの投資を増やし続けている。同社のクラウド事業の四半期収益は200億米ドルを超え、未完了の受注残は4,600億米ドル近くに達しており、コンピューティングパワー市場全体の需要が既存の生産能力をはるかに上回っていることを示しています。 Googleは、自社のファーストパーティモデルが直接API呼び出しを通じて毎分160億以上のトークンを処理し、前四半期から約60%増加したと発表した。これは、大規模モデルの商用化段階では、コンピューティング能力と容量が重要なボトルネック リソースになっていることを側面から確認したものでもあります。
Meta は、同じ問題を別の方法で解決しようとしています。一方で、同社は独自のデータセンターを拡張し、他方では、Broadcom と協力してカスタマイズされた MTIA アクセラレーション チップを開発し、将来的には Google などのクラウド サービスやモデル プロバイダーへの依存を徐々に減らしたいと考えています。メタバースへの賭けが挫折した後、メタは AI 分野での「次のプラットフォーム」の物語を早急に確立する必要があります。外部モデルへの過度の依存により「制限」があったというこの事件は、インフラストラクチャとコンピューティング能力のレイアウトにおけるその欠点と緊急性も明らかにしました。