AmazonのクラウドコンピューティングプラットフォームAWSは火曜日、大企業や政府機関が自社のデータセンターでAmazonの人工知能システムを実行できるようにする「AI Factories」と呼ばれる新製品の発売を発表した。顧客はコンピューター室と電源を提供し、AWS は AI インフラストラクチャ全体の導入と統合された運用と保守の実行を担当します。既存のAWSクラウドサービスとの接続も可能です。

このモデルは、データ主権に非常に敏感で、データをサードパーティのモデル プロバイダーにアップロードしたり、基盤となるハードウェア リソースを他のユーザーと共有したりする必要がないことを望んでいる組織を対象としています。
新製品名の「AIファクトリー」というコンセプトは、GPUチップやネットワーク機器など大規模モデルの実行に必要なコンポーネントの完全なセットを統合する、NVIDIAの既存の同名のハードウェアシステムに由来している。 AWS の AI Factory は、実際には NVIDIA との綿密な協力プロジェクトです。両社は、このソリューションが両当事者の技術力を組み合わせて、統合された AI コンピューティング能力とプラットフォーム スタックを顧客に提供することを確認しました。
具体的な構成に関して、企業は、NVIDIA の最新世代 Blackwell GPU をインストールするか、Amazon の新しい自社開発の Trainium3 トレーニング チップを使用するかを選択して、さまざまなコンピューティング能力とコストのニーズを満たすことができます。このシステムは、コンピューティング能力に加えて、AWS 独自のネットワーク、ストレージ、データベース、セキュリティコンポーネントを統合し、モデル選択およびホスティングサービスである Amazon Bedrock と、モデル構築およびトレーニングプラットフォームである SageMaker に直接アクセスでき、基盤となるハードウェアから上位層の開発ツールに至る統一環境を形成します。
「AI工場」に賭けているクラウドコンピューティング大手はAWSだけではないことは注目に値する。マイクロソフトは 10 月の初めに、グローバル データ センターで OpenAI やその他のワークロードをホストするために使用される NVIDIA AI Factory テクノロジに基づく AI インフラストラクチャを実証し、このアーキテクチャを中心にウィスコンシン州とジョージア州に新世代の「AI スーパー ファクトリー」レベルのデータ センターを構築しました。ただし、当時 Microsoft は、同様のシステムをローカル プライベート クラウドの形でクライアント ルームに直接展開することを重視せず、代わりに独自のクラウド インフラストラクチャを構築する能力に重点を置いていました。
データ主権への対応に関しては、Microsoftはこれまでにも各国でデータセンターやクラウドサービスを現地に構築する計画を発表しており、「Azure Local」をはじめとするさまざまなローカリゼーションソリューションを提案してきた。 Microsoft はハードウェアを提供およびホストし、規制およびコンプライアンスの要件を満たすために顧客サイトに導入します。対照的に、AWS は今回、顧客所有のデータセンターと AWS の「AI ファクトリーの移行」モデルを明確に提案し、従来の企業のプライベートデータセンターとパブリッククラウドの間の境界線をさらに曖昧にし、ハイブリッドクラウドと企業ホスティングルームが再び業界の舞台の中心に戻ってきました。
外の世界から見ると、生成 AI の波により、いくつかの大手クラウド サービス プロバイダーが企業が構築したデータ センターやハイブリッド クラウド アーキテクチャへの投資を再増加させており、これは 10 年以上前の「企業のコンピューター ルームが王様」だった時代をまったく思い出させます。 NVIDIA などのハードウェア サプライヤーはクラウド大手との結びつきがさらに強まるため、「AI ファクトリー」を中心としたローカライズされた主権展開が、大規模組織にとって今後数年間で AI インフラストラクチャを計画する際の重要な選択肢の 1 つになる可能性があります。