Meta は、データセンター インフラストラクチャに新しいメモリ再利用ソリューションを採用したと発表しました。自社開発のカスタムチップ「Vistara」を通じて、退役したサーバーのDDR4メモリースティックをDDR5メモリーに依存する新世代サーバーに接続し、世界的なハードウェア価格の高騰と長期的なメモリー不足の中でコスト削減とリソースの再利用を実現する。

メモリやその他のハードウェア コンポーネントの世界的な価格は、過去期間にわたって上昇し続けています。巨大な購買力を持つ大手テクノロジー企業でさえ、設備投資をより効率的に制御する方法を模索し始めています。 Meta のアプローチは、この環境における試みです。

Meta の現在の運用および保守サイクルによれば、サーバーは通常 3 ~ 5 年ごとに交換されますが、サーバー内のメモリ モジュールの実際の寿命は通常 7 ~ 10 年に達する可能性があります。その結果、サーバーが廃止されると、まだ損傷がなく使用可能な DDR4 メモリ モジュールをオフラインにする必要があり、大量の無駄が発生します。この「寿命の不一致」問題を解決するために、Meta は古いメモリが新しいプラットフォームで引き続き機能できるように Vistara チップを設計し、ハードウェアのライフサイクルを延長し、全体的な TCO を最適化しました。

業界会議 ISCA で公開された技術論文情報によると、Vistara は CXL 2.0/1.1 インターフェイスを介して PCIe Gen5 x16 バス上の新世代プロセッサに DDR4 メモリを接続するカスタム ASIC チップです。特定の展開では、Meta は廃止されたサーバーから DDR4 メモリ スティックを取り外し、内部で「MemServers」と呼ばれる特殊なユニットにインストールします。各 MemServer は、約 768 GB の DDR5 メモリと約 256 GB のリサイクルされた DDR4 メモリで構成されています。オペレーティング システムは、これらの DDR4 を追加のメモリ ノードとして扱います。メインの DDR5 リソースが不足すると、システムはこの拡張メモリをスケジュールして使用できます。

Meta 氏は、市販の一般的な CXL インターフェイスは通常、コントローラーに独自のメモリをパッケージ化しており、さまざまなソースから廃止された DDR4 スライバーを挿入することが困難であるため、既製の CXL ハードウェア ソリューションではこの需要を満たすことができないと述べました。 Vistara の設計は、コントローラーをメモリーから意図的に切り離し、コントローラーが独立して存在できるようにし、Meta が必要に応じて手持ちの既存の DDR4 メモリー リソースを挿入できるようにして、柔軟性の高いメモリー再利用アーキテクチャーを実現します。

規模レベルでは、Meta はこの新しいアーキテクチャを数百万台のサーバーで構成されるハイパースケール インフラストラクチャ、特に人工知能ビジネスをサポートするデータ センターに導入する予定です。同社は、Muse Spark などの推論機能やマルチモーダル機能を備えた新しいモデルの広範な展開を含め、生成 AI などの分野への投資を続けているため、これらの AI データセンターのメモリとコンピューティング能力の要件は増大し続けています。 DDR4メモリを再利用することで、パフォーマンスを確保しながら全体的な効率の向上が期待できます。

Meta は「再利用された」メモリに完全に依存するわけではなく、新しく購入した DDR5 やその他のハードウェアが引き続きそのインフラストラクチャで重要な役割を果たすことに注意する必要があります。ただし、超大規模データセンターのシナリオでは、ワークロードの一部に再利用された DDR4 メモリ モジュールを使用するだけでも、長期運用で大幅なコスト削減を実現し、ハードウェアの廃棄によって生じるリソースの無駄を削減するのに十分です。