キオクシアは NVIDIA と提携し、既存の最上位 SSD の 33 倍高速な SSD パフォーマンスを実現

キオクシアと NVIDIA の最新の協力は、AI データセンターインフラストラクチャにおける新たな技術的進歩とみなされています。両社は、最大 1 億 IOPS (1 秒あたりの入出力操作) を提供できる SSD の開発に協力しています。このパフォーマンスは、現在の SSD の最高レベルである約 300 万 IOPS よりもはるかに高く、大規模な AI モデルのトレーニングと展開におけるデータ送信のボトルネックを克服することを目的としています。

このプロジェクトが成功すれば、生成 AI (GenAI) イノベーションのペースが加速するだけでなく、データセンターアーキテクチャが再定義され、クラウドコンピューティングとエンタープライズクラスのストレージの競争環境が変わり、ハードウェアエコシステム全体の新しい標準が確立されることになります。

半導体メモリメーカーのキオクシアは、AI の高強度の読み取りおよび書き込みのニーズを満たす新世代の SSD テクノロジーを開発しています。同社は、SSDのランダムIOPSが1億回に達するよう、2027年に商用化を達成する計画を発表した。この性能指標は既存のハイエンド製品の約30～35倍となります。キオクシアは今回、NVIDIAと協力してプロジェクトの実施を推進する。

キオクシアは東京でのメディアブリーフィングで、新しいSSDは従来のサーバー中央プロセッサを経由せずにNVIDIA GPUに直接接続されると述べた。この「ポイントツーポイント」接続方法により、ストレージとコンピューティングユニット間のデータフローの速度が大幅に向上します。これは、埋め込み表現やモデルパラメーターの取得など、頻繁な小規模のランダムデータ読み取りに依存する大規模な AI モデルのトレーニングに特に適しています。従来の SSD システムでは、これらのニーズに効率的に対応することが困難です。

NVIDIA は、次期 PCI Express 7.0 標準をサポートする 2 つの SSD によって 2 億 IOPS を達成するという、より挑戦的な目標を設定しました。 PCIe 7.0 は、より高速なポイントツーポイント GPU 通信機能をもたらします。これに対して、現在の高性能 SSD は 4K ブロックで約 300 万 IOPS を達成します。それが 1 億 IOPS に跳ね上がると、NAND フラッシュメモリとインターフェイスアーキテクチャの両方に大きな技術的課題が生じることになります。

キオクシアの最も有望なテクノロジーは、独自の XL-Flash 単層セル (SLC) NAND ストレージであり、高耐久性、低遅延、強力なパフォーマンスの特性を備えています。各 XL-Flash チップは最大 16 個の「プレーン」をサポートしますが、通常の消費者グレードの 3D NAND には通常 3 ～ 6 個のプレーンがあります。

キオクシアはすべての技術仕様を公開していませんが、既存のテストデータからその課題の規模を垣間見ることができます。32 個の NAND チップを搭載し、PCIe 5.0 インターフェイスを使用した 400GB XL-Flash SSD は、約 350 万ランダム読み取り IOPS のパフォーマンスを実証しました。理論的には、パフォーマンスを完全に線形に拡張できれば、915 個のチップを搭載した SSD は 1 億 IOPS を達成できる可能性があります。ただし、実際には、コントローラーの帯域幅、ファームウェアのオーバーヘッド、システムアーキテクチャなどの要因により、単にチップを積み重ねるだけではこの目標を達成することが困難な場合が多く、複数のコントローラーやモジュラー SSD ソリューションの使用が必要になる場合があります。

従来の 3D NAND 拡張の限界を考慮して、キオクシアは高帯域幅フラッシュ (HBF) と呼ばれる新しいストレージテクノロジも検討しています。これは、高帯域幅メモリの速度とより大きなストレージ容量の組み合わせを目的としています。 HBF ソリューションは、高度なパッケージングを使用して最大 16 個の NAND チップと 1 個のロジックチップをスタックし、非常に高いレベルの並列処理と帯域幅を実現します。 HBFが今回の協力プロジェクトの最終製品に採用されるかどうかはまだ不透明だが、今回の研究開発はキオクシアがAI時代の超高性能ストレージソリューションを展開していることを示している。