2024 年 10 月、AMD と Intel は共同で x86 エコシステム アドバイザリー グループ (x86 エコシステム アドバイザリー グループ) を設立し、業界リーダーを集めて x86 コンピューティング アーキテクチャの将来を共同で推進しました。 EAG は設立時に、FRED、AVX10、ChkTag、ACE の 4 つのコア機能を発表しました。今回、AMD と Intel は共同で ACE ホワイト ペーパーをリリースし、「x86 標準マトリックス アクセラレーション アーキテクチャ」として知られるこの命令セットを開発者コミュニティに正式に宣伝しました。

ACE の中心的な目標は単純明快で、x86 チップの行列乗算のパフォーマンスを桁違いに向上させることです。

行列乗算は、ニューラル ネットワークと大規模な言語モデルの基本的な計算単位です。 AVX10 などの既存の SIMD 命令セットは行列演算を完了できますが、計算密度とスケーラビリティに明らかなボトルネックがあります。

外積演算に基づく行列加速メカニズムを導入することにより、ACE は、同じ入力ベクトルを消費しながら、同等の AVX10 積和演算の 16 倍の計算密度を達成します。

データ形式のサポートに関して、ACE は、INT8、OCP FP8、OCP MXFP8、OCP MXINT8、BF16 など、AI 分野の現在の主流の精度標準をネイティブにカバーしています。

AVX10 の拡張命令セットとして、ACE のソフトウェア環境への適応はすでに進行中です。ディープ ラーニングと HPC の基礎となるライブラリ、NumPy や SciPy などの Python 科学計算ライブラリ、PyTorch や TensorFlow などの主流の機械学習フレームワークはすべて統合作業を開始しています。

AMDとIntelはホワイトペーパーの中で、ACEの設計コンセプトは低摩擦と広いカバレッジであると強調した。ノートブックからスーパーコンピューターまで、開発者はさまざまなハードウェア プラットフォームに合わせてコードを書き直す必要はありません。

これは、AI コンピューティングを専用アクセラレータに移行するソリューションとは大きく対照的です。このソリューションには追加のコードの適応と移行コストが必要になることがよくあります。