今朝9時に、DeepSeekはオープンソースウィークの約束を果たし続け、オープンソースをリリースしましたDeepGEMM。この投稿が転送されると、すぐに注目を集めました21,000国内外での人気がわかるほどの読書量だ。 DeepGEMM は以下に焦点を当てたプロジェクトであることがわかります。FP8効率的な汎用行列乗算 (GEMM) ライブラリは、一般および混合エキスパート (MoE) グループの行列計算のニーズをサポートし、リソース割り当てを動的に最適化して計算電力効率を向上させることができます。
このライブラリは以下に基づいていますCUDA開発する、採用する軽量のジャストインタイム コンパイル (JIT) モジュール、プリコンパイルやインストールを行わずに、実行時にカーネルを動的にコンパイルします。
DeepGEMM が次のように設計されていることは言及する価値があります。DeepSeek-V3/R1モデル特にトレーニングと推論のためのシンプルかつ効率的な基礎的なサポートを提供します。ホッパー アーキテクチャ GPU (H800 など) の最適化高性能と低コストを考慮しています。
Open Source Week の 3 番目の成果として、DeepGEMM のリリースは、オープンソース モデルとツール (FlashMLA など) という DeepSeek の以前の戦略を継続し、ハイ パフォーマンス コンピューティング テクノロジのアプリケーションの敷居をさらに下げます。
なお、このオープンソースは、以前からリリースされているDeepSeekの「Open Source Week」(2月24日~28日)の第3弾プロジェクトとなる。FlashMLA (効率的なデコーディング カーネル) および DeepEP (エキスパート並列通信ライブラリ)。