DeepSeekV3 および R1 シリーズのオープンソース AI 大型モデルは、多言語の理解と複雑な推論タスクにおいて優れたパフォーマンスを実証しています。彼らは AI テクノロジーの普及と開発を促進するだけでなく、オープンソース コミュニティにも多大な貢献をしています。現在、さまざまなテクノロジー大手が DeepSeek のサポートと導入を開始しており、国内のハードウェアでもサポートが加速しています。
国内のフル機能 GPU イノベーション企業として、Moore Thread は DeepSeek 蒸留モデル推論サービスの効率的な展開を迅速に実装し、より多くの開発者が Moore Thread のフル機能 GPU に基づいて AI アプリケーションを革新できるようにしました。
ワンクリック体験のアドレス:
https://playground.mthreads.com
また、ユーザーは、Moore スレッドの MTTS80 および MTTS4000 グラフィックス カードに基づいて DeepSeek-R1 蒸留モデルの推論展開を実行することもできます。
実際、1 月 28 日の時点で、すでにサイト B UP 所有者が Moore Thread MTTS80 での実践を手動で完了していました。
https://www.bilibili.com/video/BV18YfQYEEs2
DeepSeek が提供する蒸留モデルを通じて、大規模モデルの機能をより小型で効率的なバージョンに移行し、国内の GPU で高性能の推論を実現できます。
Moore Thread は自社開発のフル機能 GPU をベースにしており、オープンソースと自社開発のデュアルエンジン ソリューションを通じて、DeepSeek 蒸留モデルの推論サービスの展開を迅速に実装します。
オープンソース フレームワークの適応:
Ollama オープン ソース フレームワークに基づいて、Moore Thread は DeepSeek-R1-Distill-Qwen-7B 蒸留モデルの展開を完了し、さまざまな中国タスクで優れたパフォーマンスを実証し、Moore Thread が自社開発したフル機能の GPU の多用途性と CUDA 互換性を検証しました。
自社開発エンジン加速:
Moore Threads が独自に開発した高性能推論エンジンと、ソフトウェアとハードウェアの協調最適化テクノロジ、およびカスタマイズされたオペレータ アクセラレーションとメモリ管理を組み合わせることで、モデルのコンピューティング効率とリソース使用率が大幅に向上します。
このエンジンは、DeepSeek 蒸留モデルの効率的な操作をサポートするだけでなく、将来のより大規模なモデルの展開に対する技術サポートも提供します。
やっと、Moore Thread は、自社設計の KUAE GPU インテリジェント コンピューティング クラスターをオープンしようとしています。これは、DeepSeekV3、R1 モデル、および新世代の蒸留モデルの分散展開を完全にサポートします。
Kua'e クラスターは、高度な推論テクノロジーと分散コンピューティング フレームワークを統合して、大規模モデルの効率的かつ安定した動作を保証し、開発者がビジネス実装を迅速に実行できるようにします。