DeepSeek-V3.1 正式リリース: より強力なエージェント機能

本日、DeepSeek は DeepSeek-V3.1 が正式にリリースされたことを正式に発表しました。レポートによると、このアップグレードには次の大きな変更が含まれています。ハイブリッド推論アーキテクチャ: 1 つのモデルが思考モードと非思考モードの両方をサポートします。思考効率の向上: DeepSeek-R1-0528 と比較して、DeepSeek-V3.1-Think はより短い時間で答えを得ることができます。強力なエージェント機能: トレーニング後の最適化により、ツールの使用とエージェントのタスクにおける新しいモデルのパフォーマンスが大幅に向上しました。

公式アプリとウェブモデルは同時に DeepSeek-V3.1 にアップグレードされました。「Deep Thinking」ボタンにより、思考モードと非思考モードを自由に切り替えることができます。

プログラミングエージェント: DeepSeek-V3.1 は、コード修復評価 SWE およびコマンドラインターミナル環境での複雑なタスク (ターミナルベンチ) テストにおいて、以前の DeepSeek シリーズモデルと比較して大幅に改善されました。

検索エージェント: DeepSeek-V3.1 では、複数の検索評価指標が大幅に改善されました。多段階の推論を必要とする複雑な検索テスト (browsecomp) と複数の専門分野にまたがる専門家レベルの難関テスト (HLE) では、DeepSeek-V3.1 のパフォーマンスが R1-0528 を大きく上回りました。

テスト結果は、思考連鎖圧縮トレーニング後、さまざまなタスクにおける V3.1-Think の平均パフォーマンスは R1-0528 と同じである一方、出力トークンの数は 20% ～ 50% 減少したことを示しています。同時に、非思考モードでの V3.1 の出力長も効果的に制御されました。 DeepSeek-V3-0324 と比較して、出力長を大幅に短縮しながらも同じモデルのパフォーマンスを維持できます。

また、9月6日早朝より、DeepSeekオープンプラットフォームAPIインターフェースのコール価格を以下の通り調整させていただきます。