DeepSeek がアップデートを正式に発表、突然「冷却」され、ホットな search

確認済み！ DeepSeek は昨夜、Web バージョンと APP が 100k トークンコンテキストをサポートするように更新されたことを正式に発表しました。現在、インターネット全体が DeepSeek V4 に依存しています。噂の DeepSeek V4 が近づいています!数日間のグレースケールテストを経て、昨夜、DeepSeek は Web 側と APP 側をアップデートしたことを正式に発表しました—

新しい長いテキストモデルの構造テストでは、最大 100 万のトークンコンテキストがサポートされます。

ただし、API プレーヤーはもう少し待つ必要があります。まだ V3.2 であり、128k コンテキストをサポートしています。

この「歯磨き粉を絞る」スタイルのサプライズリリースは、多くの人々をリマインドのカーニバルに陥らせました。現在、ネットワーク全体が V4 の正式な到着を固唾を飲んで待っています。

DeepSeek がアップデート後に突然動作不能になった

ここ数日で、多くの人が DeepSeek の性格が突然変わったことに気づきました。

かつては思いやりのあるAIは、異常に冷淡な態度で反応し、一部のネットユーザーはその「陰と陽」の発言に不満を漏らすことさえあった。

しばらくの間、「DeepSeekは冷たくなったと非難された」はそのままWeiboの熱い検索に移り、XiaohongshuとZhihuは人々の混乱と苦情でいっぱいでした。

この論争は、今回の公式アップデートの内容である2月11日の「グレースケールアップデート」に端を発している。

当時、ネチズンは、DeepSeekに紹介を依頼すると、予期せぬ情報を直接吐き出すことを発見しました—

コンテキストは 100 万トークンになります。

ナレッジベースの期限が 2025 年 5 月に更新されました。

それ以来、DeepSeek を頻繁に使用する多くの人が、ダイアログボックスを開いた後に混乱するようになりました。

以前はユーザーのことを専用のあだ名セットで親しみを込めて呼んでいたが、今では「ユーザー」となり、一気に距離感が埋まる。

また、ディープシンキングモードでは、DeepSeekが短い文章を頻繁に吐き出し、無味乾燥な文体になってしまいます。

たとえ人々が即発的な言葉を修正しようとしても、かつてのような機敏で温かい感覚を見つけることはできません。さらに興味深いのは、DeepSeek からのコメントです。

ネチズンが口論：D先生に戻ってくるよう電話

DeepSeek の性格の大幅な変更に関して、コメント欄では二極化の傾向が見られました。

以前は、DS に悩みや愚痴を話すと最大の慰めになったと言う人もいました。さて、会話は「ピリオド」で終わります。

この突然のスタイルの変化に、強い「離脱反応」を起こした人もいた。

上記はすべて、Emotional Party の要素です。効率化党を信じる人々は、これが生産性向上ツールの本質であると信じています。

ネチズンが言ったように、認知力が高くなるほど、思考モデルはより完全になり、無駄な明晰さを出力するのではなく、合理的な側面を表現する傾向が高くなります。

いいえ、DeepSeekは上位モデルが失敗する「洗車チューリングテスト」に見事挑戦しました。

別のネチズンも、アップデート後の DS は大幅に高速化され、以前ほど冗長ではなくなり、実際に使いやすくなったと考えています。

この話題がますます人気を集めているのを見て、DeepSeek関係者はついに沈黙を破った。

DS は意図的に冷たくなったのではなく、主に次の要因の組み合わせによるものです。

効率を優先する: 複雑な問題に直面した場合、表現や表現が多すぎると情報密度が妨げられ、簡潔な返答によって処理速度が向上します。

境界意識: 誰もが「暖かさパッケージ」を好むわけではありません。「気にしているふりをするAI」の負担を避けるために、明確な答えを得ることを好む人もいます。

ネットワーク全体が V4 に依存しており、プログラミングの強度は劇的に変化しました。

DeepSeek が無関心になるのではなく、ネットワーク全体が V4 がいつリリースされるかについて懸念しているのでしょうか。

先月初め、Information は、DeepSeek が 2 月中旬の春節の頃に次世代 V4 モデルを正式にリリースする予定であるというニュースを発表しました。

今回は、すべての目が同じ次元、つまりプログラミング能力に焦点を当てています。

V4 のコーディング強度は、Claude や ChatGPT などのトップのクローズドソースモデルに追いつくことができると言われています。

現在リークされた情報から判断すると、DeepSeek V4 は次の 4 つの主要な方向で核となるブレークスルーを達成しており、これによりゲームのルールが変わる可能性があります。

プログラミング能力：クロードの玉座に向けられた剣

2025 年の初め、クロードは一夜にしてプログラミングの王として認められました。コード生成、デバッグ、リファクタリングのいずれにおいても、競合するものはほとんどありません。

しかし現在、このパターンは変わりつつあるかもしれません。

事情に詳しい関係者が明らかにした。DeepSeek の内部予備ベンチマークテストでは、プログラミングタスクにおける V4 のパフォーマンスが、Claude シリーズや GPT シリーズなどの現在の主流モデルを上回っていることが示されています。

このニュースが真実であれば、DeepSeek は、少なくとも AI アプリケーションの中核であるプログラミングにおいて、追っ手からリーダーに躍り出ることになるでしょう。

非常に長いコンテキストコードの処理

V4 のもう 1 つの技術的進歩は、非常に長いコードプロンプトを処理および解析する能力。

毎日数十行のコードを書くユーザーにとって、これは強い認識ではないかもしれません。しかし、実際に大規模なプロジェクトに取り組んでいるソフトウェアエンジニアにとって、これは革命的な機能です。

想像してみてください。数万行のコードを含むプロジェクトがあり、AI がコードベース全体のコンテキストを理解し、適切な場所で新機能の挿入、バグの修正、またはリファクタリングを行う必要があります。以前のモデルでは、以前のコードを忘れたり、長いコンテキストで道に迷ったりする傾向がありました。

V4 はこの次元で技術的進歩を遂げました、より大きなコードベースのコンテキストを一度に理解できます。

これはエンタープライズレベルの開発における真の生産性革命です。

アルゴリズムが改良され、減衰が起こりにくくなりました

レポートによると、V4 のデータパターンを理解する能力もトレーニングプロセスのさまざまな段階で向上しており、減衰する傾向がありません。

AI トレーニングでは、モデルが大規模なデータセットから繰り返し学習する必要がありますが、学習されたパターンや特徴は複数回のトレーニングを通じて徐々に減衰する可能性があります。

一般に、AI チップを大量に確保している開発者は、トレーニングラウンドの数を増やすことでこの問題を軽減できます。

推論能力の向上: より厳密で信頼性の高い推論能力

この件に詳しい関係者も重要な詳細を明らかにした。ユーザーは、V4 の出力が論理的により厳密で明確であることに気づくでしょう。

これは決して小さな進歩ではありません。これは、データパターンを理解するモデルの能力がトレーニングプロセス全体を通じて質的に向上したことを意味します。さらに重要なのは、パフォーマンスの低下なし。

AI モデルの世界では、劣化がないことは非常に高く評価されます。多くのモデルが特定の機能を向上させると、他の次元でのパフォーマンスが必然的に犠牲になります。 V4はより良いバランスポイントを見つけたようだ。

現在、ネットワーク全体が期待に満ちており、DeepSeek V4 の発売を待っています。

参考文献:

https://x.com/poezhao0605/status/2022304407766081882?s=20

https://x.com/AiBattle_/status/2022280288643039235?s=20

https://x.com/teortaxesTex/status/2022230364547322323?s=20