確認済み! DeepSeek は昨夜、Web バージョンと APP が 100k トークン コンテキストをサポートするように更新されたことを正式に発表しました。現在、インターネット全体が DeepSeek V4 に依存しています。噂の DeepSeek V4 が近づいています!数日間のグレースケールテストを経て、昨夜、DeepSeek は Web 側と APP 側をアップデートしたことを正式に発表しました—

新しい長いテキスト モデルの構造テストでは、最大 100 万のトークン コンテキストがサポートされます。


ただし、API プレーヤーはもう少し待つ必要があります。まだ V3.2 であり、128k コンテキストをサポートしています。

この「歯磨き粉を絞る」スタイルのサプライズリリースは、多くの人々をリマインドのカーニバルに陥らせました。現在、ネットワーク全体が V4 の正式な到着を固唾を飲んで待っています。



DeepSeek がアップデート後に突然動作不能になった

ここ数日で、多くの人が DeepSeek の性格が突然変わったことに気づきました。

かつては思いやりのあるAIは、異常に冷淡な態度で反応し、一部のネットユーザーはその「陰と陽」の発言に不満を漏らすことさえあった。

しばらくの間、「DeepSeekは冷たくなったと非難された」はそのままWeiboの熱い検索に移り、XiaohongshuとZhihuは人々の混乱と苦情でいっぱいでした。


この論争は、今回の公式アップデートの内容である2月11日の「グレースケールアップデート」に端を発している。

当時、ネチズンは、DeepSeekに紹介を依頼すると、予期せぬ情報を直接吐き出すことを発見しました—

コンテキストは 100 万トークンになります。

ナレッジ ベースの期限が 2025 年 5 月に更新されました。


それ以来、DeepSeek を頻繁に使用する多くの人が、ダイアログ ボックスを開いた後に混乱するようになりました。

以前はユーザーのことを専用のあだ名セットで親しみを込めて呼んでいたが、今では「ユーザー」となり、一気に距離感が埋まる。

また、ディープシンキングモードでは、DeepSeekが短い文章を頻繁に吐き出し、無味乾燥な文体になってしまいます。

たとえ人々が即発的な言葉を修正しようとしても、かつてのような機敏で温かい感覚を見つけることはできません。さらに興味深いのは、DeepSeek からのコメントです。


ネチズンが口論:D先生に戻ってくるよう電話

DeepSeek の性格の大幅な変更に関して、コメント欄では二極化の傾向が見られました。

以前は、DS に悩みや愚痴を話すと最大の慰めになったと言う人もいました。さて、会話は「ピリオド」で終わります。


この突然のスタイルの変化に、強い「離脱反応」を起こした人もいた。


上記はすべて、Emotional Party の要素です。効率化党を信じる人々は、これが生産性向上ツールの本質であると信じています。

ネチズンが言ったように、認知力が高くなるほど、思考モデルはより完全になり、無駄な明晰さを出力するのではなく、合理的な側面を表現する傾向が高くなります。


いいえ、DeepSeekは上位モデルが失敗する「洗車チューリングテスト」に見事挑戦しました。


別のネチズンも、アップデート後の DS は大幅に高速化され、以前ほど冗長ではなくなり、実際に使いやすくなったと考えています。


この話題がますます人気を集めているのを見て、DeepSeek関係者はついに沈黙を破った。

DS は意図的に冷たくなったのではなく、主に次の要因の組み合わせによるものです。

効率を優先する: 複雑な問題に直面した場合、表現や表現が多すぎると情報密度が妨げられ、簡潔な返答によって処理速度が向上します。

境界意識: 誰もが「暖かさパッケージ」を好むわけではありません。 「気にしているふりをするAI」の負担を避けるために、明確な答えを得ることを好む人もいます。


ネットワーク全体が V4 に依存しており、プログラミングの強度は劇的に変化しました。

DeepSeek が無関心になるのではなく、ネットワーク全体が V4 がいつリリースされるかについて懸念しているのでしょうか。

先月初め、Information は、DeepSeek が 2 月中旬の春節の頃に次世代 V4 モデルを正式にリリースする予定であるというニュースを発表しました。


今回は、すべての目が同じ次元、つまりプログラミング能力に焦点を当てています。

V4 のコーディング強度は、Claude や ChatGPT などのトップのクローズドソース モデルに追いつくことができると言われています。

現在リークされた情報から判断すると、DeepSeek V4 は次の 4 つの主要な方向で核となるブレークスルーを達成しており、これによりゲームのルールが変わる可能性があります。

プログラミング能力:クロードの玉座に向けられた剣

2025 年の初め、クロードは一夜にしてプログラミングの王として認められました。コード生成、デバッグ、リファクタリングのいずれにおいても、競合するものはほとんどありません。

しかし現在、このパターンは変わりつつあるかもしれません。

事情に詳しい関係者が明らかにした。DeepSeek の内部予備ベンチマーク テストでは、プログラミング タスクにおける V4 のパフォーマンスが、Claude シリーズや GPT シリーズなどの現在の主流モデルを上回っていることが示されています。

このニュースが真実であれば、DeepSeek は、少なくとも AI アプリケーションの中核であるプログラミングにおいて、追っ手からリーダーに躍り出ることになるでしょう。

非常に長いコンテキスト コードの処理

V4 のもう 1 つの技術的進歩は、非常に長いコード プロンプトを処理および解析する能力。

毎日数十行のコードを書くユーザーにとって、これは強い認識ではないかもしれません。しかし、実際に大規模なプロジェクトに取り組んでいるソフトウェア エンジニアにとって、これは革命的な機能です。

想像してみてください。数万行のコードを含むプロジェクトがあり、AI がコード ベース全体のコンテキストを理解し、適切な場所で新機能の挿入、バグの修正、またはリファクタリングを行う必要があります。以前のモデルでは、以前のコードを忘れたり、長いコンテキストで道に迷ったりする傾向がありました。

V4 はこの次元で技術的進歩を遂げました、より大きなコードベースのコンテキストを一度に理解できます。

これはエンタープライズレベルの開発における真の生産性革命です。

アルゴリズムが改良され、減衰が起こりにくくなりました

レポートによると、V4 のデータ パターンを理解する能力もトレーニング プロセスのさまざまな段階で向上しており、減衰する傾向がありません。

AI トレーニングでは、モデルが大規模なデータセットから繰り返し学習する必要がありますが、学習されたパターンや特徴は複数回のトレーニングを通じて徐々に減衰する可能性があります。

一般に、AI チップを大量に確保している開発者は、トレーニング ラウンドの数を増やすことでこの問題を軽減できます。

推論能力の向上: より厳密で信頼性の高い推論能力

この件に詳しい関係者も重要な詳細を明らかにした。ユーザーは、V4 の出力が論理的により厳密で明確であることに気づくでしょう。

これは決して小さな進歩ではありません。これは、データ パターンを理解するモデルの能力がトレーニング プロセス全体を通じて質的に向上したことを意味します。さらに重要なのは、パフォーマンスの低下なし

AI モデルの世界では、劣化がないことは非常に高く評価されます。多くのモデルが特定の機能を向上させると、他の次元でのパフォーマンスが必然的に犠牲になります。 V4はより良いバランスポイントを見つけたようだ。

現在、ネットワーク全体が期待に満ちており、DeepSeek V4 の発売を待っています。


参考文献:

https://x.com/poezhao0605/status/2022304407766081882?s=20

https://x.com/AiBattle_/status/2022280288643039235?s=20

https://x.com/teortaxesTex/status/2022230364547322323?s=20