5月29日午後、多くのネチズンは、DeepSeekには再生成と変更の回数に制限があることを発見した。連続して数回変更または再生成すると、上限に達したことを示すメッセージがページに表示されます。一部のネチズンは、通常の会話では3〜6回再生すると上限に達すると報告しました。エキスパートモードでは、チャンスは 3 つだけです。修正入力回数の上限は通常6回です。

現在、DeepSeek は公式発表を行っておらず、固定割り当てテーブルも公開していませんが、この件はコミュニティ内で激しい議論を引き起こしました。結局のところ、DeepSeek には私を含め、多くの忠実なユーザーがいます。サーバーが混雑したりページがクラッシュしたりすることがありますが、これは誰にとっても理解できることですが、黙って制限を追加することはできず、人々はパニックに陥ります。
API はまったく影響を受けないため、よく知られたインフラストラクチャの問題である可能性が高くなります。

01
演算能力不足による一時的な電流制限?
この制限について、Xiaohongshu の「半公式アカウント」Baiqiang は次のように述べています。パニックにならないでください。これは一時的なものです。

それによると、「メッセージの変更」と「再生成」が突然制限されるとのこと。 DeepSeek がいわゆる「ネガティブ最適化」を行っているわけではありません。計算能力のプレッシャーが大きすぎる場合に取られる一時的な措置。
この期間、特に 5 月 29 日の午後から DeepSeek のユーザー数が急速に増加したため、アプリ側のリクエストのプレッシャーは明らかでした。最も基本的なテキストでの会話を優先し、引き続き正常に使用できるようにするために、チームは最初に「メッセージの変更」や「再生成」などの高頻度の操作のみを制限できます。
ユーザー インターフェイス上では、「再生成」はボタンをクリックするだけで、「メッセージの変更」は元の質問を変更するだけです。ただし、サーバーにとって、これら 2 つは単純な更新ではなく、新しい推論リクエストです。ユーザーがクリックして再生成するたびに、モデルはコンテキストを再処理して回答を生成する必要があります。メッセージを変更する場合も同様です。元の質問が変更される限り、モデルは新しい入力に基づいて再度回答する必要があります。
したがって、多数のユーザーが同時に繰り返しクリックし、「再生成」を無限カード描画ボタンとして扱うと、これらのリクエストはサーバーに大きな負荷を与えます。
この件は、DeepSeek の最近の変更と併せて確認できます。たとえば、エキスパート モードのファイルのアップロードとリストの削除、スマート検索機能のオフ、および時々「サーバー ビジー」が発生する原因は、実際にはコンピューティング リソースの不足です。全体的なサービスのプレッシャーが非常に高くなっているため、トレードオフを行う必要があります。

DeepSeek は非常に使いやすいため、基盤となるインフラストラクチャも最新の状態に保つ必要があります。
「メッセージの変更」または「再生成」が上限に達した状況に関して、Baiqiang 氏のアドバイスは、連続して素早くクリックしないことです。最初に停止し、15 ~ 30 分待ってから再試行してください。このアカウントによると、ほとんどの場合、制限は待つと自動的に復元されます。素早く繰り返しクリックすると、システムが異常に高頻度のリクエストと認識し、制限時間が長くなる場合があります。
Bai Qiang氏はまた、ファーウェイの新しいAscendスーパーノードカードが導入されており、今年下半期にはオンラインになる予定であると述べた。それまでに、コンピューティング能力は大幅に拡張され、これらの一時的な制限はおそらく解除されるでしょう。
ただし、DeepSeek はこの件に関してまだ正式な発表を行っていません。制限数、回復時間、今年下半期のコンピューティング能力拡張後の具体的な変更点などについては、さらなる正式な確認を待つ必要があります。
02
DeepSeek は特別なケースではありません
実際、これを行う AI 企業は DeepSeek が初めてではありません。
大型モデル製品のコンピューティング能力が逼迫している場合、ユーザーが急増する場合、またはピーク時の負荷が高すぎる場合、一般的には、電流の流れを制限したり、ダウングレードしたり、キューに入れたり、一部の高消費機能を個別に制限したりすることが一般的です。
ChatGPT には常にメッセージ制限があり、有料ユーザーでも需要が高い時期には使用制限に遭遇する可能性があります。無料ユーザーも上級モデルの割り当てに達した後は、軽量モデルに切り替えて使い続けます。
これは一種の「サービスのダウングレード」として理解できます。これは、サービスの使用が許可されていないことを意味するのではなく、最も高価でリソースを大量に消費する機能を誰もが無制限に使用できるわけではないことを意味します。

Claude と同様に、Anthropic もユーザーごとに使用量の予算を設定し、Claude Code や API などの高頻度シナリオも容量の変化に応じて上限を調整します。コンピューティング能力が豊富な場合は、クォータを増やすことができます。需要圧力が高まると、制限がより明確になります。
Anthropic は 5 月 6 日、新たなコンピューティング能力の協力と容量の増加に伴い、Claude Code と Claude API の使用制限を引き上げたとの特別文書も発行しました。また、それは次のことも示しています使用制限は、コンピューティング能力の容量に直接関係します。計算能力が逼迫している場合は強化され、計算能力が拡張されると緩和されます。

ただし、Anthropic は現在、さまざまなサブスクリプション クォータに対してより詳細な使用制限を設定しており、Claude Code などの高消費シナリオはトークンの計測と課金のロジックに近づいています。
画像およびビデオ生成製品の方が一般的です。 Sora と Gemini の画像生成機能、および他の AI ビデオ ツールは、需要が急増したときに、生成数が厳しくなり、キュー時間が長くなり、無料割り当てが減少するという時期を経験しました。
「あらゆる推論にはコストがかかる」ということは、AI製品にとって避けられない現実となっていると言える。
少し前に、お手玉の有料化が議論を巻き起こした。 「Doubao、高価で使いにくい」というキーワードが Weibo で人気の検索になったこともありました。今回の DeepSeek の機能制限とは異なりますが、ユーザーの反応の背後にあるロジックは同じで、AI 製品が安くて使いやすいことに誰もが慣れています。プラットフォームが課金を開始したり、特定の機能を制限し始めたりすると、ユーザーのセンチメントは簡単に回復します。
基本的な機能を無料にし、複雑な機能に対して課金を開始し、高コストの機能に対して割り当てを設定し、ピーク時にフローを一時的に制限することは、AI 企業にとって非常に一般的な慣行です。
DeepSeek では「再生成」と「変更メッセージ」の数が制限されていますが、これは AI 業界全体では珍しいことではありません。制限されるのはチャットの入り口やモデル自体ではなく、ユーザーが頻繁にクリックしやすい操作のみですが、クリックするたびに推論リソースが再び消費されます。
基本的な対話は可能な限り保持する必要があるため、これがユーザーが製品を使用できるようにするための最低ラインです。ただし、再生成、繰り返しの変更、ファイルのアップロード、インターネット検索、長いコンテキスト、マルチモーダル生成などの機能はすべて、負荷が高い場合に制限されたり、ダウングレードされる可能性が高くなります。
この論争の焦点は「どこまで制限するか」ではなく「どのように制限するか」にあるように感じます。
これが一時的な電流制限であること、再開までにどれくらいの時間がかかるか、どのような業務に影響があるのかを当局がもっと早く説明できれば、ユーザーはおそらくそれをもっと受け入れるだろう。しかし、何のアナウンスもなく突然利用できなくなると、当然、機能が縮小するのではないか、将来的には有料になるのではないかと誰もがすぐに疑問に思うでしょう。
AI 製品が早期導入ツールから日常ツールに変化すると、ユーザーは安定性と透明性をますます重視するようになります。制限自体は理解できますが、ポップアップ ウィンドウで初めてユーザーに制限を知らせないことが最善です。
DeepSeek は、制限する必要があるほど使用数が増加した場合、それは多くのユーザーがあなたを待っていることを意味することを認識する必要があります。
たとえそれが単なる承諾書であっても。