AI 大型モデル界の現在のペースを一言で表すとしたら、「DeepSeek のスピード」という言葉がこれ以上に適切な言葉はありません。テキストのみのバージョンの V4 がリリースされてから 5 日も経たないうちに、当局は「3 ラウンド連続の値下げ」という価格電撃作戦を仕掛けました。業界が回復する前に、次の切り札がすでに登場していました。マルチモーダル機能を備えた「完全な」V4 であり、正式にリリースまでのカウントダウンに入っています。
中核研究者が個人的に明らかに: ネイティブの視覚能力が到来する
DeepSeek マルチモーダル チームの中心メンバーである Chen Xiaokang 氏は、最近 X プラットフォームに関する記事を公開し、「DeepSeek V4 の新バージョン」が登場することを明確に発表しました。現在の状況と組み合わせると、この「新しいバージョン」は待望のマルチモーダル バージョンであることはほぼ確実です。
V4 の発売以来、業界で最も白熱した議論と後悔の痕跡はすべて同じことを示しています。最初のウェーブでは、Flash (高速) と Pro (エキスパート) の 2 つのテキストのみのモデルのみが発売されました。純粋なテキスト機能は確かに基盤ですが、今日の大規模なモデル分野では、長い間「ネイティブ マルチモダリティ」が上位層への切符でした。画像やビデオを視覚的に理解していなければ、実際の複雑なシーンにおけるモデルの上限はしっかりと固定されてしまいます。今回のマルチモーダル バージョンの開始は、DeepSeek にとって最後の欠点を補うための重要なステップです。
アプリにはすでにヒントがあります。それはポイントの獲得ではなく、「手頃な価格」です。

慎重なユーザーは、最近の DeepSeek クライアントの更新後、モデル選択バーに「クイック」、「エキスパート」、「ビジュアル」という 3 つの独立したオプションがひそかに追加されていることを発見しました。最初の 2 つは V4 の Flash と Pro に対応し、「有効化される」状態になっている「Visual」オプションは明らかにマルチモーダル V4 の次期新バージョン用に予約されているインターフェイスです。
この本格的なマルチモーダルV4は、ハードパワーの点でどのランクに到達できるでしょうか?具体的なデータはまだありません。しかし、プレーン テキストの分野における V4 Pro の圧倒的なパフォーマンスを参照して、業界は一般に、そのビジュアル機能が少なくとも第一段階に確実に入るだろうと予測しています。しかし、DeepSeek がこれを最も重視していることは決してありません。
本当の切り札: マルチモダリティの価格を「引き下げる」
常に型破りな道を歩んできた DeepSeek にとって、やみくもにランキングに躍り出ることが第一の目標ではありません。 「大規模なマルチモーダル モデルの価格をキャベツの価格まで引き下げ、開発者と一般ユーザーが本当に購入できるようにする」ことが、その本当の切り札です。 V4 が発売からわずか 5 日後に「3 回の値下げ」を行ったことを思い出してください。後続のマルチモーダル API 呼び出しのコストも下限価格まで引き下げられた場合、業界の再編はプレーン テキスト分野での価格戦争よりもはるかに激しくなるでしょう。
一文要約: V4 マルチモーダル バージョンの登場は、機能を補完するものであるだけでなく、DeepSeek がマルチモーダル トラックの価格表を覆す出発点でもあります。