Bytedance Seed公式Weiboによると、Bytedance Seedチームは新世代の画像作成モデルSeedream 4.0を正式にリリースしたとのこと。レポートによると、Seedream 4.0 は同じアーキテクチャを使用してグラフィカルおよび一般的な編集機能を実装し、常識と推論機能を統合します。前世代モデル Seedream 3.0 および SeedEdit 3.0 と比較して、Seedream 4.0 はマルチモーダル エフェクト、スピード、使いやすさにおいて大幅な進歩を遂げました。

マルチモーダル ゲームプレイの拡張: テキストと画像の組み合わせ入力を柔軟にサポートし、テキストベースの画像、画像ベースの画像、画像編集、マルチ画像編集、グループ画像の生成などのクリエイティブ モードを可能にします。ゲームプレイは創造的で多様です。
様式化された美学の向上: バロックからサイバーパンクまで、芸術スタイルの移行における高い自由度をサポートします。スタイルは常に変化しており、組み合わせて優れた美学を備えた新しいスタイルを作成できます。
論理的理解の強化:世界の知識と組み合わせることで、マルチモーダル入力の理解が向上します。まず「描く」ことと「考える」ことができ、物理的および時間的制約が伴うタスクで推論と生成能力を発揮し、パズルやクロスワードを解き、漫画を書き続けることができます。
アダプティブおよび 4K 生成: 指示または参照画像に従って最適なプロポーションの画像を生成でき、ユーザー定義のサイズもサポートします。最大解像度は 2K から 4K Ultra HD まで拡張されます。
推論速度のジャンプ: 新しい効率的なアーキテクチャ設計と極端な蒸留アクセラレーションにより、DiT で生成されたグラフの推論速度は Seedream 3.0 の推論速度よりも 10 倍以上高速になっています。
公式 Weibo によると、Seedream 4.0 は単なる画像生成モデルではなく、完全なマルチモーダル クリエイティブ エンジンでもあります。 Based on the latest capabilities of Seedream 4.0, eight basic gameplay methods of the model are proposed.一般的な画像の生成と編集に加えて、二次創作、推論生成、および専門的なアプリケーションにおけるモデルの可能性も探求されています。