発表から3か月、ヴィンセントの人気モデルMidjourneyの最新バージョンがついに登場しました。 Midjourneyは現地時間12月21日、現在アルファテスト段階にある最新バージョン「V6」のベータ版をリリースするとDiscord上で発表した。数多くのユーザー作例から判断すると、V6は写実的な絵や抽象画の扱いが非常に上手で、その効果はデザイナーや写真家にも負けません。
Midjourn は V6 を主要なイノベーションとして位置づけています。同社の CEO である DaVidHolz 氏は、V6 は実際には AI スーパー クラスターでゼロからトレーニングされた 3 番目のモデル セットであると述べました。開発サイクル全体は 9 か月続きました。 「この一連のモデルによって生成された画像は、これまでにリリースしたどのバージョンよりもはるかにリアルです。」公式の紹介によると、V6 の主な変更点は、画質の向上、意味の理解の強化、テキストの埋め込み機能、より即発的な単語への対応、より高い一貫性、より豊富なモデル知識です。
ユーザー テストによると、V6 は 350 文字を超えるプロンプト ワードをサポートし、句読点や文法の微妙な違いも理解できるようになりました。現在ネチズンによって表示されている画像から判断すると、V6は光と影、構成、素材、色などの理解と細部の点で、確かに前世代よりも一歩進んでいます。
同じプロンプトを使用して V6 と V5.2 をテストすると、コントラストが非常に明白です (上の図は V6 で生成されたもので、下の図は V5.2 で生成されたものです)。
キーワード: 1980 年代のサスペンス映画、上から撮影、ビクトリア朝の邸宅の廊下でろうそくを持っている黒いスーツを着たフランス人執事
メインプロンプト: 緑のシルクのドレスと真珠のネックレスを着てヨットに座っている若い女性の 1960 年代のストリート スタイルの写真
主な手がかりワード: 1940 年代のレトロな SF 映画に登場する、襟の高い銀色の手術服を着た女性オペレーター
キーワード: 角のバーのネオンサインには「遅くまで営業」と書かれています
主な手がかりワード: 雨の水たまりに映る夕日
主な手がかりワード: 木のスプーンを添えたシチューの鍋
テキスト生成に関しては、V6 は画像にテキストをより明確に埋め込み、そのスタイルを指定することもできます。
注:コカ・コーラ 原文:CocaCola
セーター、動物の毛、窓の雨滴の質感を復元します
長いテキストの処理も改善されました
製品ロゴ
製品設計図面とさまざまなツールのテキストの比較
このパフォーマンスの向上により、デザイン業界やマーケティング業界に大きな利益がもたらされることが期待されます。一部の越境電子商取引関係者は、長い間、文生図の大型モデルを使用して製品紹介ページやモデルの表示写真を作成してきたことがわかります。 Midjourney は最もよく使用されるツールです。
さらに、V6は「ハンドペイント」が可能。これまで、AI による絵画は、特にキャラクターの手の細部が変形して見えることが多く、非現実的であると批判されてきました。しかし、V5 のリリースにより、この技術的問題は完全に解決され、手の指紋や肌の質感も表示できるようになり、AI ペイントにおいて飛躍的な進歩を遂げました。以下はいくつかの手描きです。
現在、V6 には左右バランスやズームアウトなど、V5.2 モデルにあるいくつかの機能がありませんが、これらの機能は V6 の今後のアップデートで実装される予定だとホルツ氏は述べています。
V6はミッドジャーニーで終わるわけではない。製品は反復されています。最初のバージョンは 2022 年 3 月にリリースされ、その後すぐに現在の第 6 バージョンに進化し、平均して 3 か月ごとに更新されました。 Midjourney の発表では、「V6 の速度、画質、一貫性、迅速なフォロー、テキストの正確性は今後数週間で改善されるはずです」と述べられています。 V6beta はリリースから 30 分後に最初のアップデートを発表し、生成速度が 2.7 倍に向上しました。
同社は以前、将来の技術アップデートの方向性には3Dとビデオの生成も含まれると述べた。 Holz 氏は、1 秒あたり 30 フレームの高解像度でリアルタイムにコンテンツを生成することが可能になり、2030 年までにはビデオ ゲーム全体が生成される可能性があると予測しています。
創設者のデイビッド・ホルツ氏がベンチャーキャピタリストからのオリーブの枝の提供を何度も拒否したと言われていることは言及する価値がある。過去 1 年間で、Discord プラットフォームの Midjourney ユーザー数は 200 万人から 1,767 万人に増加し、毎日 10 万人以上のユーザーがいます。 100 万人がオンライン (記事執筆時点) しており、この製品はすでに有料モデルを開始しています。ユーザーはさまざまなパッケージから選択し、月額 10 ドルから 120 ドルを請求できます。従業員 40 人のチームを擁する Midjourney は、9 月に年間利益 2 億米ドルを達成することに成功しました。