DALL・E3がやってくる!それは来るだけでなく、ChatGPT にも統合されます。つまり、日常的な会話、コードの作成、数学の問題の解決に加えて、最新のDALL・E3を統合したChatGPTに、今回ついにピクチャ機能が追加されました。
ChatGPT+DALL・E、この波は強力な同盟です。 1 つは大規模言語モデルの無冠の王であり、もう 1 つはヴィンセント グラフ モデルのリーダーでもあります。実際の効果は必然的に 1+1 > 2 になります。
この突然の公式発表は、今年初めに GPT-4 が登場してから広く噂になっていたマルチモーダル ChatGPT の大きな穴を埋めるものと考えられています。
ただし、OpenAI はまだこのニュースを発表したばかりです。具体的な発売時期は10月。 Plus および Enterprise Edition ユーザー向けに、別の DALL·E3 もこの秋に発売される予定です。
これはどのくらい強力ですか?まだ開始できませんが、OpenAI が公開した例から判断すると、それでもかなり爆発的です。
その中には、熱心なネチズンの中には、直接Midjourneyに電話して、DALL・E3のサンプルプロンプトの言葉を与えて、直接競争できるようにする人もいた。
そしてその結果は次のようにしか言えません。旅の途中で危険が迫っています。
1 つ目は非常に古典的なアボカドの医療ミームです。ヒントは次のとおりです。アボカドがセラピストの椅子に座り、「心がとても空っぽになったような気分です」と言っています。アボカドの真ん中に小さなクレーターほどの穴があります。セラピスト、スプーン、落書きノート。
一見すると、これらは 2 つの異なるスタイルのように見えます。しかし、プロンプトの言葉を注意深く比較してみると、次のことが明らかです。ミッドジャーニーはセラピスト、スプーン、落書きメモを無視します。ダイアログ ボックス内のテキストもランダムに書き込まれており、要件に従っていません。
次に、半透明のハートの写真を作成するように依頼され、ハートの下に特定の引用を彫刻するように依頼されました。
ヒント: これは、嵐の海の台座の上に立つ、半透明のガラスで作られた人間の心臓のイラストです。太陽の光が雲を突き抜けて魂を照らし、その中にある小さな宇宙を明らかにします。ベースには「Discover the Universe inside you」という言葉が太字で刻まれています。
今回もDALL・E3がミッドジャーニーを破ったのは間違いありません。『ミッドジャーニー』では、必要に応じて文字を彫刻していないだけでなく、嵐の海や内なる小宇宙などの詳細も表現できていません。
これは、ライチをイメージした球形の椅子の別の写真です。白いでこぼこした外観と、その背後にあるトロピカルな壁紙と対照的な柔らかい内部を必要とする細部が施されています。
これにより、それらによって生成された画像のすべての要素に命が吹き込まれます。しかし、ミッドジャーニーは、熱帯の壁紙と熱帯雨林の違いを誤解しているようです。
もちろん、プロンプトの言葉を誤解し、文脈から切り離すことは、以前のヴィンセント図モデルの慢性疾患に相当します。
ヤドカリのようなカニを産んでください…。
2D の擬人化された森林バンドを生成するように依頼すると、3D の結果が得られました。
これらの古い問題については、OpenAI 自身の声明と示された例によれば、この状況は基本的に新しい DALL E3 には存在しません。
DALL・E3 は古い問題を解決するだけでなく、オリジナルの第 2 世代バージョンの質感もアップグレードしました。
たとえば、星空の爆発を要素として、バスケットボール選手がダンクするシーンを描いてもらいます。
もともと、DALL・E2 で生成された画像はすでに要件を満たしていました。予想外に、アップグレードされたDALL・E3はより現実的で、筋肉のラインや宇宙の色などの細部が1つ1つ表示されていました。それはまさに次元削減への打撃でした。
左:DALL・E2、右:DALL・E3
全体、ChatGPT のサポートにより、DALL・E3 の言語理解能力は直接的に最大化され、勝つことはほとんど不可能になります。
ChatGPT のアップグレード バージョンでは、重要な情報ポイントが失われないだけでなく、あちこちにいくつかのキーワードを入力するだけでも、自動的に説明を完成させ、DALL E3 に画像を生成させることができます。
OpenAIは現代ネット民(犬頭)の「文化砂漠」の本質を捉えた。
もちろん、DALL・E3 と ChatGPT の統合は、人間の音声をよりよく理解できるようになるという単純なことではなく、いくつかの素晴らしい閃きも生み出すでしょう。
たとえば、ChatGPT のアップグレードされたバージョンには、描画におけるコンテキスト理解機能もあり、生産性ツールとして直接使用することもできます。
具体的にどれくらい強力なのかは、OpenAIの公式サイトでデモビデオが公開されている。正直、観終わった後、シーチャオはイラストレーターという仕事に不安を感じた。
まず、ChatGPT でスーパーひまわりハリネズミを生成させます。 4枚の写真が表示されます。最も気に入ったものを選択したら、会話の次のステップに進むことができます。
次に、ハリネズミにラリーという名前を付け、ChatGPT にその写真をさらにいくつか生成させます。
次に、難易度を上げて、ラリーの家を見せるシーンを作成してみましょう。
これは、DALL・E3+ChatGPT の強さを直接示すことができます。ラリーの外見が変わっていないだけでなく (他の AI では変わっている可能性があります)、玄関の郵便受けにも「LARRY」という名前が書かれています。
さらに、ChatGPT では、ラリーの特徴を説明したり、写真を使って愛情を表現したり、ラリーの周辺機器を作成したり、いくつかのステッカーをデザインしたりすることもすべて簡単です。
最後に、就寝時のストーリーとエンディングポーズを整理しましょう。 ChatGPT も簡単に利用できます。 u1s1 この滑らかな会話には本当に衝撃を受けました...
これを見て、シーチャオは突然新しいインスピレーションを得ました。その後、私たちが書いた記事を ChatGPT に直接投げて、表紙を作成するためのキーワードを抽出させることができます。
特別な要件がある場合は、ChatGPT に直接伝えることができます。参照画像をそこに投げることもできます。釣りスキル+1+1...
もっと身近なところで言えば、上記の効果は OpenAI によって一方的に実証されるだけです。実際にどのように使用されるかは、10 月にオンラインになるまでわかりません。それまでにネチズンによって開発された隠された技術の波が起こると推定されています。待って見てください。
また、AI絵画に関してはやはり避けては通れない共通の話題として著作権の問題があります。
OpenAI は依然として以前の地位を維持しています。第2弾同様、DALL・E3で生成した画像は無断使用・商用利用可能です。
しかし、過去から多くを学びすぎたOpenAIは、今回は少し賢く、アーティストはフォームに記入する限り、自分の作品をDALL・Eに提供することを拒否できると述べた。
これは「断らないことは黙認すること」という意味もありますが、少なくとも以前に比べればアーティスト側はそこまで消極的ではなくなってきているのではないかと…。
DALL・E は、公人のプライバシーを侵害したインターネット上の以前の AI 絵画やその他の偏った問題に対する対抗策も用意しています。実際に使用すると、ChatGPT はプロンプト内の著名人の名前を含むリクエストを直接拒否します。
つまり、ChatGPT ではこのような楽しい写真は見られないかもしれません...
また、さまざまな段階でモデルから生じる可能性のあるリスクを評価し、軽減するための「レッドチーム」も結成しました。
最後に、OpenAI は公式 Web サイトで、どの画像が DALL・E3 によって生成されたかを判断できる AI 図面を識別するツールの開発に取り組んでいることも述べました。
(以前の AI テキスト認識ツールのように役に立たず、途中で機能しなくなってしまったことがないことを祈ります...
一般に、Vincent グラフ機能を備えた ChatGPT は AI 界に熱狂の波を巻き起こすのに十分ですが、この波は DALL・E3 の統合アップグレード版であり、興奮しないわけにはいきません。とにかく、Shichao は試してみるのが待ちきれません。
しかし、喜ぶ人もいるし、心配する人もいる。この OpenAI の波は、再び他の競合他社を大きく引き離しました。 10 月のアップデート後、多くの AI スタートアップが ChatGPT の支配下に潰されると推定されています...