プロンプトはもう存在しませんか? DALL・E3 は、正確な描画とリアルなディテールを備えた ChatGPT に突然統合されました。 OpenAI は今日、AI ペイント界を本当に爆発させました。朝起きたらAI絵サークルが吹き飛ばされていました。 OpenAI が大ヒット作を投下 - ChatGPT と統合された DALL・E3 が正式発表されました!
1 つは史上最も強力な言語モデルであり、もう 1 つは史上最も強力な Vincentian グラフ モデルです。この 2 つの組み合わせは AIGC サークル全体を破壊するに違いありません。
最も強力な変換を経た後、DALL・E3 はセマンティクスのニュアンスを理解できるようになり、細部が恐ろしく現実的になります。
プロンプト: 「セラピストの椅子に座って『内側が空っぽだ』と言いながら、真ん中にクレーターほどの穴があるアボカドのイラスト。セラピスト、スプーン、走り書きメモ。」
ネットユーザーは「DALL・E3が画像内のテキストを本当に正確に表現できるなら、ゲームのルールが完全に変わるだろう!!!」と叫んだ。
同時に、プロンプトのしきい値も大幅に引き下げられました。
「早く死ぬ」ユーザーは、ゴージャスなプロンプトワードを書けないことを心配する必要はもうありません。ヒントを与えるだけで、ChatGPT が雄弁な文章を書いてくれます。
つまり、想像力を自由に働かせて、ChatGPT を使って自由に飛び回ることができます。
プロンプトを表示する方法を見つけるために頭を悩ませる必要はもうありません。 ChatGPTに話しかけるだけで素敵なものが書けます
会話中に生成されたイメージに基づいていつでも変更を加えることができます。
GoogleによるマルチモーダルGeminiのリリースに追いつくために、OpenAIが先陣を切ったことがわかります。
Nvidia のシニア AI サイエンティストである Jim Fan 氏は、これは大規模なマルチモーダル LLM と Google Gemini の間の壮大な戦いの前兆であると興奮しながら語った。
OpenAI CEOのサム・アルトマン氏も、コメント欄で誇らしげに「Wearesoback」と述べた。
現在、DALL・E3 はまだ内部テスト中であり、10 月初旬にすべての Plus ユーザーおよび企業ユーザー向けにリリースされる予定です。
ミッドジャーニーのライバルが本当に登場!
DALL・E3 は、ChatGPT 上にネイティブに構築されているという点でユニークです。
ChatGPT に簡単な文、または詳細な段落をリクエストするだけで、ブレインストーミングとヒントの改善が開始されます。
Nvidia のトップ科学者 Jim Fan 氏は、これはとても衝撃的だと言いました。
DALL・E3の意義は、Midjourneyの強敵であるだけではなく、それはまた、マルチモーダルな大型モデルの戦争が勃発しようとしていることを表しています。
DALL・E3 の優れた言語マッチング機能は、堅牢なテキスト GPT 基盤に基づいています。 Midjourney には「推理脳」があまり備わっていないため、非常に多くのヒント ハックが必要になります。
頭脳が先、ピクセルは後、これが強力なマルチモーダル AI を構築する方法です。
プロンプトエンジニアリングを学ぶ必要はなく、やりたいことを何でもやれば大丈夫です。即効性のある言葉については、ChatGPT が作成を支援し、絶妙な絵の詳細は DALL・E3 が担当します。
以下の例は、DALL・E3 が以下の絵画を生成する際に、テキスト内のすべてのシーンをどのように細心の注意を払って絵画に刻み込んだかを示しており、その画質は映画のようなものです。
満月の下、通りは夜の街を楽しむ人々で賑わっていました。
街角の屋台で、燃えるような赤い髪とエレガントなベルベットのマントを着た少女が、不機嫌そうなボスと値切り交渉をしていた。
背が高くてがっしりとした上司は、パリッとしたスーツを着て、印象的なヤギひげを生やし、レトロなスチームパンク風の電話で活気に満ちた会話をしていた。
さらに、同じプロンプトの下で、DALL・E3 によって描画されるイメージは、DALL・E2 よりも正確になります。
たとえば、「アネブラの爆発を描いたバスケットボール選手のダンクの表現力豊かな油絵」では、DALL・E3 はキャラクター、バスケットボール、およびマクロ背景の生成においてより詳細です。
ネチズンが作成した比較表からわかるように、DALL・E3とDALL・E2の間のギャップは壮大であると言えます。
ネットユーザーは、OpenAIは今回単にMidjourneyを超えようとしているだけではないと述べた。 Google は彼らの最大の競争相手であり、特に最近では Gemini が差し迫っています。
この変更は AI ペイント ツールの重要な進化傾向を反映していると言う人もいます。人を理解する。
AI によって画像をより適切に記述したり修正したりできるようになれば素晴らしいでしょう。 DALL・E3 がどこまでできるか見守ってみましょう。
DALL・E3+ChatGPT
DALL・E3+ChatGPTってすごいですか?
アルトマンは、DALL・E3 によって生成されたかわいいディテールをプロモーション ビデオに隠しました。
DALL・E3 は、5 歳児の空想を現実に変えることができます。
「私の5歳の赤ちゃんは、『スーパーひまわりハリネズミ』について話しています。それはどのようなものでしょうか?」
ChatGPT は、4 つの異なるプロンプトワードに基づいて、さまざまなスタイルの画像を自動的に生成します。ここで最後の一枚を選択することで、続きを作成するためのベースとなる絵を設定することができます。
次に、小さなハリネズミにラリーと名前を付け、彼の家を描きます。
DALL・E3 は要件を正確に理解しただけでなく、メールボックスの「ラリー」などのテキストを画像に注釈を付けることもできたことがわかります。
従来のDALL・Eモデルで全く書き込みができなかった問題を完全解決しました。
描きながらストーリーを完成させたり、イラストを追加したりすることもできます。
さらに、DALL・E3 は上記のスタイルに基づいてかわいいステッカーを生成することもできます。
最後に、ChatGPT で上記の内容を要約し、就寝前のストーリーを生成します。これは完全に完璧です。
OpenAI公式では、素晴らしいフォトアルバムも多数提供しています。
プロンプト: 猫を優しく抱きしめる女の子を描いたペーパーアート作品です。二人とも鉢植えの中に座っていて、猫は満足そうに喉を鳴らし、女の子は微笑んでいました。場面には手作りの紙の花や葉が点在しています。
猫を優しく抱きしめる女の子を描いたペーパー クラフト アート。どちらも鉢植えの植物の真ん中にあり、女の子が微笑みながら満足そうに喉を鳴らしている猫。その風景は手作りの紙の花と葉で飾られています。
DALL・E3は美しいポスターを作成したり、文字を追加したりできます。
プロンプト: 金星のレトロな旅行ポスター、ポートレート。この画像には、厚い黄色がかった雲に囲まれた金星と、近づいてくる古いロケット船のシルエットが描かれています。雲の下に山や谷を思わせる不思議な形。下部のテキストは「ヴィーナスの探索: 霧の背後の美しさ」と書かれています。カラースキームはゴールド、イエロー、ソフトオレンジで構成されており、好奇心を刺激します。
肖像画向きの金星のビンテージ旅行ポスター。このシーンは、近づいてくるビンテージ ロケットのシルエットを持つ金星の厚い黄色がかった雲を描写します。下部のテキストには、「ヴィーナスを探索する: 霧の向こうの美しさ」と書かれています。カラースキームは、ゴールド、イエロー、ソフトオレンジで構成されており、不思議な感覚を呼び起こします。
プロンプト: このイラストは、嵐の波の中の台座の上に立つ、半透明のガラスで作られた人間の心臓を描いています。雲の切れ間から一筋の太陽光が差し込み、心を照らし、その中にある小さな宇宙を現します。地平線上の記念碑には、「あなたの中に宇宙を見つけてください」という目を引く文字が刻まれています。
嵐の海の真ん中に立つ、半透明のガラスで作られた人間の心臓のイラスト。太陽の光が雲を突き抜け、心を照らし、内なる宇宙を明らかにします。
プロンプト: これは、嵐の日に窓辺に置かれたコーヒー カップの 3D レンダリングです。窓の外の嵐がコーヒーカップに映り、小さな稲妻と打ち寄せる波が見えます。店内は薄暗く、ドラマチックな雰囲気を醸し出しています。
A3ドレンダーのコーヒーマグは、嵐の日の窓辺に置きます。窓の外の嵐がコーヒーに映り、マグカップの中には小さな稲妻と乱波が見えます。部屋は薄暗く、ドラマチックな雰囲気を加えています。
プロンプト: 嵐の中で船を操縦する老船長の詳細な油絵。風化した顔に塩水がかかり、その目は固いものでした。上空には邪悪な雲が渦を巻いているのが見え、激しい波が船を飲み込みそうになる一方、カモメが飛び込み、混沌とした風景を横切って渦を巻いています。遠くで雷鳴と光が聞こえ、現場を不気味な緑色の光で照らしました。
嵐の中を船を操縦する古い船長の詳細な油絵。この風化した顔に海水が再び飛び散り、彼の決意が渦巻く悪意のある雲が見えます。カモメが飛び込み、混沌とした風景の中を旋回している間、船尾の波が船を水没させる恐れがあります。
ミッドジャーニーはとても弱いです
このニュースが発表されるとすぐに、ミッドジャーニーとの比較写真の波がインターネット上に急速に登場しました。
同様に、Midjourney と DALL·E3 はまったく同じレベルにありません。
また、SDXLとDALL・E3は比較表も生成します。
一部のネチズンは、同じプロンプトを使用して画像を生成するために RawMidjourney、Non-rawMidjourney、および DALL·E3 を使用したと述べました。
一部のネチズンはミッドジャーニーとDALL・E3PKの写真をさらに作成しました。
コードネーム「Gizmo」という真新しいプロトタイプ
同時に、ネチズン「TiborBlaho」も、OpenAI が ChatGPT 用のコードネーム「Gizmo」という新しいプロトタイプを開発しているというニュースを伝えました—
UI インターフェイスが更新され、企業顧客向けに強力な「Gizmo Editor」が導入され、ユーザーが独自の「GPT」を作成できるようになります。
具体的には、GPT のプロフィール写真、モデル (GPT-3.5 または GPT-4)、機能 (DALL·E、Web ブラウジング、コーディング サンドボックス、プラグインなどを含む)、有効なプラグイン リスト、動作 (この GPT とは何か、何をするのか、知っておくべきこと)、ウェルカム メッセージ (ユーザーがこの GPT と新しいチャットを開始するときに何を言うべきか) を定義し、この GPT がプライベートであるかどうかを決定できます。