OpenAI は、最新のテキストから画像へのジェネレーターをより広範囲に展開しています。同社は木曜日に、ChatGPTPlus および企業顧客向けに、ChatGPT アプリケーションで使用できる新しい DALL-E3 モデルを公開します。 OpenAIは、このモデル用のセキュリティ緩和スタックを準備し、リリースを拡大できるようにしたと述べた。

DALL-E3 は先月初めてリリースされました。OpenAI は、ユーザーが ChatGPT を利用して、画像ジェネレーターで使用するためのより長く、より視覚的に説明的なプロンプトを作成できるようにすることで、以前の DALL-E2 がどのように改善されたかを示しました。 DALL-E3 は Bing Chat と Bing Image Generator に追加され、ChatGPT よりも前に、より広範なモデルへのアクセスを一般に提供した最初の Microsoft プラットフォームになりました。

有害な画像を減らすために宣伝された安全策は常に機能するとは限らず、ユーザーはスポンジ・ボブや他のキャラクターが建物に向かって飛行機を飛ばしている世界貿易センターの画像を作成しました。 Microsoft は特定のプロンプトをブロックしようとしましたが、他の簡単な回避策でも同様の結果が得られました。

Midjourney、StableDiffusion、および DALL-E の初期バージョンなどのテキストから画像へのジェネレーターはすべて、論争を引き起こしました。この技術は、著作権で保護された画像素材、同意のないヌード、人種を変える主題、公人の写実的な虚偽表現を輸出してきました。

OpenAI は今回、より広範なアプローチを約束しており、DALL-E3 に関して行われた研究を紹介する Web サイトを提供しています。同社は、「モデルが存命のアーティストや著名人の画像をスタイリングしたコンテンツを生成する可能性を制限し、生成された画像の人口統計的表現を改善する」としている。 OpenAIには内部「来歴分類子」ツールもあり、画像がDALL-E3によって生成されたかどうかを99%正確に検出できるという。