カナダのモントリオール大学心理学部が主導した大規模研究によると、いくつかの標準化された創造性テストでは、生成型人工知能システムが一般の人間の参加者よりも優れた成績を収めているが、最も創造的な人間のほうが依然として大幅に上回っており、これはAIが人間の創造者の代わりというよりも、創造性を強力に補助するものであることを意味している。

この研究はモントリオール大学のカリム・ジャービ教授が主導し、チームメンバーにはディープラーニングの先駆者でモントリオール大学教授のヨシュア・ベンジオ氏も含まれていた。彼らは、多数の主流の大規模言語モデル (ChatGPT、Claude、Gemini など) の体系的な評価を実施し、それらを 100,000 人以上の被験者からのデータと比較しました。これは現在、人間と機械の創造性に関する最大規模の比較研究の 1 つです。この論文は「人間の多様な創造性と大規模言語モデル」というタイトルで『Scientific Reports』に掲載された。

その結果、「多様な言語の創造性」を測定するために使用される一部のテストでは、一部の大規模な言語モデル (GPT-4 を含む) の平均スコアが通常の人間の平均スコアを上回ったことが示されています。ジャービ氏は、この発見は「おそらく驚くべきものであり、気がかりなことですらある」が、同様に重要であると指摘した。つまり、最も強力な AI システムであっても、最も創造的な人間の個人よりもパフォーマンスが低いということだ。

さらなる分析の結果、研究者らが創造性レベルが人間の「上位半分」にある参加者の半数だけを調べたところ、このグループの平均パフォーマンスはすでにテストされたすべてのAIシステムの平均パフォーマンスよりも優れており、創造的な人々の上位10%の間では、人間とAIの差はさらに明らかであることが判明した。共著者のモントリオール大学博士研究員アントワーヌ・ベルマーレ・ペパン氏とコンコルディア大学博士課程学生フランソワ・レスピナス氏は、これは「最高レベルの創造性は依然として人間特有の利点である」ことを示していると指摘した。

人間とAIを公平に比較​​するために、チームはさまざまな方法を使用しました。その中心となるツールは、共同研究者であるカナダのトロント大学の研究者であるジェイ・オルソン氏によって開発された「ダイバージェント・アソシエーション・タスク」(DAT)でした。この心理テストでは、人間でもAIでも参加者に「銀河、フォーク、自由、藻類、ハーモニカ、クォンタム、ノスタルジア、ベルベット、ハリケーン」など、意味的に異なる10個の単語を一度の回答で答えるよう求め、単語間の意味的距離を計算することで発散的思考能力を測定する。

これまでの研究では、DAT での人間のパフォーマンスは、創造的な執筆、アイデアの生成、創造的な問題解決など、他の伝統的な創造性テストの結果と高度に相関していることが示されており、したがって、より広範な創造的な認知プロセスの迅速な代理指標と見なすことができます。 DATのもう一つの特徴は、操作が簡単で短時間で完了し、通常2~4分で完了し、オンライン形式で公開されることです。

基本的な単語テストを完了した後、研究チームはこの「言語レベル」のパフォーマンスをより複雑な創造的なタスクに応用できるかどうかをさらに調査しました。彼らは、俳句(3行の短い詩)の作成、映画のあらすじの作成、短編小説の作成など、複数の執筆シナリオで人間の参加者と直接競争できるようにAIシステムを調整し、作品の品質を評価しました。結果は以前のパターンを継続しています。一部のタスクでは、AI の平均パフォーマンスは通常の人間のパフォーマンスよりも優れていますが、高レベルの人間のクリエイター、特に文章やストーリーテリングが最も得意なクリエイターの間では、依然として人間の優位性が明らかです。

この研究では、AI の「創造性」は制御可能で調整可能か?という重要な疑問も調査されました。答えは「はい」です。この記事では、重要な技術パラメータはモデルの「温度」であり、出力内容の予測可能性と多様性に影響を与えると指摘しました。温度が低いほど、AI によって生成される答えはより保守的で予測可能になります。温度が高い場合、出力はより変動し、変動が大きくなり、多くの場合、よりリスクが高くなりますが、より革新的な関連性も生じます。

さらに、プロンプトの書き方も大きな影響を与えます。この研究では、モデルに単語の起源と構造を語源学的に考慮するよう指示を与えると、AI が予期せぬ連想を起こし、創造性の評価でより高いスコアを獲得する可能性が高くなることが判明しました。これは、AI によって発揮される創造性が人間の入力と指導に大きく依存しており、人間とコンピューターのインタラクションの設計が創造的なプロセスの中核となるリンクの 1 つになりつつあることを意味します。

AI がクリエイティブな労働者に「取って代わる」のではないかという懸念が広がるなか、この研究は比較的賢明な判断を示している。ジェルビ氏は、AIは現在、一部の標準化テストでは人間の平均的な創造性レベルに達しているか、それを超えているが、人間と機械の関係を「競争」として過度に理解するのは誤解を招くと強調した。彼の見解では、生成 AI はまず第一に、非常に強力な創造的なツールです。 「それはクリエイターに取って代わるものではありませんが、クリエイターが想像し、探索し、創造する方法を大きく変えるでしょう。もちろん、これは人々がそれを使用することを選択するかどうかによって決まります。」

論文の最後では、AIはクリエイティブなキャリアの終わりを予測するのではなく、想像力の限界を広げる「クリエイティブアシスタント」と考えたほうがよいと指摘されている。将来の創造性エコロジーは、もはや人間と機械の間の単純な戦いではなく、人間と機械のコラボレーションという新しいパラダイムになる可能性があります。AI は人間にインスピレーション、バリエーション、テストの場を提供し、人間は美学、価値、意味をより高いレベルで把握します。ジェルビ氏は、人間と機械の能力を積極的に比較するこの種の研究は、学術界と一般大衆に「何が創造性とみなされるのか」という根本的な問題の再考を強いていると信じている。