Scientific American の 4 月 24 日のレポートによると、23 歳のアマチュア数学愛好家であるリアム プライスは、高度な数学システムのトレーニングを受けることなく、ChatGPT Pro で利用可能な最新の大規模言語モデルを使用して、約 60 年間数学コミュニティを悩ませてきたエルデシュ問題を予想外に解決しました。この進歩は多くの著名な数学者から大きな注目を集めました。 

報告書によると、この成果が特に重要なのは、関連する問題が多くのトップ数学者たちに長い間避けられてきたからだけでなく、AIによって与えられた証明のアイデアが既存のルーチンの単純な言い直しではなく、そのような問題にこれまで誰も使用できるとは考えていなかった方法を導入しているためでもある。

今回解決される問題は、「プリミティブ セット」と呼ばれる特別な整数のセットについて議論します。いわゆる原始集合とは、同じ集合内で別の数で割り切れない数値がないことを意味します。この意味で、「素数は細分化できない」という性質を単一の数値から数値のセット全体に拡張します。したがって、素数と密接な関係があり、素数の集合は当然元の集合に属します。

ハンガリーの伝説的な数学者パウル・エルデシュはかつて、このタイプの原始集合の「エルデシュ和」を定義しました。これは、集合の特定の「重み」または「スコア」を測定する指標として理解できます。彼は以前に、この合計の最大値が約 1.6 であることを証明しており、すべての素数の無限集合もこの上限に達すると推測しました。スタンフォード大学の数学者ジャレッド・リヒトマンは、2022年の博士論文でこの予想を証明した。しかし、より困難な関連予想は、元の集合の数値が非常に大きくなると、その「スコア」は減少し続け、その理論的な最小値は正確に1になるはずだというものだ。言い換えれば、この質問が証明したいのは、集合要素が無限大に向かう傾向にあるため、このスコアは1に近づき、1はそれよりも下回ることができない下限であるということである。

報告書は、リヒトマン自身もこの予想を証明しようとしたが、他の先行研究者と同様に失敗したと指摘した。プライス氏は当初、この質問の内容が全く理解できなかったと述べた。月曜日の平凡な午後、彼はモデルがアイデアを与えることができるかどうかを確認するために、いつものようにエルデシュの質問を気軽に ChatGPT に入力しました。その結果、AIは「正解と思われる」答えを返してくれました。

その後、プライス氏はその結果を、彼のパートナーであるケンブリッジ大学数学学部 2 年生のケビン・バレット氏に送りました。 2人は、公開されているエルデシュ語のパズルをChatGPTにランダムに提供したことですでに注目を集めており、後にAI研究者は、彼らの実験的な「大気数学」の試みをサポートするために、ChatGPT Proのサブスクリプションを彼らに与えさえした。結果を確認した後、バレット氏は何かが異常であることに気づき、関連する専門家に通知し、専門家はすぐに対応してくれました。

カリフォルニア大学ロサンゼルス校の数学者テレンス・タオ氏は、過去にこの問題を研究した人々は、ほぼ常に比較的標準的な開始経路に従って導出を実行していたが、今回の大規模な言語モデルはまったく異なる経路をたどったと述べた。報告書によると、AIは数学の関連分野で古くから知られていた公式を使用したが、それをこの種の問題に適用することを考えた人は誰もいなかったという。 Tao Zhexuan 氏は、これは人間の研究者が集合的に最初の方向選択においてある種の「思考バイアス」を持っており、実際にはより直接的な画期的な道を逃している可能性があることを示していると考えています。

しかし、専門家らは、ChatGPT自体が最初に出力した証明文が成熟していないことも強調した。リヒトマン氏は、元の出力の品質は実際には「かなり悪い」ため、表現したい核となるロジックを真に理解するには、プロの数学者によって整理、選別、書き直される必要があると述べた。現在、彼とテレンス・タオは、AI ソリューションの重要な洞察をより正確に抽出するために、この証明をより明確なバージョンに圧縮して編集しています。

数学界は「この問題が解決された」ということ自体よりも、今回AIが新たな思考回路を切り開いたように見えることを重視している。タオ・ゼシュアン氏は、今回の研究は研究者らが「多数とその内部構造」を理解する新たな方法を発見したことを意味する可能性があり、この関連性は将来的により広範囲の問題に応用される可能性があると述べた。ただし、この画期的な進歩の長期的な重要性を検証するにはまだ時間が必要です。リヒトマン氏は、この結果が大学院時代からの彼の直感を裏付けるものであると信じている - 多くの関連する問題の間には何らかの共通構造がある可能性があり、今回 ChatGPT によって提案された新しい手法は、この統一性の新たな証拠を提供する。