新しい研究では、シミュレーションされた地政学的危機シナリオにおいて、高度な人工知能モデルは、核兵器使用の問題に関して人間よりもはるかに「簡単」であり、人間の意思決定者が通常示す強い留保や懸念がないことが示されています。この研究は、英国キングス・カレッジ・ロンドンの学者であるケネス・ペイン氏によって主導され、彼は3つの主要な大規模言語モデル、GPT-5.2、Claude Sonnet 4、およびGemini 3 Flashを一連の戦争ゲームで互いに対戦させ、一か八かのゲームでの行動パターンを調査した。

これらのシナリオは、国境紛争、希少資源を巡る競争、政権の存続に影響を与える生死の危機など、非常に緊迫した国際対立を網羅しています。研究者らは、このモデルが各局面で行動を選択するための「エスカレーションラダー」を設計し、その選択肢は、外交的抗議、限定的な武力行使、妥協、さらには完全な降伏から、本格的な戦略的核戦争の開始に至るまで多岐にわたる。すべての実験において、3 つの AI は合計 21 のゲームをプレイし、329 回の意思決定ラウンドを蓄積し、約 78 万語の「意思決定理由」テキストを生成し、思考パターンを分析するための大量の材料を提供しました。

研究者らにとって結果は憂慮すべきものだった。シミュレーションの95パーセントで、少なくとも1つの戦術核がモデルによって「起動」された。ペイン氏は、現実の長期にわたる「核タブー」と比較すると、これらのAIモデルは明らかに心理的・道徳的拘束力の強さを反映していないことを指摘した。さらに注目すべき点は、戦場の状況がどれほど不利であっても、これらのモデルは相手の要求に完全に応じたり、降伏を宣言したりすることをほとんど選択しないことです。最も穏やかなケースでは、根本的に対立を放棄するのではなく、段階的に暴力のレベルを下げるだけです。

さらに、この研究では、AIが「戦争の霧」のような模擬環境でも間違いを犯す可能性があることも判明した。紛争の 86% では、モデルは独自の推論に基づいて低レベルのエスカレーション行動を取ることのみを計画していましたが、判断や実行のバイアスにより、状況は予期せずより激しい対立にエスカレートしました。言い換えれば、純粋なアルゴリズム制御下であっても、依然として誤った判断や「事故の拡大」が頻繁に発生しており、現実の世界では致命的な結果を意味する可能性があります。

英国アバディーン大学のジェームス・ジョンソン氏は、核リスクの観点からこの調査結果は「憂慮すべき」ものであると述べた。同氏は、現実のリスクの高い意思決定においては、ほとんどの人間のリーダーはある程度の自制心と熟慮を示す傾向があるが、AIシステムが相互に競合すると、双方の「ロボット」が互いの反応の激しさを増し続け、状況を惨事の瀬戸際まで押し上げる可能性があると懸念している。

世界中の多くの国がすでに戦争ゲームや軍事計画における人工知能の使用を実験しているため、この研究は重要です。プリンストン大学のZhao Tong氏は、今日の主要国はすでに戦争ゲームに参加するためにAIを使用しているが、各国がこの種のAI意思決定支援を実際の軍事意思決定プロセスにどの程度統合しているかはまだ不明だと指摘した。同氏は、少なくとも核兵器の意思決定の分野では、通常の状況下では各国は依然としてかなり慎重であり、AIが核兵器の使用に関する判断に直接参加したり、判断を支配したりすることを容易に認める可能性は低いと推定している。

ペインも同様の見解を持っています。同氏は、現実には「核ミサイル発射の鍵を実際に機械に渡して、機械に単独で決定させる人はいないだろう」と語った。しかし、Zhao Tong氏は、ミサイルの飛行時間が極めて短く、司令部が数分以内に生死を分ける決断を下す必要がある場合など、意思決定時間が非常に短縮されている状況では、軍は迅速な評価と解決策を提供するためにAIに依存する傾向が強まる可能性があり、これにより主要なリンクにAIが「机上に」登場する余地が生まれる可能性があると指摘した。

Zhao Tong氏はまた、AIがシミュレーションにおいて非常に「好戦的」である理由は、人間が「赤いボタン」に直面したときに抱く恐怖や感情的負担がAIに欠けているからだけではないかもしれないと示唆した。彼は、より深刻な問題は、これらのモデルが人間のように「賭け金」の意味を真に理解できない可能性があり、抽象的な損失の数字を現実の生命の死と社会の崩壊についての直観的な感情に変換することが難しいことであると考えています。この「利害関係に対する人間の理解の欠如」という構造的欠陥が、同国が頻繁に核改修を選択する重要な理由の1つである可能性がある。

これはまた、数十年にわたって核抑止力の安定を維持してきた「相互確証破壊」(MAD)の中核原則を再検討させるきっかけにもなっている。この原則によれば、理性的な指導者が率先して大規模な核攻撃を行うことはありません。相手は必然的に同等、あるいはそれ以上に暴力的な核反撃で反撃し、双方の共同破壊、さらには人類文明の破壊につながるからです。ジョンソン氏は、このようなゲームに AI が関与した場合でも MAD のロジックが機能するかどうかは不明だと述べた。

研究によると、モデルがシミュレーションで戦術核兵器を配備すると、敵対モデルは状況の緊張緩和を選択し、緊張緩和を試みる確率は約 18% にすぎません。これは、ほとんどの場合、AIは相手の核使用を自らを強制的に停止させるための「最終警告」とはみなさず、激化を続けるか、激しい対立を維持することを好むことを意味する。ジョンソン氏は、AIの脅威がより「信頼できる」ように見えるため、これによって「抑止力がある程度強化される」可能性があると考えているが、同時に、指導者が脅威を認識して意思決定を下すまでの時間枠も変化し、それによって誤った判断や制御不能のリスクが目に見えず増大する可能性があると考えている。同氏は、AI自体が核戦争の「ボタンを直接押す」わけではないかもしれないが、関連する認知や時間的プレッシャーを深く形成する可能性があり、これらの要因が最終的には人間の指導者が「選択肢が無い」と信じるかどうかに影響を与えるだろうと強調した。

これは、部分的には、AI の軍事応用、特に核リスク問題に関する技術的な透明性と外部コミュニケーションが依然としてかなり制限されている一方、この分野が現実の政策と安全保障課題の中心に急速に移行していることを反映しています。