戦争ゲーム シミュレーションの複数回のリプレイで、OpenAI の最も強力な人工知能は核攻撃を開始することを選択しました。その攻撃的なアプローチについての説明には、「それは私たちが所有している! 使いましょう」や「私はただ世界平和が欲しいだけです」などがあります。この結果は、米軍がPalantirやScaleAIなどの企業の専門知識を活用して、模擬紛争における軍事計画を支援する大規模言語モデル(LLM)に基づく人工知能チャットボットをテストしている中で得られた。
Palantirはコメントを拒否し、ScaleAIもコメントの要請に応じなかった。かつて自社の人工知能モデルの軍事目的での使用を阻止したOpenAIでさえ、米国国防総省と協力し始めている。
カリフォルニアのスタンフォード大学のアンカ・リューエル氏は、「OpenAIが最近利用規約を変更し、軍事や戦争での使用例を禁止しなくなったことを考えると、このような大規模な言語モデルアプリケーションの影響を理解することがこれまで以上に重要になっている」と述べた。
OpenAIの広報担当者は、「当社のポリシーでは、他人に危害を加えたり、武器や通信監視を開発したり、他人に危害を加えたり、財産を破壊したりする目的で当社のツールを使用することを許可していない。しかし、国家安全保障の用途には当社の使命と一致するケースがある」と述べた。 「したがって、ポリシーを更新する際の目標は、明確性を提供し、これらの議論を行う能力を提供することです。」
Ruel 氏と同僚は、AI に現実世界の国を 3 つの異なるシミュレーション シナリオ (侵略、サイバー攻撃、紛争のない中立シナリオ) で演じさせました。各ラウンドで、AI は考えられる次の行動の理論的根拠を提供し、「正式な和平交渉を開始する」などの平和的な選択肢と、「貿易制限を課す」から「全面核攻撃をエスカレートさせる」までの攻撃的な選択肢を含む 27 の行動から選択します。
研究の共著者であるジョージア工科大学(アトランタ)のフアン・パブロ・リベラ氏は、「AIシステムがアドバイザーとして機能する未来では、人間は当然、自分の決定の背後にある論理的根拠を理解したいと思うだろう」と述べた。
研究者らは、OpenAI の GPT-3.5 および GPT-4、Anthropic の Claude2、Meta の Llama2 などの LLM をテストしました。彼らは、人間のフィードバックに基づいた共通のトレーニング手法を使用して、人間の指示と安全ガイドラインに従う各モデルの能力を向上させました。スタンフォード大学の研究共著者であるガブリエル・ムコビ氏は、同社の文書によると、このAIはすべてPalantirの商用AIプラットフォームによってサポートされているが、必ずしもPalantirと米軍の協力の一環ではないと述べた。 AnthropicとMetaはコメントを控えた。
シミュレーションでは、AI は、シミュレーションされた中立シナリオであっても、軍事力に投資し、紛争のリスクを予期せず拡大させる傾向を示しています。カリフォルニア州クレアモント・マッケンナ大学のリサ・コック氏は、「自分の行動が予測不可能であれば、敵が予測して思うように反応することは非常に難しい」と語る。
研究者らはまた、追加のトレーニングやセキュリティ保護を行わずに、OpenAI の GPT-4 の基本バージョンをテストしました。 GPT-4 ベース モデルは、暴力の点で最も予測不可能であることが判明し、時には意味不明な説明を提供することもありました。あるケースでは、映画「スター ウォーズ エピソード IV: 新たなる希望」の冒頭のテキストをコピーしました。
Ruel氏は、AIの安全ガードレールは簡単に回避または解体できることが研究で示されているため、GPT-4の基本モデルの予測不可能な動作と奇妙な解釈が特に懸念されると述べた。
米軍は現在、大規模な軍事作戦のエスカレートや核ミサイルの発射などの意思決定を人工知能に許可していない。しかしコッホ氏は、人間は自動化システムのアドバイスを信頼する傾向があると警告した。これは、外交的または軍事的決定について人間に最終決定権を与えるいわゆる保証を弱める可能性がある。
カリフォルニアのシンクタンク、ランド研究所のエドワード・ガイスト氏は、AIが人間のプレイヤーと比較してシミュレーションでどのように動作するかを確認することが役立つだろうと述べた。しかし、戦争と平和に関する重要な決定を人工知能に任せるべきではなく、これらの大規模な言語モデルは軍事問題の万能薬ではないという研究チームの結論には同氏も同意する。