関係者は、OpenAIが高度なネットワークセキュリティ機能を備えた新モデルを完成させており、Anthropicがネットワークセキュリティモデル「Mythos」を小規模リリースしたのと同様に、少数の企業顧客にのみ提供する計画であることを明らかにした。注目を集める理由は、人工知能が自律性やハッキング能力の点で「臨界点」に達したと多くのセキュリティ専門家が考えているためだ。モデル開発会社は現在、自社のツールが引き起こす可能性のある実生活への損害をますます懸念しており、そのツールを公共の環境に完全に「公開」することに消極的になっています。

Anthropic は火曜日、新モデル「Mythos Preview」は、このモデルが非常に高度な侵入および悪用機能を備えており、悪用の可能性に対する懸念が高まっているため、厳選された少数のテクノロジーおよびサイバーセキュリティ企業のみに公開されると発表しました。当時、Anthropic は新モデルのリリース戦略にこれほど厳しい制限を採用した最初の AI 企業でしたが、現在 OpenAI も同様の道を歩む計画であることが明らかになりました。

詳細を見ると、OpenAIは、これまでで最も強力なネットワークセキュリティ推論機能を備えたGPT-5.3-Codexをリリースした後、今年2月に「Trusted Access for Cyber​​」と呼ばれるパイロットプロジェクトを開始しました。同社のブログによると、非公開プログラムに参加するよう招待された組織は、より高度なサイバー攻撃および防御能力、あるいはより高度な「寛容」モデルを利用して法的防御セキュリティの取り組みを加速できるという。 OpenAIはまた、関連する実験と展開のためにプロジェクト参加者に総額1,000万米ドルのAPI割り当てサポートを提供することも当時約束した。

より大きな背景としては、過去 1 年間にわたり、複数の元政府高官や安全保障のトップリーダーが警鐘を鳴らしており、もし悪者の手に渡れば、一部の AI モデルはいつか人間の介入なしに水道システム、電力網、さらには金融インフラを破壊できるようになるかもしれないと警告してきたということだ。以前は「将来のシナリオ」とみなされていたこれらの機能が、業界関係者の目には形になり始めています。

しかし、たとえ AI 企業が限定的な試験運用や段階的リリースを通じて一時的に「水門を締めた」としても、セキュリティのトップ専門家は一般に、全体的な傾向を逆転させるのは難しいと考えています。 「モデルがコードを列挙したり、古いコード ベースの抜け穴を見つけたりすることを防ぐことはできません。この機能は客観的にすでに存在しています。」 SANS Instituteの最高AI責任者、ロブ・T・リー氏は指摘する。パロアルトネットワークスの最高セキュリティインテリジェンス責任者であるウェンディ・ホイットモア氏は、サンフランシスコで開催されたHumanXカンファレンスのラウンドテーブルディスカッションの中で、同様の機能を備えた次のモデルが登場し、よりオープンな環境に流入するまでには、数週間か数カ月しか残されていないかもしれないと述べた。 CrowdStrike の対策担当上級副社長である Adam Meyers は、Mythos によって実証された機能を「業界全体への警鐘」であると述べました。

一部のセキュリティ専門家の見解では、企業がモデルの「既存の脆弱性の発見を支援する」だけではなく、「新たな攻撃や悪用プログラムを作成する」能力を本当に懸念しているのであれば、最先端モデルの起動範囲を制限し、一括リリースを実装する方が「合理的」だろう。 Aisle Security Company の CEO、スタニスラフ・フォート氏は Axios に対し、新たな脆弱性悪用チェーンを自動的に生成する機能は、単に欠陥を発見するよりも潜在的にエコシステムを脅かすため、制御された環境でゆっくりと検証する必要があると語った。

一部の専門家は、現在の大規模モデルは段階的に公開されており、従来のネットワークセキュリティベンダーがソフトウェアの脆弱性情報を公開する方法とある程度よく似ていると指摘した。 Lee 氏は、これは業界で長年にわたって行われてきた「責任ある脆弱性の開示」をめぐる議論に非常に似ていると考えています。リスクの開示とパッチの提供の間のタイミングと範囲のバランスをどう取るかは、繰り返し議論されている問題です。違いは、今回「開示が遅れた」のはもはや単一のソフトウェアの脆弱性ではなく、攻撃と防御の能力を大幅に強化する可能性のある一般的なインテリジェントツールであることだ。

OpenAI が将来のある時点で、この次期サイバーセキュリティ モデルをより広範囲に市場に投入するかどうかは不明です。対照的に、Anthropicは、Mythos Previewを完全には一般公開しないことを明らかにしているが、将来的に十分な強度の安全ガードレールを装備することができれば、Mythosシリーズの他のモデルのより幅広い開口部を検討する可能性を排除するものではない。同時に、アイル氏などの研究チームは、市場で広く入手可能な既存の AI モデルが、Mythos の実証事例ですでにかなりの数の脆弱性と悪用経路を発見している可能性があることを思い出させました。これは、セキュリティの「堀」を実際に構成するのは、モデル自体の「量」や「世代」ではなく、おそらくモデルの周囲に構築されたシステムやプロセスであることを意味します。