ニューヨーク・タイムズは、英国AIセキュリティ研究所(AISI、旧AI安全研究所)の研究者らが最先端のAIモデルをテストしてセキュリティの脆弱性とリスク境界を見つける予定であり、このアプローチは他の政府も模倣していると報じた。

ここ数年、AI 規制は透明性、責任、原則、リスク管理、自主的な取り組みという言葉に留まることが多くなりました。ここで、質問はより具体的になります。モデルはリリース前にハッカーを助けることができるでしょうか?有害物質製造の閾値は下がるのでしょうか?重要なシナリオではセキュリティ制限を回避できますか?
これは企業だけでは答えられない質問です。企業はレッドチームテストを実施し、セキュリティレポートを発行することができますが、政府が独自の評価能力を持たない場合、政府は記者会見、論文、企業のコミットメントの間で判断することしかできません。英国 AI セキュリティ研究所の価値は、テスト プロセスに政府が参加していることにあります。
このモデルは国際協力にも広がり始めています。英国政府は5月25日、英国AIセキュリティ研究所がオーストラリアAIセキュリティ研究所と協力し、AIシステムがサイバー攻撃にどのように利用され、防御強化にどのように利用できるかなど、最先端のAIリスクを追跡すると発表した。この発表では、両社がAIの機能に関する洞察を共有し、新たなリスクに関する研究を実施し、AIのテストと評価における国際的なベストプラクティスを促進することにも言及した。
米国も同様の方向に向かっている。米国商務省傘下の AI 標準イノベーションセンター (CAISI) は最近、モデルの公開前に国家安全保障関連の評価を実施することで Google DeepMind、Microsoft、xAI と合意に達しました。マイクロソフトはまた、最先端モデルのテスト、セキュリティ保護の評価、国家安全保障および大規模な公共安全リスクの軽減を目的として、米国の CAISI および英国の AISI との協力体制の確立も同時に発表しました。
これは、最先端のモデル企業が将来的に市場競争に直面するだけでなく、ますます「リリース前のセキュリティ評価」に似たプロセスにさらされることを意味します。英国や米国のような協力枠組みの下では、モデルの能力が強ければ強いほど、企業はより多くの材料と政府検査機関へのアクセス権を提供する必要が生じる可能性が高くなります。新興企業にとって、将来、政府調達、企業調達、国境を越えたコンプライアンスにおいてこの種の評価がより参照されるようになれば、セキュリティテスト機能も製品競争の一部となるでしょう。
将来的には、AI による監督は、「企業は安全に関する誓約書を作成しましたか?」と尋ねるだけではなくなります。しかし、「誰かが実際にテストしたことがありますか?」と尋ね始めるでしょう。これは原則を述べるよりも厄介で、現実に近いものです。