タイム誌によると、アメリカの AI スタートアップ Anthropic は大きな成功を収め、トップ AI 研究研究所の中で最も安全性を重視した企業であると自称しています。しかし、アントロピック社の幹部らはタイムズ紙に次のように語った。同社は、主力の安全政策の中核となる約束を放棄しようとしている。

Anthropic は 2023 年に、事前に適切なセキュリティ対策を確保できない限り、AI システムをトレーニングしないと約束しました。この取り組みは、Anthropic の責任あるスケーリング ポリシー (RSP) の中核となる柱となります。アンスロピック社の幹部らは何年もの間、この取り組みを、自社が市場の誘惑に抵抗でき、潜在的に危険な技術の開発を急いでいない責任ある企業であることの証明であると宣伝してきた。

しかしここ数カ月、同社はRSPを全面的に見直すことを決定した。この決定には、事前に適切なリスク軽減策を確保することなくAIモデルをリリースしないという当初の約束を放棄することが含まれている。

アンスロピック社の最高科学責任者であるジャレッド・カプラン氏は独占インタビューで「AIモデルのトレーニングをやめることは実際には誰の役にも立たないと私たちは信じています」とTIMEに語った。 「AIが急速に進歩する中、当社は、競合他社が急速に進歩しているときに一方的に約束をするのは合理的ではないと考えています。

タイムズ紙がレビューした Anthropic の新しいポリシーには、次の内容が含まれています。セキュリティ テストにおける Anthropic 独自のモデルのパフォーマンスの追加開示を含め、AI のセキュリティ リスクについてより透明性を高めるという取り組み。セキュリティに投資し、競合他社のレベルを超えるという取り組み。そして、指導者がAnthropicがAI競争のリーダーであり、壊滅的なリスクの可能性が高いと信じている場合、AnthropicのAI開発プロセスを「遅らせる」という約束。

しかし、全体として、RSP のこの調整により、Anthropic のセキュリティ ポリシーに対する制約が大幅に軽減されました。以前のポリシーでは、企業が適切なセキュリティ対策を講じずに一定のレベルを超えてモデルをトレーニングすることを明示的に禁止していました。

Anthropic は現在、OpenAI、イーロン・マスク氏の xAI、Google などのライバルとの激しい競争に直面しており、いずれも定期的に最先端のツールをリリースしています。同社はまた、Claude ツールの使用をめぐって米国国防総省との係争にも巻き込まれている。アンスロピックは以前、国防総省に対し、このツールは国内監視や致死的な自律作戦には使用できないと伝えていた。しかし、米国国防総省もAnthropicに対して最後通牒を突きつけ、使用が制限された場合にはAnthropicとの契約を打ち切ると脅した。

アンスロピック氏は、今回のセキュリティポリシーの調整は、AI開発のスピードと連邦レベルでの関連規制の欠如に基づく更新であると述べた。

Anthropicの広報担当者は、今回の調整について次のように述べた。企業が不均一なポリシーの状況で複数の競合他社と競争できるように設計されています。このような環境では、企業はセキュリティ保護が適切であるかどうかを自ら判断する必要があります。同氏はまた、安全保障に関する約束は国防総省の交渉とは何の関係もないと述べた。

「政策環境はAIの競争力と経済成長を優先する方向に移行しているが、安全性を重視した議論はまだ連邦レベルで十分な基盤を築いていない」とアンスロピック氏は変更を発表したブログ投稿で述べた。同社は、業界をリードする安全基準を順守することに引き続き取り組んでいると述べた。