OpenAIは火曜日、開発者向けの青少年向け安全ポリシープロンプトツールキットの立ち上げを発表した。これは、サードパーティアプリケーションが設計の最初から未成年者を保護するための安全ルールを組み込めるようにすることを目的としている。このツールキットは、直接呼び出し可能な「青少年安全ポリシー」プロンプトのセットとして利用でき、OpenAI のオープンソース加重安全モデル gpt-oss-safeguard とともに使用できます。

OpenAIによると、開発者は未成年者向けの安全メカニズムを設計する方法を一から始める必要はなく、この一連のプロンプトワードを直接使用して、既存または新しく開発されたAIアプリケーションを「強化」できるという。これらのポリシーは、生々しい暴力やポルノ コンテンツ、有害な身体イメージや行動、危険な活動や課題、ロマンチックまたは暴力的なロール プレイ、年齢制限のある商品やサービスなどのデリケートな領域に重点を置いています。同社は、これらのセキュリティポリシーはプロンプトワードの形で提供されるため、gpt-oss-safeguard以外のモデルにも容易に適用できるが、OpenAI独自のエコシステム内で使用することでより高い効果が期待できると強調している。

このポリシーの策定において、OpenAI は、AI 安全監視団体 Common Sense Media やEveryone.ai など、青少年とコンテンツの安全性分野のサードパーティと協力しています。 Common Sense Media の AI およびデジタル評価責任者であるロビー・トーニー氏は声明で、これらの迅速な言葉ベースのポリシーは、エコシステム全体にとって有意義なセキュリティ収益を確立するのに役立ち、オープンソースのリリース方法により、すべての関係者が時間の経過とともに継続的に調整および改善することも可能になると述べた。

OpenAI は、経験豊富なチームであっても、抽象的なセキュリティ目標を具体的で強制可能なルールに変換するのに実際には苦労することが多いとコンパニオン ブログで指摘しています。同社は、この逸脱が保護対策の抜け穴、一貫性のない実装基準、さらには過剰なブロックにつながる可能性があると考えており、そのため、明確で境界の明確なポリシーが効果的なセキュリティ システムを構築するための重要な基盤となります。

OpenAI はまた、この一連のポリシーでは AI の安全性に関する複雑な課題をすべて根本的に解決できないことも認めています。しかし同社は、この新しいツールは、製品レベルのペアレンタルコントロール、年齢予測、その他の機能を含む既存のセキュリティ対策をさらに拡張したものであると強調した。 2025 年に、OpenAI は大規模言語モデルの動作仕様 (モデル仕様) を更新し、18 歳未満のユーザーに直面した場合にモデルがどのように対応し、制限すべきかを明確にしました。

それでも、OpenAI は自社の安全記録について疑問に直面しています。同社は現在、ChatGPTの過度な使用後に自殺したユーザーの家族が起こした複数の訴訟に直面している。訴訟では、ユーザーがチャットボットのセキュリティを回避した後に危険な関係の一部が形成され、現在のモデルの防御は本当に「突破できない」ものではないと主張している。このような背景から、業界は一般に、このオープンソースの青少年安全ポリシーの提案は究極の解決策ではないものの、独立系開発者や小規模チームにとって比較的使いやすいコンプライアンスへのパスを提供し、未成年者向けの AI 安全慣行を促進する新たな一歩とみなされていると考えています。

もっと詳しく知る:

https://github.com/openai/teen-safety-policy-pack