最近、海外メディアは、Bytedance が OpenAI テクノロジーを使用して独自の大規模言語モデルを開発しており、これが OpenAI の利用規約に違反していると報じました。これに対し、ByteDanceの担当者は、OpenAI関連サービスを利用する際には、利用規約を遵守する必要があると強調していると述べた。また、外部報告によって引き起こされる可能性のある誤解を明確にするために、OpenAI とも連絡を取っています。
以下は、ByteDance による OpenAI サービスの使用方法の概要です。
1. 今年の初め、技術チームが初めて大規模モデルの調査を開始したとき、一部のエンジニアは GPT の API サービスを小規模モデルの実験プロジェクト研究に適用しました。このモデルはテスト専用であり、オンライン化する予定はなく、外部で使用されたことはありません。この慣行は、同社が 4 月に GPT API 呼び出し仕様チェックを導入してから廃止されました。
2. 今年 4 月の時点で、バイト ビッグ モデル チームは、GPT モデルによって生成されたデータをバイト ビッグ モデルのトレーニング データ セットに追加しないこと、および GPT を使用する際にサービス規約を遵守するようにエンジニアリング チームをトレーニングすることを明確な内部要件として提示していました。
同社は 3 月と 9 月に再度内部検査を実施し、GPT への API 呼び出しが規制要件に準拠していることをさらに確認する措置を講じました。たとえば、バッチ サンプリングでは、データ アノテーターが GPT をプライベートに使用するのを防ぐために、モデルの出力結果と GPT の間の類似性をテストします。
4. 今後数日以内に、関連サービスの利用規約が厳格に遵守されていることを確認するため、再度包括的な検査を実施します。