ByteDance が OpenAI テクノロジーの秘密使用にさらされ、アカウントが一時停止

北京時間12月16日、海外メディアは、生成AI競争で出遅れているバイトダンスが「手を抜きたい」と考えていると報じた。同社は密かにOpenAIのテクノロジーを利用して独自の大規模言語モデルを開発しており、これはOpenAIの利用規約に違反している。現在、ByteDanceのアカウントはOpenAIによって停止されている。

外国メディアは、AIの分野では通常、ByteDanceの行為は「失礼な」行為であり、OpenAIの利用規約に直接違反しているとみなされていると述べた。OpenAI の利用規約には、同社が輸出したモデルを「当社の製品やサービスと競合する AI モデルの開発」に使用することはできないと記載されています。 ByteDance は Microsoft を通じて OpenAI へのアクセスを購入しましたが、Microsoft も OpenAI と同じポリシーを策定しました。

海外メディアが入手したバイトダンスの内部文書によると、バイトダンスは開発のほぼすべての段階でOpenAIのアプリケーションプログラミングインターフェース（API）を利用して、コード名「プロジェクトシード」と呼ばれるトレーニングモデルや評価モデルを含む基本的な大規模言語モデルを開発していることが確認されている。 Project Seed に携わる従業員は、この慣行による悪影響を十分に認識しています。社内コミュニケーションプラットフォームであるFeishuの海外版であるLarkでのByteDance従業員のチャット記録によると、彼らは「データの非感作」を通じて証拠をホワイトウォッシュする方法について議論していた。外国メディアによると、ByteDanceの従業員はOpenAIの技術を広範囲に利用しており、「シードプロジェクト」の従業員はOpenAI APIのアクセス制限の上限に達することが多かったという。

内部文書によると、バイトダンスは「シード計画」の初期段階でOpenAIのテクノロジーをさらに活用している。同社は数カ月前、「モデル開発のどの段階でも」GPTで生成されたテキストの使用を中止するようチームに命令した。この頃、同社は独自の大型AIモデル「Beanbao」をリリースする承認を得て、「シードプロジェクト」をオンライン化した。しかし、ByteDance は、Doubao の背後にあるモデルのパフォーマンスを評価するなど、OpenAI と Microsoft の利用規約に違反する方法で API を使用し続けています。バイトダンスの内部事情を直接知るある人物はこう指摘した。「彼らはすべてが合法であることを確認したいと言っていますが、本当に逮捕されたくないだけです。」

ByteDanceの広報担当者Jodi Seth氏は、GPTによって生成されたデータは「シードプロジェクト」の初期開発においてモデルに注釈を付けるために使用され、今年半ば頃にByteDanceのトレーニングデータから削除されたと答えた。「ByteDanceはMicrosoftからGPT APIを使用する許可を取得した。当社はGPTを使用して中国以外の市場で製品と機能を推進しているが、Doubaoを推進するには自社開発モデルを使用している。Doubaoは中国でのみ利用可能だ」とSeth氏は声明で述べた。

OpenAIの広報担当者ニコ・フェリックス氏は、バイトダンスのアカウントが停止されたことを確認する声明を発表した。「すべての API 顧客は、当社のテクノロジーが永続的に使用されることを保証するために、当社の使用ポリシーに従う必要があります。ByteDance が当社の API を使用することはほとんどありませんが、さらなる調査中に当社はそのアカウントを停止しました。その使用が会社のポリシーに準拠していないことが判明した場合、必要な変更を加えるか、アカウントを停止するよう要求します。」フェリックスは言った。

Microsoftの広報担当フランク・ショー氏は声明で、「Azure Open AIサービスなどのMicrosoft AIソリューションは、当社の限定アクセスフレームワークの一部である。つまり、すべての顧客はアクセスを申請し、Microsoftから承認を受ける必要がある」と述べた。「私たちはまた、お客様がこれらのテクノロジーを責任を持って使用し、サービス利用規約を遵守できるよう、標準を設定し、リソースを提供しています。また、企業が当社の行動規範に違反した場合には、悪用を検出し、アクセスを停止するためのプロセスも導入しています。」