OpenAIがトレーニングデータのプライバシーを侵害したとして告発していた集団訴訟の原告は、同社に対する訴訟を取り下げた。裁判所文書によると、訴訟は予断なく却下され、原告には再訴訟の選択肢がある。この訴訟は6月にカリフォルニア北部地区で初めて起こされ、OpenAIのスパイダーが「個人情報が収集され、[OpenAIの]製品に含めるために悪用されたすべての個人の財産権とプライバシー権を侵害している」と非難している。

訴訟では原告の名前は明らかにされておらず、イニシャルのみで特定されている。クラークソン法律事務所は彼らに代わって集団訴訟を起こした。

OpenAI は、他の生成 AI 企業と同様に、インターネットから公開されているデータを取得して、大規模な言語モデルのトレーニングを支援します。

OpenAI のような生成 AI 企業がモデルをトレーニングするために公開データを取得して使用する方法をめぐって、いくつかの訴訟が起こされています。ほとんどの訴訟は、プライバシーの問題ではなく、厄介な著作権を中心に展開しています。コメディアンのサラ・シルバーマン、作家のクリストファー・ゴールデン、リチャード・カドリーは、GPT-4とLlama2のトレーニング時に著作権を侵害したとしてOpenAIとMetaを訴えた。

7月、米国連邦取引委員会は、OpenAIがデータ収集と虚偽の情報の公開を通じて消費者に損害を与える可能性について調査を開始した。

OpenAIは8月、Webサイト所有者がWebクローラーをブロックできるようになったと発表した。ニューヨーク・タイムズなどのニュース出版社を含む一部のウェブサイトは、OpenAIによるデータのスクレイピングをブロックしている。