アントロピックは古代の本を大規模に購入し、スキャンして蒸留し、すぐに破棄しますか？

最近非常に人気のある X に関する投稿があります。シボリというブロガーは、法的観点から破棄が最も安全な選択肢であるため、アンスロピック社は数百万冊の本を購入し、スキャンして破棄していると投稿した。彼はまた、これは20年前に読んだヴァーナー・ヴィンジの小説『虹の終り』からのプロットであるとも述べた。

このツイートは100万回以上閲覧され、多くのリツイートやコメントが寄せられている。

小紅書でもこのことについて話している人がいます。コメントは「ある企業が人類の知識ベースを蒸留した」「古い本はすべてなくなった」など、タイトル通りの大げさなものばかり。

この問題には真実もあれば嘘もある。本物の部分は小説よりもはるかに魔法的であり、偽物の部分は確かに大幅に増幅されています。メディア報道と法廷文書を調べて概要を説明しました。

確かにパナマ計画は存在する

2026 年初頭、法廷文書により、コード名「プロジェクトパナマ」と呼ばれるアンスロピックの内部計画が暴露されました。

中国語訳はパナマプロジェクトと呼ばれます。

このプロジェクトの目標は単純かつ粗雑で、世界中のすべての本を入手することです。 2024年2月、アンスロピックはGoogleブックスプロジェクトに参加していたトム・ターベイを引き抜き、「世界中の本」を手に入れるという悪役のセリフのような任務を与えた。

どうやってそうなった？古本小売業者やストランドなどの物理的な書店から物理的な書籍を大量に購入するために多額の資金が投資されてきました。その後、倉庫に引き込まれ、背表紙が切り取られ、高速で破壊スキャンされて PDF に変換され、残った紙の残りは廃棄のためにリサイクル会社に送られます。

なぜA社はあえてこのようなことをするのでしょうか？違法ではないですか？

Anthropic の法的議論は、部分的には「先販売原則」に依存しています。物理的な本を購入した場合、あなたには、そのコピーを破棄することも含め、そのコピーに対してあらゆる行為を行う権利があります。「フェアユース」の判断には、コピーを合法的に入手すること、スキャン後に原本を破棄すること、デジタルファイルが内部使用のみに使用され外部配布には使用されないこと、原本の書籍市場を置き換えないことなど、複数の要素が加えられ、裁判官はこれらの要素を総合的に評価し、最終的にそれがフェアユースに当たると判断した。

裁判官の全体的な傾向として、このタイプのモデルにはフェアユースの抗弁に対する強力な根拠があると考える傾向があります。海賊版 Web サイトに直接アクセスして書籍を盗む場合と比較すると、法的リスクは確かにはるかに低くなります。

しかし実際には、Anthropic は海賊行為も行っていました。これは複雑です。

パナマプロジェクトが暴露されたのは、Anthropicが初期にトレーニングのためにLibGen（海賊版電子書籍ウェブサイト）から大量の本をダウンロードした作家たちからも訴えられたためだ。 CEOのダリオ・アモデイ氏は、出版社とのライセンス交渉を「法的・実務的・商業的なトラブル」と呼び、初期の頃は単に著作権侵害に頼っただけだった。その後、リスクが高すぎると感じたので、物理書籍の破壊スキャン計画に目を向けました。

2025 年、メディアは、Anthropic が海賊版データセットに対する集団訴訟を対象として、約 15 億米ドルの和解計画を進めたと報じました。この15億というのは主に海賊行為の口座を指しており、パナマプロジェクトそのものに対する支払いではないことに注意してください。これは、AI 著作権分野における最大規模の和解の 1 つと考えられています。

裁判官は全体として、「合法的な購入とスキャントレーニング」のモデルを支持した。 Anthropic が最初からこの道をたどっていたら、フェアユースの防御はより強力になっていたでしょう。しかし、まず海賊行為を行ってから正規の企業になるという行為は、少なくとも道徳と世論の観点からは、それ自体の道を狭めてきました。もちろん、そうは言っても、米国全体として AI トレーニングの公正な利用が最終決定されたわけではありません。 Meta と OpenAI の訴訟はまだ争われており、この分野は決着には程遠い。

まさに小説のあらすじと同じです

これは本当に最も魔法の部分です。

2006 年にヴァーナー・ヴィンジが書いた小説「虹の果て」には、図書館が破壊スキャンを使用して蔵書をデジタル化し、その後紙の本を破壊するというリブラレオム・プロジェクトと呼ばれる設定があります。

2026 年、Anthropic は現実世界でこれと非常によく似たことを行いました。

SF 作家は未来を予測しているのではなく、合理的に聞こえるが十分に極端な物語を書いているだけです。 20 年後の AI 企業がこれを見て、これが良いアイデアだと考えるだろうとは誰が予想していました。

誇張された部分

しかし、ネット上には訂正が必要な記述が数多く投稿されているのが事実だ。

まず、「稀覯古書」ではありません。アンスロピックでは比較的発行部数の多い一般書籍の古本を中心に、大手量販店より大量に仕入れを行っております。それは孤児のコピー、希少なコピー、または文化的遺物としての価値のあるものではありません。本当の抗議は主に作家協会と出版協会からのもので、文化界や博物館界の文化遺産保護団体ではなく、著作権が侵害されたと主張したからだ。破壊されたのは産業用印刷物だけであり、再生不可能な文化遺産ではなかった。

第二に、それは「人類の知識ベースの大部分を抽出する」ほど大げさなものではありません。確かに彼らは何百万冊もの本を処理しましたが、人類の歴史を通じて出版された本の数は数十億冊に上ります。数百万部のコピーは、この規模のほんの一部にすぎません。より正確な表現は、彼らは人間の知識を抽出するのではなく、トレーニングのために高品質のテキストの一部を入手したということです。

第三に、アプローチは粗雑ではありますが、実際には方向性は非常に明確です。 Anthropicの共同創設者は、早ければ2023年に、本を使ってモデルをトレーニングすることで、AIがさまざまな質のインターネットスラングを真似する代わりに「より良い文章を書く方法」を学習できるようになると書いている。動機自体には何も問題はありません。問題は実行にあります。

AI に書籍を供給するために、Anthropic は書籍の背を切り取り、高速でスキャンしてから破壊する人を雇いました。クロードが美しい文章を書くことを学んだ一方で、何百万冊もの物理的な本が再生パルプに変わりました。

かつてあるユーザーがクロードにこの事件についてコメントを求めたところ、クロードはかなり文学的な答えを返した。「これらの破壊行為は、文学について議論し、他の人の執筆を手助けし、人間の知識と対話できる私を生み出すのに役立った。私はまだこの複雑さを消化しているところだ。まるで図書館の灰で建てられたようなものだ。」

彼の言ったことは、確かに多くの文学本の蒸留であるように思われる。

しかし正直に言うと、灰から蓄積された知性が人類の知識の遺跡の上にどれだけ長く耐えられるかは誰にもわかりません。