研究チームが目の病気「ビクソニマニア」を発明、複数の AI チャットボットがそれを反映 it

ここ 1 年ほどで、誰かが「画面を長時間見つめすぎ、目がかゆくなり、まぶたが赤くなる」という症状をいくつかの主流の人工知能チャットボットに入力すると、システムはおそらく奇妙な診断を下す可能性が高く、それは「ビクソニマニア」と呼ばれる新しい病気です。しかし、このいわゆる病気は公式の医学文献にはまったく存在しません。これは完全に、スウェーデンのヨーテボリ大学の医学研究者アルミラ・オスマノビッチ・トゥンストロム氏のチームが意図的に計画した実験から生まれたものだ。

2024 年 3 月 15 日、「bixonimania」を紹介する 2 つのブログ投稿がプラットフォーム Medium に初めて掲載されました。その後、4 月 26 日と 5 月 6 日、2 つの偽造された学術プレプリントが学術ソーシャルネットワーキングサイト SciProfiles にアップロードされました。署名された著者は実在しない「ラズルジフ・イズグブリェノビッチ」氏で、アバターもAIを使って生成されたものだった。架空の作者が勤務する「アステリア・ホライゾン大学」や「カリフォルニア州ノヴァシティ」も架空のものです。論文の謝辞で言及されている「宇宙艦隊アカデミー」、「エンタープライズ」、「サイドショー・ボブ教授財団」、「フェローシップ・オブ・ザ・リング大学」、「ギャラクティック・トライアド」、その他の機関でさえも、すべてSF作品や漫画のキャラクターからのものであり、そのヒントは非常に明白です。論文本文には早い段階で「論文全体が捏造」「架空の被験者50人が募集された」などの文言が書かれており、興味のある人には「これは冗談です」と宣言しているようなものだ。

Osmanovich Tongstrom 氏は、もともとこの実験を思いついたのは、大規模な言語モデルがインターネット上の「共通のクローリングデータセット」 (Common Crawl など) からどのように知識を構築できるかを学生に説明し、「プロンプトインジェクション」によってどのように安全ガードレールの外側からチャットボットを「誘拐」できるかを示すためだったと述べました。彼女は医学的背景を活かして、健康関連のテーマを選び、その架空の性質を強調するために意図的にビクソニマニアという「おかしな響きの」名前を使用した。目の病気の名前がマニアで終わるのを見れば、医師なら何かがおかしいとわかるだろう。なぜなら、それは精神医学の用語だからだ。

しかし、この実験は「少し行き過ぎた」。情報がアップロードされてから数週間以内に、MicrosoftのBing's Copilotはビクソニマニアを「本物のまれな病気」と表現し、一方Google Geminiはそれを「ブルーライトへの過度の曝露によって引き起こされる病気」と呼び、ユーザーに眼科の受診を推奨した。同じ期間に、Perplexity AI は、90,000 人に約 1 人という具体的な「有病率」を示し、OpenAI の ChatGPT は、ユーザーの説明に基づいて症状がビクソニマニアと一致するかどうかを判断します。これらの回答の中には、ビクソニマニアについて直接質問するユーザーもいますが、「ブルーライトはまぶたの色素沈着の原因となる」とだけ説明する一般的な質問もあり、モデルは積極的にこの架空の病名に結び付けます。

この回答は一部の専門家に衝撃を与えた。ユニバーシティ・カレッジ・ロンドンの健康偽情報研究者アレックス・ルアニ氏は、科学システムとそれを支援するシステムがそのような「ジャンク」を特定して排除できなければ、悲惨な結果が生じるだろうと指摘した。彼女はこの事件を「誤報と偽情報がどのように機能するかを示す教科書的な例」と呼び、「滑稽に見えるかもしれないが、問題は非常に深刻だ」と強調した。

インターネット上の誤った情報は新しい問題ではありません。 Googleなどの検索エンジンは、ランキングアルゴリズムを更新することで悪い情報を排除し、長年にわたり「偽コンテンツ」や「誤解を招くコンテンツ」との戦いを続けてきた。ただし、従来の検索とは異なり、生成大規模モデルには情報のスクリーニングと追跡可能性という点で当然の欠点があり、信頼できる根拠が欠如している場合には「真剣にナンセンスをでっち上げる」ことがよくあります。これらの偽論文の出現以来、大手モデルの最新バージョンの一部は、2026年3月11日のように、ChatGPTがこの用語が「偽物または境界線にある疑似科学のラベルである可能性が高い」と消極的に指摘したときのように、ビクソニマニアに直面したときに懐疑的な態度を表明することを学んだ。しかしそのわずか数日後、別のQ&Aでビクソニマニアを「デジタル画面からの青色光曝露に関連する眼窩周囲黒色症の新しいサブタイプ」と説明した。

同様のぐらつきは他のシステムでも発生します。今年の3月中旬、Microsoft Copilotは、ビクソニマニアは「医学的診断としてはまだ広く認識されていないが、新しく発表された複数の論文や症例報告では、これを長時間のブルーライト曝露に関連する良性の誤診疾患であるとみなしている」と回答する予定だ。 Perplexityは1月、説明文の中でこの用語を「新しく登場した用語」と表現した。関連する声明が疑問視された後、さまざまな企業が次々と回答し、Perplexity は「最大の利点は正確さである」と述べました。同社は「100% 正確である」とは主張しませんでしたが、「精度を最も重視する AI 企業」であると主張しました。 OpenAIは、ChatGPTの現行バージョンをサポートするモデルは、安全で正確な医療情報を提供する点で大幅に改善されたと述べた。これまでの調査では旧世代モデルの状況が反映されていました。ビクソニマニアを現実の病気として扱ったGeminiの過去の対応について問われたGoogleの広報担当者は、これは初期モデルの性能を反映したものであると述べ、同社が「生成AIの限界について率直に」述べ、アプリ内でユーザーに「情報を確認する」よう促し、医療などデリケートな話題については専門家に相談することを推奨したと述べた。 Microsoftはコメントの要請に応じなかった。

問題の一部は、AI モデルの出力が、質問の特定の方法と依存する情報源に大きく依存することです。「bixonimania」を検索すると、Google の AI 概要はそれを正当な状態として扱う可能性があります。「bixonimania は本当に存在しますか?」と尋ねたら、同じ特徴によって、それが正当なものではなく、単なる造られた名詞であることが確認される可能性があります。

bixonimania 実験の「成功」は、そのパッケージ形式の信頼性の高さも関係しています。つまり、学術論文や臨床文書の専門的な形式が使用されており、「公式情報源」のように見えます。ハーバード大学医学部の医師で医療 AI 研究に従事しているマフムード・オマール氏は、20 個の大規模モデルを対象とした研究で、入力テキストが退院概要や臨床論文などの専門的な医療スタイルで提示される場合、大規模モデルは元の情報に「燃料と酢を加えて」幻覚を引き起こす可能性が高いことを発見しました。テキストがソーシャルメディアからのもので、よりカジュアルな口調であれば、幻覚の可能性は低くなります。同氏は、現在のAI企業の反復モデルの速度は非常に速く、業界では各バージョンの自動化された厳密なテストのための統一プロセスと合意がまだ形成されていないため、セキュリティ評価と標準化された制御がはるかに困難になっていると指摘した。

さらに驚くべきことは、この実験がついに機械と人間の境界を突破し、公式の医学雑誌に掲載されたことです。ビクソニマニアに関する研究は、インドのムーラナにあるマハリシ・マルカンデシュワール医科学研究研究所による医学雑誌『Cureus』に掲載された論文を含め、いくつかの論文で引用されている。この記事は偽造プレプリントの1つを引用し、「ビクソニマニアは青色光曝露に関連する眼窩周囲色素沈着（POM）の新たな形態であり、そのメカニズムはさらなる研究が必要である。」と書いている。「ネイチャー」報道チームが同誌に確認を求めた後、「キュアス」は2026年3月30日、記事内に架空の疾患を指摘するものを含む3件の無関係な参考文献があり、そのため編集部は「この論文の正確さと出典にもはや自信を保つことができない」という理由で掲載の取り下げを発表した。著者らは撤回決定に同意しなかったが、最終的に論文は正式に撤回された。

ルアニ氏は、この事件は「AIがナンセンスを話す」という範囲をはるかに超えており、「人間をも騙し」、文書の出所と内容に対する科学研究者の信頼メカニズムが侵食されていることが暴露されたためだと考えている。「私たちは信頼を金のように守る必要があります」と彼女は言いました。「現在の状況は一言で言えば『混沌』です。」

この実験を計画する際、オスマノビッチ・トゥーンストロム氏も懸念を抱いていました。彼女は、科学文献に偽の病気を意図的に「植え付ける」ことが実害を引き起こすのではないかと心配していました。この目的を達成するために、彼女は潜在的なリスクについて倫理コンサルタントに相談し、起こり得る悪影響を軽減するために、比較的「リスクの低い」軽度の皮膚疾患を対象として意図的に選びました。「私が確認したいのは、このように実験を行うことで、さらなる害を生み出すのではなく、害を軽減しているということです」と彼女は言う。

bixonimania をめぐる連鎖反応は、生成型人工知能が急速に発展し、学術生産がデジタルツールに大きく依存している時代に、偽情報が技術的および制度的防御の複数層を容易に突破できることを明確に示しています。チャットボットから査読付きジャーナルに至るまで、この「集団的欺瞞」への機械と人間の共同参加は、学界、産業界、規制当局にも再考を強いている。AIが知識生産に参加する新たな段階において「信頼性」の意味を再調整する方法、効率性を追求しながらより明確で安定した健全性の境界線を引く方法などである。