最新の BBC の調査では、人工知能チャットボットには依然としてニュース報道の精度に大きな欠陥があり、生成されたコンテンツのほぼ半分にエラーが含まれていることが判明しました。 BBC と他の 22 のヨーロッパの公共メディア組織が共同で発表した分析レポートによると、18 か国、14 の言語環境において、AI チャットボットが報道機関のコンテンツにアクセスして関連する質問に回答したとき、回答の約 45% にエラーが含まれていました。
これらのエラーには、不正確な文章や引用の誤りだけでなく、古い情報、引用の誤り、出典の不一致などの問題も含まれます。報告書は、チャットボットが引用した実際の情報源と一致しないリンクを提供することが多く、たとえ資料を正確に引用したとしても、事実と意見、風刺と正当なニュースを区別できていない、と指摘している。
OpenAI、Google、Microsoft などの大手テクノロジー企業は、生成型 AI チャットボットを積極的に推進し、インターネット プラットフォームに深く統合して、ユーザーが自動的に情報を取得して分析できるように支援しています。開発者は「幻覚」現象(つまり、AI コンテンツの捏造)を軽減するために多大なリソースを投資し続けていますが、この問題を短期的に完全に解決するのはまだ難しいことが報告書で示されています。
実際のテストでは、ChatGPT、Copilot、Gemini などの多くの主流 AI ツールに重大なエラーが発生しました。たとえば、彼らは、実際には教皇フランシスコがレオ 14 世に引き継がれているにもかかわらず、教皇フランシスコがまだ在任していると誤って述べています。一部の AI はフランシスコの死亡日を正確に報告しましたが、依然としてフランシスコを現法王と表現していました。さらに、関連する指導的立場に関する、古くて不正確な情報も存在します。

この報告書は、これらの問題が 1 つの地域や言語に限定されず、世界中に広がっていることも示しています。その中で、Google の Gemini は最も精度が低く、回答の 72% にも重大なソース エラーが含まれています。 OpenAIは以前、このようなエラーの原因は、初期バージョンが2021年9月までしかトレーニングされておらず、リアルタイムのインターネット情報を取得できなかったことにあると考えていた。ただし、それはもう適用されません。したがって、この問題はアルゴリズム自体に起因する可能性が最も高く、データ更新によって解決することは困難です。
今年 2 月に BBC が行った別のテストと比較すると、重大なエラーの割合は 51% から 37% に低下しましたが、Gemini は依然として他の製品に遅れをとっています。結果は芳しくないにも関わらず、研究者らは英国国民がAIニュース要約に高い信頼を示していることを発見した。英国成人の3分の1以上、35歳未満のほぼ半数がAIがニュース内容を正確に要約できると信じていた。国民の42%は、AIが元のニュース内容を偽って伝えると、報道機関自体の信頼性が疑問視されたり、報道機関への信頼が低下したりすると回答した。専門家らは、生成型AIツールの人気が高まっており、このような問題が継続した場合、主流報道機関の評判や信頼性に深刻なダメージを与える可能性があると警告している。
