Google は古いニュースと大規模なモデルを使用して鉄砲水の新しい予測方法をまとめています

鉄砲水は世界で最も致命的な気象災害の 1 つであり、毎年 5,000 人以上が死亡しています。しかし、発症が早く、範囲が狭く、持続時間が短いため、正確に予測することは長い間困難でした。この問題に直面したGoogleの新たな答えは、「AIにニュースレポートを読ませる」というものだ。

従来の気象監視では、気温、降水量、河川の流れなどの大量のデータが蓄積されてきました。しかし、突然の非常に強い鉄砲水現象については、人間は他の気象要素ほど完全かつ継続的な観測記録を持っていません。このため、天気予報の分野ではディープラーニングがますます強力になっているにもかかわらず、モデルをトレーニングするのに十分な「真の値」データが不足しているため、鉄砲水予測では同レベルのパフォーマンスを発揮できないという事実が生じています。

このデータギャップを埋めるために、Google 研究チームは大規模言語モデル Gemini を使用して、世界中から約 500 万件のニュースレポートを選別し、約 260 万件の異なる洪水イベントを自動的に識別して抽出し、これらのテキストレポートを時間と地理的タグを備えたシーケンスデータセット「Groundsource」に変換しました。 GoogleのリサーチプロダクトマネージャーであるGila Loike氏は、同社がこの種の定量的データ構築作業を完了するために大規模な言語モデルを使用したのはこれが初めてであると語った。関連する研究結果とデータセットは木曜日の早朝に公表された。

この「現実世界のベースライン」を取得した後、研究者らは長期短期記憶 (LSTM) ニューラルネットワークに基づいて新しい鉄砲水予測モデルをトレーニングし、全球の天気予報データを入力して特定の地域での鉄砲水の確率を出力できるようにしました。現在、Google の鉄砲水予測モデルは、洪水ハブプラットフォーム上で 150 か国の都市部のリスクに関するヒントを提供し、世界中の多くの緊急事態管理機関にデータを公開しています。南部アフリカ開発共同体（SADC）の緊急対応担当官であるアントニオ・ホセ・ベレーザ氏は、Googleとのトライアルで、このモデルがチームの洪水への迅速な対応に役立ったと述べた。

ただし、このシステムには依然として明らかな限界があります。一方で、その空間分解能は比較的低く、現時点では約 20 平方キロメートルのスケールでしかリスク評価を提供できません。一方で、ローカルレーダーなどのリアルタイムの降水量監視データが組み込まれていないため、その精度は米国国立気象局の既存の洪水警報システムほど正確ではありません。

Googleは、このプロジェクトの当初の目的の1つは、高価な気象観測インフラが不足し、長期的な気象記録がない地域の開発に役割を果たすことであったと強調した。 Groundsource データセットは、世界中からの何百万ものニュースレポートを集約することにより、データが不足している地域に対してモデルが予測を外挿できる程度まで「地図のバランスを再調整」します。 Googleのレジリエンスチームのプログラムマネージャー、ジュリエット・ローゼンバーグ氏は、このアプローチにより、チームはこれまで情報が著しく不足していた領域をカバーできるようになったと述べた。

ローテンバーグ氏はまた、大規模な言語モデルを使用してテキストの物語を構造化された定量的データに変換するというアイデアは鉄砲水に限定されるものではないとも述べた。将来的には、同様の技術を使用して、熱波や土砂崩れなど同様に短命ではあるが非常に重要な自然現象に関するデータセットを構築し、さらなる異常気象や地質災害を予測するための基礎を提供することが期待されています。

業界関係者によると、Googleの試みは、創造的なデータ収集を通じてディープラーニング天気予報の開発を促進する重要な一歩だという。水力発電会社などの顧客向けにディープラーニングを利用して川の流れを予測するアップストリーム・テック社の最高経営責任者（CEO）、マーシャル・ムーテノ氏は、現在の地球科学分野は「データ不足」という根深い問題に直面していると指摘した。一方で、地球観測データは非常に複雑であり、他方では、モデルの校正や検証に使用できる高品質の「真理値」が非常に限られている。 Moutenot は、機械学習に直接使用できる研究者や新興企業向けの気象データセットの整理に特化した組織、dynamical.org の共同創設者でもあります。同氏は、Googleの取り組みは「非常に創造的な方法」を通じて貴重なデータを取得する典型的な例であると考えている。