新しい AI モデルには驚くべき「読心」機能があり、行動を見抜くだけでなく、意図を予測することもできます

人工知能は人間の行動の理解において画期的な進歩を遂げました。テキサス A&M 大学の研究者は最近、「OmniPredict」と呼ばれる新しい人工知能システムを開発しました。このシステムは、前例のない「心を読む」能力を実証しました。人間の動きを見るだけでなく、視覚的および環境的な手がかりを解釈することによって、人間の次の意図をリアルタイムで予測することもできます。

この研究結果は、自動運転技術が「受動的な反応」から「能動的な直感」への大きな飛躍を示すものです。従来の自動運転システムは通常、歩行者の現在位置と移動軌跡しか識別できませんが、OmniPredict はマルチモーダル大規模言語モデル (MLLM) テクノロジーを導入し、人間のような推論機能を提供します。このシステムは、歩行者の姿勢の変化、ためらいの瞬間、体の向き、さらには眼圧などの微妙な信号を鋭く捕捉することで、歩行者が道路を横断する準備をしているのか、ただ道路脇で待っているのか、あるいはその他の突然の行動をしているのかを推測します。

研究チームは、OmniPredict の主な利点は、さまざまなピクセルを単に「見る」だけでなく、動作の背後にある「理由」を理解しようとすることであると指摘しました。このモデルは、複雑に混合された入力情報を分析することにより、人間の行動を道路の横断、視界の遮蔽、特定の行動、視線の方向などの主要なカテゴリに正確に分類します。テストでは、OmniPredict は最大 67% の予測精度を実証しました。これは、現在市場にある最も先進的なモデルよりも完全に 10 パーセントポイント高いです。さらに驚くべきことは、歩行者が部分的に隠れていたり、目を通してのみ車両と対話するような複雑なシナリオであっても、システムが依然として非常に高い判断安定性を維持していることです。

プロジェクトリーダーのスリカンス・サリパリ博士は、OmniPredictがマシンに新しい種類の「ストリート・スマート」を与えると語った。自動運転車が人間のドライバーと同じように、通行人のボディーランゲージを読み取り、次の行動を予測できるようになれば、道路交通の安全性は質的に飛躍するでしょう。自動運転の分野に加えて、ボディランゲージや心理状態を解釈できるこの技術は、将来的には軍事作戦や緊急救助などのハイリスクなシナリオでも重要な役割を果たすことが期待されています。機械に「直感」を与えることで、人間と機械のコラボレーションのモデルが完全に変わります。

/ScitechDaily から編集