Xiaomi は 3 つの自社開発大型モデルを発売します。雷軍氏は今年AI分野に160億ドル以上を投資すると発表

3月19日、Xiaomiは3つの自社開発大型モデル、Xiaomi MiMo-V2-Pro、Xiaomi MiMo-V2-Omni、Xiaomi MiMo-V2-TTSの発売を発表しました。 MiMo-V2-ProとMiMo-V2-Omniが正式にAPIサービスをオープンしたと報告されています。

Xiaomi の公式紹介によると、3 つのモデルのうち、MiMo-V2-Pro は主力のテキストベースであり、高強度のエージェント作業シナリオ向けに設計されており、推論、計画、ツールの呼び出しに重点を置いています。 MiMo-V2-Omni は、テキスト、視覚、音声認識をネイティブに統合して、理解から実行までの完全なリンクを開くフルモーダルエージェントベースです。 MiMo-V2-TTS は大規模な音声合成モデルです。その目標は、エージェントが温かく感情的な声を表現できるようにし、スタック全体の最後のリンクを形成することです。

MiMo-V2-Pro は、主力ベースモデルとして、エージェントシナリオ向けに特別に最適化されています。複雑で多様なエージェントアーキテクチャに対して教師あり微調整と強化学習を実行し、より強力なツール呼び出しと複数ステップの推論機能を備え、最終的に結果をもたらします。アーキテクチャの観点から見ると、モデルのパラメータの合計サイズは 1 兆 (1T) を超え、そのうちのアクティベーションパラメータは 42B です。改良されたハイブリッドアテンションメカニズム (ハイブリッドアテンション) を採用しており、推論の効率を確保しながらモデルの能力を大幅に向上させます。コンテキストウィンドウはさらに 100 万トークンまで拡張され、超長いタスクチェーンと複雑なワークフローをサポートできます。

同時に発表された MiMo-V2-Omni と MiMo-V2-TTS は、知覚と表現という 2 つのパズルのピースを完成させます。前者の中心的な価値は、オーディオ、画像、ビデオの調整にあります。後者は、きめ細かい制御を備えた感情表現エンジンをサポートし、エージェントに人間に近い表現機能を提供します。

価格面では、MiMo-V2-Pro の API 価格は、同レベルの競合製品よりも安価です。 256K のコンテキスト内では、100 万トークンあたりの入力価格は 1 米ドル、出力は 3 米ドルです。 1M のコンテキスト範囲内では、入力は 2 米ドル、出力は 6 米ドルです。現在、MiMo-V2-Proは正式にAPIサービスをオープンしています。 MiMo-V2-Omni も API をオープンし、256K のコンテキスト長をサポートしています。入力価格は 100 万トークンあたり 0.4 米ドル、出力価格は 2 米ドルです。

MiMo-V2-Pro および Claude の API サービス課金標準

さらに、Xiaomi は、開発者コミュニティへの浸透をさらに促進するために、OpenClaw、OpenCode、KiloCode、Blackbox、Cline の 5 つのエージェントフレームワークチームと協力して、1 週間の期間限定の無料インターフェイスサポートを提供しました。

これは、Xiaomi がエージェントの時代に完全に賭けていることを示す重要な兆候とも見なされます。その日の早朝、シャオミ創業者の雷軍氏はソーシャルプラットフォームに「AI分野における今年の研究開発と設備投資は160億元を超えるだろう」と投稿した。

Lei Jun 氏によると、MiMo-V2-Pro は数兆個のパラメーターを備えた大規模モデルであり、世界的な大規模モデルの総合インテリジェンスの人工分析ランキングで世界 8 位にランクされています。大型模型ブランドランキングでは世界第5位。「私たちのモデルは完成したばかりで、今後急速に反復され、強化される予定です。」

XiaomiのMiMo大型モデルマネージャーLuo Fuli氏も、以前に発売された「Hunter Alpha」がフラッグシップモデルMiMo-V2-Proの内部テストバージョンであるとソーシャルプラットフォームで公に述べたことは注目に値します。 1995年生まれの羅富麗さんは、業界では「AI才女」と呼ばれている。

3 月 11 日、世界最大の API アグリゲーションプラットフォームである OpenRouter 上で、コード名「Hunter Alpha」という謎のモデルが公開されました。このモデルへの累計呼び出し数はわずか7日間で1兆トークンを超え、連日リストのトップに上り、激しい議論を巻き起こし、一時は「DeepSeek V4」の初期バージョンと間違われたと報告されている。。

偶然にも、Luo Fuli はかつて DeepSeek で働いていました。彼女は Alibaba Damo Academy でキャリアをスタートし、そこで多言語事前トレーニングモデル VECO の開発を主導し、AliceMind のオープンソース活動を推進しました。 2022 年、Luo Fuli は DeepSeek の親会社 Huanquan Quantitative に入社し、ディープラーニング関連の業務に従事しました。その後、DeepSeek で深層学習の研究者として勤務し、DeepSeek-V2 やその他のモデルの開発に参加しました。

昨年12月、Luo Fuli氏はXiaomiの「People, Cars, and Homes Ecosystem」パートナーカンファレンスで初めて公の場に姿を現した。

12月17日、Xiaomiグループのパートナー兼グループ社長のLu Weibing氏は、Xiaomiが自社開発した大型AIモデルXiaomi MiMo-V2-Flashが正式にオープンソースとなり発売されたと発表した。 Lu Weibing氏は当時、XiaomiがAI分野で「圧力投資」を開始し、大型モデルやアプリケーションの進歩が「予想をはるかに上回っていた」と明らかにした。将来的には、「AIと物理世界の深い統合」という中核的な方向に焦点を当てていきます。