JetBrains オープンソース 120 億パラメータ Mellum2 model

JetBrains は最近、ソフトウェアエンジニアリングシステム用の次世代機械学習モデルである Mellum2 が正式にオープンソース化されたと発表しました。これは、同社が 2025 年に最初の Mellum モデルをオープンソース化してから 1 年余りのことです。当時、Mellum はコード補完に重点を置いた小規模なモデルで、パラメーターサイズは約 40 億でした。それに比べて、Mellum2 のパラメータの総数は 120 億個に拡大しました。ただし、JetBrains は、疎な専門家混合 (MoE) アーキテクチャを採用することで、各トークンが実際に関与するのは約 25 億のアクティブなパラメーターのみであるため、標準ハードウェアでも高速な推論速度を維持できることを強調しています。

エディター内でコード補完タスクのみを実行する「集中型」Mellum とは異なり、Mellum2 は完全なインテリジェントなコーディングアシスタントとして位置付けられています。コードの生成と編集、外部ツールの呼び出し、複数ステップの「エージェント」ワークフローの実行、長時間の会話のサポート、および明示的な推論機能を備えています。開発者は、Apache 2.0 ライセンスに基づいて、ディレクティブ調整された基本モデルと「Think Edition」モデルを使用して、製品や内部ツールを構築する際にデータを完全に制御できます。

仕様の点では、Mellum2 は、第 1 世代の Mellum と比較して、複数の主要な指標に大きな変更があります。オリジナルの Mellum は高密度パラメータ設計を使用していましたが、Mellum2 は MoE アーキテクチャに切り替えられました。パラメータの総数は 40 億から 120 億に増加しましたが、アクティブなパラメータは 40 億から 25 億に減少しました。コンテキストウィンドウが 8192 トークンから 131072 トークンに大幅に増加し、長いドキュメントや複雑なエンジニアリングシナリオの処理により適したものになりました。どちらの世代のモデルも Apache 2.0 オープンソースライセンスを使用します。

JetBrains 社によると、Mellum2 は、複雑な AI ワークロードのルーティングとオーケストレーション、低遅延の検索拡張生成 (RAG) パイプラインの構築、大規模システム内のサブエージェントへの高速推論サポートの提供、ローカルまたはプライベート環境での AI の展開に特に適しています。コードや数学などの専門分野でのモデルのパフォーマンスをさらに向上させるために、チームは事前トレーニング段階で 3 段階のデータ「コース」を採用し、多様な Web データからより慎重に選別されたコードや数学のコンテンツに徐々に移行しました。

Mellum2 に加えて、JetBrains は製品ラインの調整も発表しました。同社は Python 開発者向けのデータサイエンス IDE、DataSpell のメンテナンスを停止します。公式情報によると、DataSpell は 5 月 28 日に正式に「廃止」され、関連するデータサイエンス機能は PyCharm プロフェッショナルバージョンに統合される予定です。既存のアクティブな DataSpell サブスクリプションは、2026 年 9 月 1 日に自動的に PyCharm Pro に変換されます。