JetBrains は最近、ソフトウェア エンジニアリング システム用の次世代機械学習モデルである Mellum2 が正式にオープンソース化されたと発表しました。これは、同社が 2025 年に最初の Mellum モデルをオープンソース化してから 1 年余りのことです。当時、Mellum はコード補完に重点を置いた小規模なモデルで、パラメーター サイズは約 40 億でした。それに比べて、Mellum2 のパラメータの総数は 120 億個に拡大しました。ただし、JetBrains は、疎な専門家混合 (MoE) アーキテクチャを採用することで、各トークンが実際に関与するのは約 25 億のアクティブなパラメーターのみであるため、標準ハードウェアでも高速な推論速度を維持できることを強調しています。

エディター内でコード補完タスクのみを実行する「集中型」Mellum とは異なり、Mellum2 は完全なインテリジェントなコーディング アシスタントとして位置付けられています。コードの生成と編集、外部ツールの呼び出し、複数ステップの「エージェント」ワークフローの実行、長時間の会話のサポート、および明示的な推論機能を備えています。開発者は、Apache 2.0 ライセンスに基づいて、ディレクティブ調整された基本モデルと「Think Edition」モデルを使用して、製品や内部ツールを構築する際にデータを完全に制御できます。

仕様の点では、Mellum2 は、第 1 世代の Mellum と比較して、複数の主要な指標に大きな変更があります。オリジナルの Mellum は高密度パラメータ設計を使用していましたが、Mellum2 は MoE アーキテクチャに切り替えられました。パラメータの総数は 40 億から 120 億に増加しましたが、アクティブなパラメータは 40 億から 25 億に減少しました。コンテキスト ウィンドウが 8192 トークンから 131072 トークンに大幅に増加し、長いドキュメントや複雑なエンジニアリング シナリオの処理により適したものになりました。どちらの世代のモデルも Apache 2.0 オープンソース ライセンスを使用します。

JetBrains 社によると、Mellum2 は、複雑な AI ワークロードのルーティングとオーケストレーション、低遅延の検索拡張生成 (RAG) パイプラインの構築、大規模システム内のサブエージェントへの高速推論サポートの提供、ローカルまたはプライベート環境での AI の展開に特に適しています。コードや数学などの専門分野でのモデルのパフォーマンスをさらに向上させるために、チームは事前トレーニング段階で 3 段階のデータ「コース」を採用し、多様な Web データからより慎重に選別されたコードや数学のコンテンツに徐々に移行しました。

Mellum2 に加えて、JetBrains は製品ラインの調整も発表しました。同社は Python 開発者向けのデータ サイエンス IDE、DataSpell のメンテナンスを停止します。公式情報によると、DataSpell は 5 月 28 日に正式に「廃止」され、関連するデータ サイエンス機能は PyCharm プロフェッショナル バージョンに統合される予定です。既存のアクティブな DataSpell サブスクリプションは、2026 年 9 月 1 日に自動的に PyCharm Pro に変換されます。