国内大型モデルはここ1週間で頻繁にバージョンアップが行われている。 GLM-5.1 と MiniMax 2.7 のオープンソースに続いて、Dark Side of the Moon の Kim K2.6 コードプレビューも利用可能です。これは、AI プログラミング用に特別に最適化された数兆個のパラメーターを備えた大規模なモデルです。公式ウェブサイトには、すでにオンラインになっていると記載されています。ただし、この大型モデルを体験するには、月額 39 元からの KIMI コードで利用できる KIMI の会員プランが必要です。

ただし、K2.6 コード プレビューの大型モデルは比較的控えめです。前回の内部ベータ版はあまり宣伝されませんでした。過去 2 日間にリリースされたときだけ、誰かがそれについて言及しているのを見ました。キミの当局者はそれを大々的に宣伝しなかった。公式ウェブサイトでも、この大型モデルの具体的なアップグレードはまだ見られません。

内部ベータ版のフィードバックやインターネット上で人々が参加した紹介から判断すると、K2.6 コード プレビューは、数兆のパラメータを持つ大規模モデルである K 2.5 に基づいて改良されています。主な最適化は依然として AI プログラミングです。 K 2.5 の SWE-Bench Verified リストのスコアは 76.8%、LiveCodeBench は 85% です。

K2.6 コードプレビューの改善の方向性は、主に推論の深さ、エージェント計画の品質、および複数ステップのツール呼び出しの信頼性です。一部の内部テスターは、思考の連鎖が Opus のスタイルを持っていると言いました (これは非常に奥深いです)。

具体的なレベルについては、独自のプログラミング能力評価を行った大物Versun氏がいる。K2.6 コード プレビューのスコアは 89 で、K 2.5 のスコア 83 より 6 ポイント高くなります。しかし、これまでのトップ選手たちとの差はまだある。

常に宣伝資料で Opus 4.6 に追いつくか超えると述べている他のメーカーと比較して、K2.6 コード プレビューの一部のネチズンは現在、Sonnet 4.6 レベルと評価しており、これも非常に強力です。

使用したネチズンからのレビューは依然として良好です。指示に従う能力も悪くないし、能力も高い。今度は Kimi のコーディング プラン パッケージと組み合わせることで、少なくとも AI プログラミングのための強力でコスト効率の高いオプションを提供します。