Loongson は国産の完全独立 CPU の代表として、LoongArch アーキテクチャに切り替えた後も主要なソフトウェア システムからの最適化を受け続けています。最近更新された GNU C ライブラリ glibc バージョンでは、パフォーマンスが大幅に向上しました。最近マージされたコードの中で、LoongArch アーキテクチャ用の特定の最適化が Git コード ベースに追加されました。この最適化により、LoongArch64 のデフォルトで Transparent Huge Pages (THP) で調整されたロード セグメントが有効になります。
最適化後、ELF 実行可能ファイルのロード セグメントを THP 境界に合わせることができるため、高速テーブル (TLB) への負荷が軽減され、命令取得の効率が向上し、大規模なバイナリ プログラムを実行する際に安定したパフォーマンスの向上がもたらされます。
最適化後のパフォーマンスの変化は何ですか? Rust で書かれた Cargo ツールを Loongson 3A6000 でコンパイルすると、テスト結果は、命令 TLB ミス率が 72% 大幅に低下したことを示しています。、CPU サイクルが 4.7% 削減され、実際の実行時間 (経過時間) が約 4.2% 節約されます。 LLVM を使用して Linux カーネルをコンパイルする場合、実稼働時間は約12%短縮されました。
したがって、このパッチによってもたらされるデフォルトの THP 調整ロード セグメント メカニズムにより、LoongArch アーキテクチャのパフォーマンスが大幅に向上します。
以前のニュースによると、現在のLoongsonはLoongson 6000シリーズに発展しており、デスクトップ版Loongson 3A/Bは4~8コア、サーバー版Loongson 3C6000シリーズは16~64コアのアーキテクチャとなっている。専用サーバーやコンピューティング サーバーなど、いくつかの典型的なアプリケーション シナリオは 2025 年に実装されています。ルンソン氏は、今年は大量販売を達成したいと述べた。
PC プレーヤー向けに、Loongson が昨年 Loongson B6600 と呼ばれる 8 コアのデスクトップ プロセッサを発表したことは注目に値します。 3A6000 と比較して、プロセスは変更されず、構造が最適化され、LA864 にアップグレードされています。LA664アーキテクチャのLoongson 3A6000と比較すると、同一周波数性能が約30%大幅に向上しています。
主要な周波数は依然として 2.5 GHz であると予想されますが、通常さらに 20% 増加できるシングルコア ターボ周波数テクノロジを習得し、3.0 GHz に到達するよう努めます。
Loongson 3B6600 のシングルコアおよびマルチコアのパフォーマンスは、i5 および i7 シリーズに匹敵し、当時市場で販売されていたデスクトップ CPU の 50% 以上を超える Intel 12/13 世代 Core のミッドエンドからハイエンドレベルに達すると報告されています。
