Nvidia はどのようにして赤字ビジネスから 1000% の利益を生み出す企業になったのでしょうか?

2023 年 6 月 13 日、NVIDIA の時価総額は 1 兆ドルのマークを超え、Apple、Microsoft、Alphabet、Amazon に次いで 2 位となり、米国で 5 番目に大きな時価総額企業になりました。第 2 四半期における NVIDIA のデータセンター事業収益は 100 億米ドルを超え、これは Intel と AMD の収益を合わせたものよりも高かった。

購入ページにアクセスしてください:

JD.com NVIDIA シリーズ製品概要

GPU チップは、世界的な巨人間のスーパーコンピューティングや大規模モデルのトレーニングの戦いで重要な役割を果たしており、世界の GPU 市場シェアの 80% を支配する Nvidia は多額の利益を上げています。しかし、この独占市場シェアは一夜にして築かれる「城壁」ではありません。

Tractica のデータによると、世界の AI ハードウェア市場の収益は 2025 年までに 2,349 億米ドルに達すると予想されており、そのうち GPU の収益は 23.2% を占めます。

NVIDIA は GPU 市場に堀を築いており、CUDA はその重要な部分を占めています。

完全なコンパイラエコシステム

AMD が ATI を買収し、Intel がまだ世界最大のチップメーカーであった 2006 年に、NVIDIA は、NVIDIA が開発した並列コンピューティングプラットフォームおよびプログラミングモデルである CUDA (Compute Unified Device Architecture) を立ち上げました。

AI マスターの Andrew Ng 氏は、CUDA の重要性について簡単にコメントしました。「CUDA が登場する前は、GPU を使ってプログラミングできる人はおそらく世界中で 100 人以下でした。CUDA の登場により、GPU の使用は非常に簡単になりました。」

ほとんどの CUDA 推奨者は、CUDA の完全なコンパイラエコシステムがハイパフォーマンスコンピューティングの分野における NVIDIA GPU の成功の鍵であると信じています。

具体的には、CUDA には、導入の容易さ、柔軟な開発インターフェイス、プログラミング言語の適応、完全なツールとコードライブラリという利点があり、Windows、Linux、MacOS などの複数のオペレーティングシステムと互換性があります。

CUDAの発展により、GPUは単なるグラフィックプロセッサではなくなり、その適用対象はゲーム制作者から科学者、エンジニア、アーティストへと変化しました。

継続的な反復により、CUDA は AI またはニューラルネットワーク深層学習の分野で多数のアクセラレーションライブラリを立ち上げ、CUDA のソフトウェアおよびハードウェアエコシステムを形成しました。

David Rosenthal は、CUDA コードライブラリが最適化され、開発者がこれらのライブラリを呼び出してプログラムを開発するのがより便利になったと Acquired.FM で紹介しました。そのため、CUDA には膨大なコミュニティリソースがあり、登録開発者の数は 2023 年 5 月には 400 万人に増加します。

CUDAエコシステムに100億ドル以上投資

NVIDIA は CUDA でトレーニングチップ市場をほぼ独占しており、業界には CUDA エコシステムに破壊的な影響を与えた大手企業はほとんどありません。

NVIDIA は 10 年以上にわたって CUDA エコシステムへの道を切り開いてきました。

2007 年、Nvidia の GPU 研究開発テクノロジーはすでに強い地位を占めていました。翌年、Intel の主要顧客である Apple は、MacBook を CPU に加えて Nvidia の Tesla アーキテクチャ GPU に直接置き換えました。

レポートによると、長年にわたる Nvidia の CUDA への投資総額は 100 億米ドルを超えています。

Huang Renxun 氏の商用化の検討の下では、CUDA エコシステムは潜在的な開発者を育成し、プログラマーや企業に歓迎されるテクノロジープラットフォームになる必要があります。

2006 年に CUDA を発表した後、NVIDIA の最初の戦略は「ソフトウェア開発者」をターゲットにし、開発者が CUDA プラットフォームの使用に慣れるように多額の投資を行いました。

初期の開発者コミュニティには、プログラミング言語と共有メモリレベルの両方での CUDA の並列処理によりプログラミングが簡素化され、学部生が CUDA を使用して大規模な高性能コンピューティングプログラムを作成できるようになったという格言がありました。

対象範囲を拡大するために、NVIDIA は大学の教室に CUDA を導入し、イリノイ大学などの大学と協力して関数ライブラリを改善しました。 2010 年には 250 の大学が CUDA 教育コースを開設しており、関連する論文は数千件ありました。これに基づいてエコシステムを改善するために、NVIDIA は研究センター、教育センター、認定プログラムを設立しました。 2015 年までに 800 の大学が関連コースを開発しました。

業界の観点から見ると、NVIDIA はインセプションプログラム (スタートアップアクセラレーションプログラム) に投資しており、スタートアップ企業が CUDA を使用してプロジェクトの基礎を築くことを可能にしています。

現在までに 100 社を超えるスタートアップが CUDA を活用しています。さらに、NVIDIA は、Cub や NCCL などの一般的なシナリオ向けの開発ライブラリをオープンソース化し、メーカーが使用するミドルウェアのパフォーマンスを最適化する基本ライブラリを提供し、エコシステムを再び拡大しました。

したがって、多くの開発者が CUDA に依存しており、その強力なコア機能により消費者市場で好まれています。

2012 年に、ImageNet コンペティションで優勝した AlexNet が発表されてから、CUDA はバージョン 5.0 にバージョンアップされ、ダイナミックライブラリと GPU ポインタをサポートしました。

OpenAIが設立された2016年にはすでにCUDA8.0で半精度浮動小数点数とテンソルコアがサポートされており、ソフトウェアエコシステムはよく知られており、学者や業界関係者が相互に推奨し合っていた。

2022 年末には、ChatGPT のリリースにより、生成 AI が人々の目に届くことになります。 CUDA12.0 は、新しい NVIDIA Hopper および NVIDIA Ada Lovelace アーキテクチャ機能をサポートし、すべての GPU に追加のプログラミングモデルの機能強化を提供します。

大型モデルの人気がさまざまな企業に広がるまでに、NVIDIA は業界での差別化を深め、市場参加者にとって買い物かごの最初の選択肢となりました。

現在までに、100 万個を超える CUDA ベースの GPU が販売されています。

数ある GPU チップメーカーの中で、なぜ NVIDIA だけが CUDA 開発環境なのでしょうか?

赤字ビジネスから1000%利益へ

今世紀初頭の Nvidia と Microsoft、ATI、AMD、Intel の 5 つの巨人との混戦を振り返ると、Nvidia はグラフィックス処理市場で徐々に優位性を獲得していきました。

2006 年 7 月、AMD は 54 億米ドルのプレミアムで ATI を買収し、チップ市場を再編しました。同年、Nvidia の主任科学者である David Kirk は、3D レンダリングの主要なタスクから脱却し、一般的なコンピューティングタスクを探求する「GPU テクノロジの汎用化」というアイデアを提案しました。

この考え方がCUDAです。当時、この高価で労力のかかるテクノロジーを積極的に引き受けたのは Nvidia でした。

いくつかの大手チップ企業の中で、GPU R&D は、かつてのライバルである AMD が ATI を買収し、Intel が自社開発の GPU 計画を中止したことで弱い立場に陥っています。 NVIDIA は GPU テクノロジーにおいて巨人を置き去りにしました。

17 年前、CUDA の開発は時期尚早の決断でした。 NVIDIA の CUDA の進化は順風満帆ではなく、Huang Renxun 氏は「アクセラレーテッドコンピューティング」が未来であると主張しました。

Nvidia と Intel は、2006 年の秋に新しい CUDA ベースの GPU、G80GPU を共同開発しました。両者の協力は長くは続かず、CUDA の研究開発に関する決定により、Nvidia は長期的に多額の資金を投資する必要があります。

製品特性上、ハードウェア製品にCUDAロジック回路を追加すると、チップの放熱要件が増大し、コスト上昇や故障増加のリスクも伴います。

財務報告書の業績から判断すると、CUDA は赤字企業でもあり、2008 年の金融危機の前後でそれがより顕著になりました。

最も困難な時期であっても、Hinton 教授が AI モデルをトレーニングして AlexNet を作成するために CPU の代わりに GPU を使用するチームを率いた 2012 年まで、Huang Renxun 氏は CUDA を中断しませんでした。

2020 年、Huang Renxun 氏は Barron's Weekly のインタビューで、「NVIDIA は人工知能の次なる大爆発を推進するだろう」と強調しました。

過去 5 年間、Nvidia は人工知能を歓迎するために 3 つのことを行ってきました。

まず、2019 年 3 月に、Nvidia はハイパフォーマンスコンピューティングインターコネクトテクノロジー企業である Mellanox を 69 億米ドルで買収しました。同社の主力製品である InfiniBand は、より高速で帯域幅が広く、データを送信する効果的な方法であると考えられており、Mellanox は InfiniBand 仕様の唯一のプロバイダーです。

第二に、NVIDIA は、大規模な GPU クラスター調整用に特別に設計された、NVIDIA の完全統合ソリューションである新世代 AI チップ「DriveThor」を 2022 年 9 月にリリースします。

第三に、NVIDIA は、アクセラレーテッドコンピューティングと生成 AI 向けに特別に設計された Hopper アーキテクチャを発表しました。 H100 は、このアーキテクチャに基づいた GPU です。市場関係者によると、H100 は最大 1,000% の利益率を誇る Nvidia の製品で、出荷量は 900 トンを超えています。

ChatGPTのリリースにより、AIサーバーの出荷台数と価格が増加し、NVIDIAのGPUチップの価格が高騰しました。 NVIDIAのDGXH100の総額は8GPU+4NVSwitch基板などを含めて26万8495ドルで、1台当たりの粗利益率は19万ドル近くとなる。

NVIDIA の財務収益は目覚ましいものです。過去 3 会計年度の年平均成長率 (CAGR) は 35.2% に達し、2023 年の収益は 51.4% 増の 408 億米ドルに達すると予想されていると報告されています。

CUDAによって構築された障壁は打ち破ることができるでしょうか?

2016 年、AMD は、NVIDIA の CUDA システムに似た、オープンソースプロジェクトに基づく GPU エコシステムである ROCm を立ち上げました。ただし、ROCm テクノロジーは遅れており、Windows プラットフォームでの発売は 2023 年 4 月になります。参入時期が遅いため、AMD 開発者の数は Nvidia よりもはるかに少ないです。 Github では 32,600 人を超える開発者が CUDA パッケージリポジトリに貢献していますが、ROCm の開発者は 600 人未満です。

NVIDIA は世界の GPU 市場シェアの約 80% を占めており、販売台数では唯一の企業です。

NVIDIA の独占市場における優位性はいつまで続くのでしょうか?

この問題に対して、SemiAnaracy のチーフアナリスト、Dylan Patel 氏は次のように意見を述べました。PyTorch がより多くの GPU メーカーをサポートするにつれ、OpenAI の Triton が状況を混乱させることと相まって、NVIDIA の鋭いツール CUDA は徐々に優位性を失いつつあります。

ソフトウェアエコシステムの観点から見ると、CUDA の優位性は実際にあらゆる関係者から攻撃を受けています。

近年、AI開発フレームワークPyTorchは、その柔軟なEager Modeの利用率により、徐々にTensorFlowを上回ってきました。 PyTorch 2.0 バージョンでは、AMD、Intel、Tesla、Google などの GPU とアクセラレータがサポートおよび改善されます。

OpenAIは、CUDAよりも操作の難易度が低い「CUDAの簡易版：Triton」を直接発売しました。

2023 年の第 1 四半期に、AMD は ROCm システムが PyTorch 2.0 フレームワークに統合され、TensorFlow および Caffe 深層学習フレームワークも第 5 世代 ROCm に加わったと発表しました。 6 月にリリースされた同社の次世代データセンターアクセラレーションプロセッサ (APU) ADMMI300 は、ソフトウェアの面で NVIDIA の CUDA エコシステムと完全に互換性があり、人工知能業界における NVIDIA の立場に挑戦する機会があると業界では考えられています。

それにもかかわらず、コンピューティング能力の観点から見ると、NVIDIA H100 のアップグレードされた製品 DGXGH200 は、大規模 AI の主要なボトルネックを解決し、豊富な資金と高いパフォーマンス要件を持つ潜在的な顧客に適しています。短期的には、CUDA エコシステムは安定したままであり、トレーニングチップを必要とするほとんどのユーザーは依然として NVIDIA を選択するでしょう。