【米サンノゼ発】「われわれは単なるGPUメーカーではなく、AIファウンドリーである」。米NVIDIA(エヌビディア)のジェンスン・フアンCEOはこう言い切った。米サンノゼで3月18~同21日(米国時間)に開催されたエヌビディアの年次イベント「GTC 2024」は、AIによって作曲された「I am AI」が流れるビデオで始まり、圧倒的なイノベーションとエコシステムのパワーが怒涛のごとく示された。現地での取材を通じ、時価総額2兆ドルを超える“AI工場”へと成長したエヌビディアが描くAIとコンピューティングの未来を検証する。
(取材・文/五味明子、編集/日高 彰)
生成コンピューター実現のため性能とソフトウェア環境を大幅進化
フアンCEOはここ1~2年、エヌビディアがフォーカスする分野として「アクセラレーテッドコンピューティング」と「生成AI(GenAI)」を挙げている。コンシューマーPCの世界でGPUによる高速なグラフィックス処理を実現し、企業として大きな飛躍を遂げたエヌビディアにとって、一部の処理をCPUから専用ハードウェアへ移すことで作業を大幅に高速化するアクセラレーテッドコンピューティングの考え方は会社の原点そのものであり、その適用範囲はPCだけでなく、データセンターやスーパーコンピューターへと広がりを見せている。
ジェンスン・フアン CEO
そして、アクセラレーテッドコンピューティングの恩恵を受けて発展し、エヌビディアを時価総額2兆ドルに押し上げた存在が、生成AIである。今回のGTC 2024では、生成AIに対するエヌビディアの他を圧倒する熱量が、具体的な製品リリースやパートナーシップとして表出した格好だ。
数多く行われたアナウンスの中で、ここでは生成AIに関連して特にエンタープライズにおいて重要と思われる二つのリリースの概要を紹介する。
生成AIのための新アーキテクチャー「Blackwell」
本紙4月1日号で報道した通り、GTC 2024における最大のアナウンスが、生成AIに特化した次世代GPUアーキテクチャー「Blackwell(ブラックウェル)」の発表だ。フアンCEOは「数兆パラメーターの未来に向けて設計した生成コンピューター」と表現していたが、現在世界中で争奪戦となっている現行のGPU製品「H100」に採用されている「Hopper」アーキテクチャーよりも、学習/推論で大幅なパフォーマンス向上を実現した。
GTC 2024最大の発表は、数兆パラメーターの規模にも対応する
新GPUアーキテクチャーの「Blackwell」とその搭載プラットフォーム。
2025年から提供を開始する
特に推論に関しては、「FP4」という低精度のデータ型をサポートすることで最大20ペタフロップスという性能を叩き出している。AIワークロードの課題であるエネルギー効率に関しても、「1.8兆のパラメータを90日間学習させた消費電力量は、従来の15MWからわずか4MWに削減」(フアンCEO)した。性能向上によって必要となるGPU数も削減できるので、エネルギー効率の向上と合わせてコスト効率は25倍もの改善が図られているという。
2基のBlackwell GPU(B200)と1基のGrace GPUを
一つのモジュールに配した「GB200」のモックアップ。
生成AI特化型インフラのベースとして今後多くの製品に搭載されることになる
基調講演では、Blackwellを実装したGPU製品「B200」および、2個のB200と1個の「GraceCPU」を組み合わせた「Grace Blackwell Superchip(AIスーパーチップ)」、さらにAIスーパーチップを主要コンポーネントとし、36個のCPUと72個のGPUを一つの水冷式ラックスケールソリューションとして設計した「GB200 NVL72」などのBlackwellファミリーも同時に発表されたが、これらの製品が実際に搭載されるのは2025年以降となる。もっとも、既に「Amazon Web Services」や「Microsoft Azure」といったハイパースケーラーのパブリッククラウドのほか、米Dell Technologies(デル・テクノロジーズ)、米Hewlett Packard Enterprise(ヒューレット・パッカードエンタープライズ)、ソフトバンク、富士通といったプラットフォーマーがBlackwellファミリーの採用を表明しており、現在も世界中で品薄が続くH100などと同様に、今後の生成AI市場のトレンドをけん引する存在となることは間違いない。
推論ワークロードを最適化する マイクロサービス「NIM」
フアンCEOが言う「未来に向けた生成コンピューター(generative computer)」をハードウェアとして支えるのがBlackwellなら、ソフトウェアとしてその進化を加速させ、エンタープライズでの普及を広げる存在として期待されるのが新たに発表された「NIM」だろう。NIMとは「NVIDIA Inference Microservice」の略で、文字通り推論ワークロードを最適化するために構築されたコンテナベースのマイクロサービスだ。NIMにはチューニング済みの推論エンジンや業界標準のAPI、業界・業務に特有のコード、カスタムモデルなどがまとめてコンテナ化されており、データセンター、クラウド、ローカルPCに至るまであらゆるITインフラ上にデプロイすることが可能となっている。
NIMは全世界で1億を超えるといわれる
CUDAの稼働環境上に構築されるので、
スケールしやすい点も特徴の一つ
既にヘルスケア業界など特定の領域に最適化された事前定義済みのNIMの提供を開始しているが、顧客が独自にモデルやAPIを追加するなどのカスタマイズももちろん可能だ。また、「ServiceNow」「Snowflake」「Box」などのエンタープライズ向けアブリケーションで、NIMを活用した顧客へのサービス提供やAIアプリケーション構築支援などが始まっていることを明らかにした。
NIMは「NVIDIA AI Enterprise 5.0」の機能として一般提供が開始されており、GPUコンピューティングプラットフォーム「CUDA」の上に構築されているため、エヌビディアの既存ユーザーであれば追加の設定などを行うことなく利用することが可能だ。AI開発者は日常的に利用する開発環境にデプロイされたマイクロサービスを活用して、業界に特化したAIアプリケーションを迅速に構築できる。また、自社の環境にモデルをデプロイできるため、ローカルのデータを動かす必要はなく、セキュアなデータを扱うRAG(検索拡張生成)アプリケーションなどでも有効なソリューションとなることが期待される。
フアンCEOは「近い将来、ソフトウェアと対話する方法はAIに話しかけるだけになる。つまりソフトウェアがAIになる。NIMはその未来に近づくためのアプローチであり、われわれは顧客が独自のNIMをカスタマイズできるよう支援していく」と語っており、NIMもまた「生成コンピューター」の実現に向けた重要なコンポーネントであることを強調している。
トレンドに沿った製品投下は単なる推論を超える第一歩
フアンCEOは基調講演で、Blackwellに加え、インターコネクト技術「NVLink」など関連する開発も含めると「3年の時間と2万5000人の開発者、100億ドルを投じた」と語っている。この莫大な投資は、同社が「未来は生成コンピューターが主流になる」ことを前提としていることが背景にある。実際、フアンCEOは基調講演やプレスセッションで何度も「BlackwellとNIMは生成コンピューターとして設計されている」と繰り返しており、エヌビディアはその実現に向けてシステムを構築し、それらを細分化して顧客に提供するアプローチを取っていることを強調する。
冒頭で紹介したフアンCEOの「われわれは単なるGPUメーカーではなく、AIファウンドリーである」というフレーズはまさにそのアプローチを集約した表現である。ハードウェア(GPU)もGPUコンピューティング向けソフトウェアの開発環境も、エヌビディアによるAIインフラの垂直統合が支配的な現在、企業がAIによる恩恵を迅速かつ確実に受けるにはエヌビディアの基盤を選ぶことが最も現実的な解となる。ゆえに、今回のGTCにおいても実に多くのテクノロジーベンダーがエヌビディアとの協業を発表した。4大ハイパースケーラーはもちろんのこと、主要なハードウェアベンダー、通信事業者、SaaS事業者、量子コンピューターベンチャー、ロボットメーカー、ヘルスケア企業など膨大な数の企業がエヌビディアとのパートナーシップを表明し、進んでリファレンスアーキテクチャーを提供している。したがって、垂直統合であっても顧客の選択肢は豊富に確保されている。
エヌビディアのエコシステム構築能力は驚異的で、新製品発表のたびに業界トップレベルのパートナーから必ずエンドースメントを獲得している。私見だが、少なくともあと数年は、AIのエコシステムはエヌビディアを中心に拡大が続くことはほぼ疑いないだろう。たとえAI業界で成熟化/標準化が進み、垂直統合に依存する必要がある程度下がったとしても、エヌビディアのインフラと無関係にイノベーションとエコシステム構築を実現できるAIプレイヤーが登場するとは考えにくいからだ。
最後に、“AI時代の寵児”となったフアンCEOが基調講演で発した「未来は生成される(The future is generative.)」の意味について少し触れておきたい。先述したBlackwellとNIMは、いずれも推論の分野で劇的な性能向上を実現している。機械学習においては特に低精度のデータモデルをサポートすることで推論のパフォーマンスを上げ、コストおよび商品電力の削減を図る動きが活発化しており、エヌビディアがそのトレンドに沿った製品を投下したことに不思議はない。
だがフアンCEOは「推論は推論でしかなく、生成とは違う。単なる推論を超えた、AIを生成するコンピューターをめざしてBlackwellは設計されている」と語る。高精細なゲームグラフィック生成のためのGPUベンダーとしてスタートしたエヌビディアはその後、AIの学習を強化するプロセッサー、さらに推論を強化するプロセッサーを世に送り出したが、「1周してAI生成プロセッサーを作ることにフォーカスする」(フアンCEO)企業への原点回帰を今回のGTCで改めて標榜した。
「われわれの製品を昔から使っているゲーマーならわかるだろうが、ゲームの世界では目に見える画像の全てをエヌビディアのGPUが生成していた。そして将来的には(ゲーム以外の)画像、ビデオ、テキストからたんぱく質、科学物質、運動制御や経路制御など、目に見えるもの全てがGPUで生成される。もちろん現在はそうではないが、だからこそチャンスは非常に大きい。未来は生成されるものだ」。推論を超えた、“生成する未来”に向けての第一歩がBlackwellだとすれば、フアンCEOのいう「生成コンピューター」は決して荒唐無稽な夢物語ではない。