英偉達推「萬億參數」GPU，繼續加速「AGI 時代」

文 | 極客公園 GeekPark

「瘋球了，徹底瘋球了！」

「這是什麽？泰勒 · 斯威夫特的演唱會嗎？」

當地時間 3 月 18 日中午，美國加州聖何塞 SAP 體育中心，超過萬人的冰球體育館内座無虛席。

這是 2024 年英偉達的 GTC 大會現場，人們等待的并不是 1 米 80 的白人女星，而是一位身穿皮衣的亞裔中年男性——英偉達創始人兼 CEO 黃仁勳。

15 個月内市值暴漲 6 倍至超過 2 萬億美元，成爲繼蘋果和微軟之後的全球第三大科技公司，并且仍然看不到增長的天花闆——是的，從某種意義上看，黃仁勳可能比斯威夫特更像一個「搖滾巨星」。

時隔 5 年再度回歸線下的 GTC，現場爆滿。開場，老黃打趣道：「你要意識到，這不是一場演唱會，而是一個開發者大會」。面對「粉絲」的熱情歡呼，黃仁勳也不禁用調侃作爲開場白。

很難想象能有一個會議容納如此多不同行業背景的人，從氣候技術到無線電科學、從機器人到自動駕駛、從 IT 業到非 IT 業。「坐在這個會場裏的你我他，代表世界上 100 萬億美元的行業」。

而把如此多行業和英偉達締結聯系的，正是 AI。以大語言模型爲核心的 AI 正在席卷幾乎所有行業，英偉達爲各行各業的 AI 變革提供算力引擎。

兩萬億美元市值如何「坐實」、如何用算力繼續推送新一波的 AI 浪潮、更重要的是，英偉達如何成爲「新計算時代」的王者？面對這些巨型問題，今年的這場 GTC 大會對于英偉達來說，尤其重要。

英偉達最新的 GPU 産品系列｜圖片來源：Nvidia

在長達 2 小時的開場演講中，黃仁勳介紹了當下爆火的 AI 背後，英偉達準備好的新引擎：新計算架構下的硬件、軟件、服務，點燃了一個加速生成式 AI 應用的新生态：

硬件上，新 Blackwell 架構 GPU 組成的 GB200「新核彈」，将提供 4 倍于 Hopper 的訓練性能，大模型參數達到了萬億級别。

軟件層面，NIM「數字盒子」，讓企業能更簡單的在英偉達平台上定制大模型；Omniverse 将機器人、無人駕駛和數字孿生的訓練和應用融合在一個平台之中。

從這次發布會，你可以看到英偉達一方面通過「新 AI 核彈」穩固自己「生成 AI 算力基建」的地位；另一方面通過 NIM、Omniverse 進一步擴大産業鏈下遊，力求将自己的客戶——大模型公司——逐漸管道化；同時利用 Thor+ Omniverse 成爲數字孿生、無人駕駛以及機器人等新興行業最重要的基礎平台。

在發布預測天氣的 Earth-2 模型時，黃仁勳背後出現了一張地球的衛星圖片。「他的野心一直都是整個地球，無論是物理的，還是虛拟的。」喜歡瞎猜的人，可能會寫下這樣的圖注。

01. Blackwell，專爲 Transformer 而生

過去10年，随着AI的代際發展，英偉達提供所需算力的速度也在加快。

現在，生成式 AI 時代，英偉達計算平台進入下一個周期—— Blackwell。這一新架構是繼兩年前推出的 Hopper 架構以來的全新架構。

黃仁勳在台上介紹新架構芯片的優勢時打趣道：「這是 Blackwell（左邊），這是 Hopper（右邊），Hopper 沒關系，你的表現也很好」。｜圖片來源：Nvidia

與之前的 Hopper GPU 一樣，Blackwell GPU 将作爲獨立 GPU 提供，或者兩個 Blackwell GPU 可以組合并與英偉達的 Grace CPU 配對，創建一個超級芯片 GB200。

GB200 同過去架構的 AI 芯片性能對比｜圖片來源：Nvidia

作爲一個超大規模的芯片，GB200 通過 900GB/s 超低功耗的片間互聯，将兩個 B200 GPU 與 Grace CPU 相連。

英偉達表示，該系統可以部署 27 萬億參數的模型。這甚至比最大的模型（例如 GPT-4）還要大得多，據報道 GPT-4 有 1.7 萬億個參數。

爲了實現超高的 AI 性能，搭載 GB200 的系統可與英偉達 Quantum-X800 InfiniBand 和 Spectrum-X800 以太網平台連接。這兩個平台均可提供速度高達 800Gb/s 的高性能網絡。

黃仁勳手捧兩種 Blackwell 架構解決方案說「我得小心點，這個值多少錢，100 億美元？當然第二塊就便宜了，50 億吧。」｜圖片來源：Nvidia

DGX GB200 的數據性能爆表｜圖片來源：Nvidia

Nvidia 還發布了 GB200 NVL72 液冷機架系統，其中包含 36 顆 GB200 Grace Blackwell Superchips。Nvidia 表示，與當前的 H100 GPU 相比，該系統的推理工作負載性能提高了 30 倍。

作爲英偉達在 AI 訓練和推理方面的新的頂級領導者，Blackwell GPU 和 GB200 超級芯片也将被引入雲平台 NVIDIA DGX B200 系統中，用以模型訓練、微調和推理。所有 NVIDIA DGX 平台均包含用于企業級開發和部署的 NVIDIA AI Enterprise 軟件。

亞馬遜，谷歌、微軟和甲骨文将通過雲服務出售 GB200 的訪問權限。

02. 定制大模型，更簡單

數據顯示，在這一波 AI 浪潮中，英偉達提供的 AI 算力可能達到了所有所需算力的 90% 甚至更高。而怎樣才能賣出更多算力？顯然是讓更多企業用上大模型。

企業想要使用大模型，通常需要進行微調和私有化部署，才能對自己的企業的業務有所助益。而在目前，通常通過部署模型的雲廠商或者小的服務商完成。

此次發布會上，英偉達則推出了自己的模型定制服務，Nvidia Inference Manager，簡稱 NIM，來實現有英偉達硬件的地方，就可以進行簡單的調試使用大模型。

黃仁勳講解 NIM ｜圖片來源：Nvidia

NIM 被形容爲一個數字盒子，在英偉達提供的網站下載即可使用。

盒子中包含幾個要件。首先是基礎大模型，有多種相關模型可供選擇，黃仁勳提到其中包括開源模型如 Llama，來自合作夥伴的模型，也包括英偉達自己創建的一些模型——例如英偉達剛剛在 GTC 公布了一個新的天氣預測模型。

按照英偉達的說法，它們都是根據英偉達硬件已經優化好的，無論你的硬件是筆記本電腦這樣隻有一塊 CPU 的，還是公司級别有多個 GPU 節點的，都可以直接使用。

第二是可以幫助用戶微調大模型的工具，這包含多項微服務。

比如，英偉達 2023 年 11 月宣布的 NVIDIA NeMo Retriever 技術，就被集成在整個的微服務中，可以幫助企業啓用 RAG 功能——簡單來說就是幫助企業更好地使用自己的專有數據。

黃仁勳在演講中舉例子道：隻下載了 Llama 2 模型時，他向 Llama2 提問公司獨有的編程語言方面的問題，Llama 2 無法很好地回答。而将公司的私有數據提供給大模型之後，大模型不但能回答出這個問題了，還能夠使用公司獨有的編程語言進行編程了。

學習過公司數據的大模型可以很好地幫助企業提高效率｜圖片來源：Nvidia

除了 RAG 增強，還有一系列的微服務可以幫助用戶使用大模型。包括 Lemo 檢索器，幫助信息的快速檢索，數字人的微服務，幫助用戶創建數字人等等。都包含在微服務中。

「未來我們将怎麽構築軟件？應該不是一行行地寫代碼。」黃仁勳講到，「很有可能是一個超級 AI 将任務分解，再交給一個一個的 NIM 去做。」

這樣的 NIM，則可以被安裝在任何英偉達硬件适配的地方。比如英偉達的 DGX 系統上，任何雲上、企業私有的數據中心、或者是個人的硬件上。黃仁勳直接在演講中說道：「我們是 AI 鑄造廠。」

這項微服務，現在開發者可以免費試用。而企業則需要在企業軟件訂閱中，之前有消息稱，每個 GPU 每年收取費用 4500 美元。

03.「現實 AI」：數字倉庫和機器人

在推進算力和算力的使用上，英偉達是認真的。英偉達在二十年前就做出了 CUDA，推崇加速計算，今日的碩果累累來自于二十年前種下的因。

黃仁勳開場時回顧二十年前，半開玩笑地講到：「當時我們已經算到了有今日。」

而黃仁勳看到的未來是什麽樣的呢？

在今天的 GTC 上，我們也小小地瞥見了一下黃仁勳眼中的未來：在世界的底層，是無限擴展的、不竭的算力，在中層，是數字孿生，是 simulation，是依靠算力帶來的對物理世界的無限精準的模仿，實驗和預測，而在上層，則是一個依靠算力達到最優解的世界——在這個世界裏，人與機器人共生。一切第一次發生的，都是發生過無數次的。

這其中，英偉達 2021 年開始推出的 Omniverse，就是中間層非常重要的工具。

Omniverse 是英偉達擅長的計算機圖形、人工智能、科技計算和物理模拟真正大一統的平台，能夠對環境實現 1:1 的數字孿生。

此次發布會，結合人工智能的浪潮，Omniverse 展現了許多新的應用可能。

Omniverse 可以爲現在最火的具身智能，提供一個訓練場所。英偉達表示，英偉達建立了 Isaac Lab，一款機器人學習應用程序，用于在 Omniverse Isaac 模拟器上進行訓練。通過新的計算編排服務，可以在基于物理的模拟中訓練機器人，并能零次訓練（zero-shot）遷移到實際環境。

機器人模型将使機器人能夠從少量人類演示中學習，從視頻中理解人類、在模拟中訓練模型，并最終直接部署到物理機器人上。

黃仁勳還在發布會上宣布了 Project GR00T 項目，GR00T 是一個用于人形機器人的通用基礎模型，基于 Jetson Thor（英偉達的一款 GPU）來開發生産機器人。

黃仁勳與人形機器人「站在一起」，其中部分機器人來自中國公司｜圖片來源：Nvidia

除此之外，英偉達還展示了一個數字倉庫的案例。

數字倉庫感知和規劃了人和機器人的路線｜圖片來源：Nvidia

視頻中，展示了一個一個 10 萬平方英尺倉庫的 Omniverse 模拟環境，它整合了運行視頻、Isaac 感知器堆棧的數字工人 AMR、來自 100 個模拟天花闆安裝攝像頭的整個倉庫的集中活動地圖等。

在視頻中，一個數字工人 AMR 的原定計劃的路線上，發生了一起事故，路徑受阻。英偉達 Metropolis 可以實時改變路徑規劃。通過基于生成式 AI 的 Metropolis 視覺基礎模型，操作員甚至可以使用自然語言提問發生了什麽事情。

在此次 GTC 上，英偉達宣布，将創建 Omniverse Cloud 的 api，而且将非常易用，企業可以更容易地使用 Omniverse，同時其中還将有 AI 的能力。比如可以直接用自然語言場景描述，創建仿真環境的 3D 圖像。

同時，英偉達宣布與 Vision Pro 達成合作，Omniverse Cloud 将能夠向 Vision Pro 串流。「從虛拟車上下來，穿過車門的感覺，非常奇怪，但也非常棒。」黃仁勳講到，「Vision Pro 将把你帶入 Omniverse Cloud，你能夠體驗到的工作流是無與倫比的。」

超過 1 萬人在現場觀看 Keynote，900 場以上的分享以及數百家展商，2024 年 GTC 被戲稱爲「AI 界的伍德斯托克」——除了蘋果公司，少有公司能讓科技變成一種人人想要「沾上邊」的時尚。畢竟，在「生成式 AI」代表未來的當下，每個人都想成爲那個跟上潮流的人。

英偉達無疑是那個潮流背後最大的推手之一，同時也是目前最大的受益方，它需要做的，是爲所有人提供更大的夢想，和更多的算力。順便，或許，成爲全球市值最高的公司，沒有之一。