文 | 矽基研究室,作者 | 白嘉嘉
北京時間 3 月 19 日淩晨 4 點,黃仁勳身着标志性的黑色皮衣匆匆登台,拉開了本次英偉達 GTC 2024 大會序幕。
對黃仁勳來說,「超預期」是必須要在本次 GTC 實現的一項任務。過去一年時間裏,英偉達因爲賣水人的身份賺得盆滿缽滿,但接近壟斷的市場地位和頗具攻擊性的業務布局,也讓一些同行或客戶感到危險,紛紛開啓了自研芯片、扶持 AMD 等競争對手,以及打破 CUDA 生态等一系列計劃。
顯然,如果英偉達想要繼續坐穩 AI 時代的鐵王座,黃仁勳就需要用拿出具有統治力的新産品和新業務來證明這些挑戰的不堪一擊。
而對投資人而言,他們更關注的是本屆 GTC 能否繼續向 AI 概念裏注入新的想象力。雖然今天已經很少有人将 AI 視作泡沫,在科技巨頭的财報中 AI 也逐漸兌現業績,但它們已經漲上天的估值依舊讓人擔心,知名華爾街分析師木頭姐甚至将英偉達比作思科,預言它很快将股價腰斬并一蹶不振。
擔憂會成真嗎?從結果來看,憂喜參半。
喜的一面在于,黃仁勳描繪的 AI 藍圖仍有吸引力,從硬件向 AI 軟件乃至世界模拟器攀登,英偉達的野心大得讓人咂舌。
但市場似乎并不願意咬下這口大餅,盤後股價持續下跌,截止發稿,跌幅已達 1.77%。
"Hopper 很棒,但我們需要更大的 GPU。"
在本次 GTC 上,黃仁勳新推出的所有硬件産品,都圍繞 Blackwell 構架展開,包括獨立的 Blackwell GPU、GB200 Superchip、DGX SuperPOD。
Blackwell 的名稱來源于美國首位黑人院士 David Harold Blackwell,他創立的「Rao-Blackwell」定理是現代統計學的基礎性概念。
這款芯片也如它背後的象征那樣,承擔着在算力需求越來越旺盛的 AI 時代,成爲解釋、研究世界的基礎硬件的任務。
GB200 是 Blackwell 系列的第一款芯片,它擁有 2080 億個晶體管,采用定制的兩掩模版極限 4NP TSMC 工藝制造,可提高大量處理能力,每秒能進行 20Pflops 浮點運算。
與前一代芯片 H100 相比,「大」是 Blackwell 系列芯片最直觀的特點。
将 GB200 與 H100 放在一起對比,能明顯看到前者大了一圈。多出來的體積讓 Blackwell 系列芯片得以容納更多的晶體管,并帶來了更高的運算速度。
具體來說,GB200 的 2080 億晶體管數量是 H100 的 2.5 倍,浮點運算速度提升 5 倍,如果專門針對 LLM 推理,性能提升幅度将來到 30 倍。
"Hopper 很好,但我們需要更大的 GPU",爲了防止手中的 H100 感到自卑,黃仁勳專門停下演講安慰了它一會兒。
除了「大」之外,黃仁勳還列出了另外幾個使它脫穎而出的因素。
首先是第五代 NVLink,它能爲每個 GPU 提供 1.8TB/s 的雙向吞吐量,确保今天最複雜的 LLM 在 576 個 GPU 之間實現無縫高速通信。
其次,Blackwell 采用第二代 Transformer Engine(變壓器引擎)。Transformer Engine 配備了新的微張量縮放支持和先進的動态範圍管理算法,通過創新的 4 位浮 AI 推理功能使計算和模型大小加倍。
最後英偉達還引入了一些 AI 安全功能,包括包括機密計算功能和 RAS(可靠性、可用性和可服務性)引擎,以确保其數據中心 GPU 的正常運行時間最大化。
與此同時,雖然本次大會演講中黃仁勳沒有直說,但 GB200 NVL72 與用于推理用途的相同數量的 H100 Tensor Core 相比能耗減少 25 倍的數據,仍讓那句标志性的 " 買得越多,省得越多 " 呼之欲出。
和之前的 Hopper GPU 一樣,Blackwell GPU 将作爲獨立 GPU 提供,或者将兩個 Blackwell GPU 組合,并與英偉達的 Grace CPU 配對,搭建 GB200 Superchip。
除了 Blackwell 和 Grace Blackwell 芯片,英偉達還推出了采用了液冷的 DGX SuperPOD 超級計算機系統。
DGX SuperPOD 由 8 個或更多 GB200 組成,其中包括 36 個 GB200 Superchips,可以按需配置作爲單台計算機運行。英偉達表示,如果客戶需要拓展 SuperPOD,最高可以支持數萬個 GB200 Superchips。
硬件不是這屆 GTC 大會的全部,正如英偉達深度學習研究副總裁 Bryan Catanzaro 此前所表達的,雖然英偉達被稱爲硬件公司,但軟件形成的護城河同樣不容小觑。
" 很多人不知道這一點,但英偉達的軟件工程師比硬件工程師還多。" 他說。
這次 GTC 大會的後一個小時,黃仁勳幾乎把所有時間都花在了介紹 Omniverse 和 NIM 上。
簡單來說,前者是一個旨在開發、部署和管理 3D 應用程序的雲平台,該平台能夠構建數字孿生。
而後者,是英偉達爲了讓企業更方便地入駐 Omniverse 而推出的新服務——生成式 AI 微服務(NIM)。
通過這些微服務,企業可以在自己的平台上創建和部署自定義應用程序,同時保留對其知識産權的完全所有權和控制權。
Omniverse 和微服務(MIN)一同組成了英偉達打開機器人領域的鑰匙。黃仁勳在視頻中演示了一個人類與機器人協同合作的虛拟倉庫。雖然視頻中的工人看起來有些僵硬,但這幅關于未來工業如何運作的畫面,仍幫他拿到了西門子的訂單。
AI 的轉折點,來了?
如前文所說,無論是對英偉達自身,還是整個 AI 行業,本次 GTC 大會都扮演着關鍵角色。因此有 3 個問題至關重要:
首先是 Blackwell 系列芯片及軟件生态,能不能挽回那些起了異心的買家?
這個問題的答案是不确定的。
一方面,與市面上現有的 GPU 産品對比,GB200 展現出了足夠優越的性能。尤其是大模型訓練熱潮告一段落,AI 企業相繼進入商業落地階段後,眼下推理所占算力需求比重逐漸上升,雲廠商必定會大量采購 GB200。
目前,微軟和亞馬遜都已經宣布将與英偉達展開進一步的合作。
微軟 CEO 納德拉在一份聲明中表示:" 通過将 GB200 Grace Blackwell 處理器引入我們全球的數據中心,我們正在爲我們的雲優化英偉達 GPU 的悠久曆史奠定基礎,同時我們也爲世界各地的組織兌現了 AI 的承諾。"
亞馬遜 AWS 同樣宣布計劃爲尋求高級生成式 AI 功能的客戶提供 GB200 Grace Blackwell Superchip 和 B100 Tensor Core GPU。
但另一方面,受限于芯片鏈條長,擴産周期慢,Blackwell 系列芯片很有可能會和當初 H100 一樣受限于産能困境,同時新版本芯片和舊版本芯片形成替代,中國市場的疲軟,此消彼長下,英偉達能否持續保持高增長,無疑需要打上一個問号。
與此同時,即便芯片性能沒有英偉達優越,科技巨頭們自研芯片可能也是更劃算的方案。
此前,《财新》在一篇報道中透露,哪怕花英偉達同樣的成本,隻要做出十分之一的效果,這些科技廠商便已經有利可圖。更具體的案例是,按照谷歌的報價,使用其最新的 AI 芯片 TPUv5e 在訓練、推理參數少于 2000 億的大模型時,成本低于用 A100 或 H100。
整體來說,按照英偉達此前以數據中心爲主的業務結構,GB200 固然能帶來性能優勢,但短期來看對業績增幅可能有限。
那麽,本次 GTC 大會中究竟有沒有湧現出能繼續支撐英偉達業績高增的新場景?
從黃仁勳的演講來看,英偉達最理想的發展路徑,是從硬件公司升級成 AI 全鏈條服務公司。而生物領域則是他在這個方向上豎起的路标。
黃仁勳曾在多個場合表示生物領域将是未來的主導學科,本次演講中也花了大量時間來介紹英偉達軟件生态在這一領域的成就。
目前市面上湧現出了大量嘗試将 AI 與生物研究、制藥相結合的項目和企業,但大多停留在概念層面。
此前曾有美國普渡大學 AI 領域 PHD 向「矽基研究室」透露,Domain Adaptation(領域遷移)是目前擺在醫療 AI 面前最主要的難關之一。他舉例,以 X 光爲代表精密儀器在不同醫院、不同操作者手中形成的數據存在顯著差異,很難形成标準化,甚至同一個 Program 對于不同種族的診斷準确率差距也很大。
而英偉達目前的布局主要集中在有機物研究,分子建模領域,從理論到商業落地之間的距離更是遙遙無期。或許從價值投資的角度來看,這是一個确定性十足的領域,但置身眼下的 AI 熱潮,仍不夠「誘人」。
相比之下,人形機器人可能是更近的業績增量。黃仁勳像鋼鐵俠一樣站在一排人形機器人中央時,也确實在大會現場掀起了短暫的高潮。
但可惜的是,與日前火遍全網的 OpenAI、Figure 合作推出的 Figure 01 相比,來到 GTC 現場的機器人并沒有展現出讓人眼前一亮的能力,不由讓人懷疑這些機器人的智能化程度。
即便從量産的角度出發,與背靠汽車流水線的特斯拉相比,英偉達似乎也很難通過叠代芯片将人形機器人的價格推至市場化的門檻。
看上去,AI 時代的賣水人似乎和大多數 AI 企業一樣面臨着如何将 AI 商業化落地的困窘。不過這也很好理解,當市場從 AI 概念的狂熱中恢複冷靜,所有此前受益的玩家都要經受泡沫破裂的風險。
有了前兩個問題做鋪墊,第三個問題的答案已經呼之欲出。
英偉達在 GTC 上的新動作能不能給市場描繪出更有吸引力的 AI 故事?顯然大多數人并沒有因此更加興奮。
GTC 大會召開前,英偉達、谷歌、微軟、Meta 股價分别上漲 0.7%、4.44%、0.22%、2.66%,但大會召開後,盤後價格均出現了不同程度的下跌,其中英偉達下跌 1.77%。
顯然,即便在大洋彼岸,人們也不再被 AI 的問答、做圖、做視頻等功能所滿足,黃仁勳和其它科技巨頭一再宣傳的「世界模型」,隻有實實在在出現在現實世界,并且産生一些有意義的影響,才會有人繼續爲此買單。
但對身處 AI 行業的從業者來說,本屆 GTC 大會或許也給予它們一個啓示:加快步伐研究更先進的大模型,還是花更多時間來思考如何讓自己的産品落地。
兩種選擇都充滿風險,前者有可能因爲越來越難融資而失敗,後者則意味着有可能被叠代後更先進的大模型順手碾壓。
畢竟,這樣的事情不止發生過一次,也不會是最後一次。