
圖片來源:視覺中國
藍鲸新聞 3 月 19 日訊(記者 朱俊熹)在 DeepSeek 引發市場對 GPU 需求的擔憂後,英偉達創始人兼首席執行官黃仁勳總是會抓住各種亮相機會大談其 AI 暢想,希望提振投資者對英偉達的信心。這次的舞台是 3 月 17 日起在美國加州舉辦的英偉達 GTC 大會。随着近年來英偉達在 AI 浪潮中地位的不斷提升,GTC 大會也從原先單純的開發者活動成爲全球矚目的科技盛會。
當地時間 3 月 18 日,黃仁勳在主題演講中将今年的 GTC 描述爲 "AI 的超級碗 "。他表示,唯一的區别是,每個人都能在這場超級碗中獲勝," 每個人都是赢家 "。AI 能夠爲更多行業和公司解決問題,因此每年都有更多的人前來加入。
AI 芯片路線圖的更新依然是本屆 GTC 的重頭戲,但英偉達的野心已不僅于此。它劍指 AI 時代基礎設施層的大一統,布局橫跨軟、硬件,希望爲更多企業提供以英偉達爲核心的數據中心解決方案。
正如黃仁勳在演講中提到的,AI 始于雲端,雲數據中心的基礎設施爲 AI 的騰飛提供了環境。今年以來,英偉達已向美國四大雲巨頭出貨 360 萬塊 Blackwell 芯片。但 AI 不會局限在雲端,它将無處不在。事實上,英偉達正在構建三類 AI 基礎設施:面向雲端的、面向企業的、面向機器人的。

圖片來源:英偉達
推理将成未來十年核心工作負載
DeepSeek 爆火并一度重創英偉達股價後,黃仁勳多次公開回應稱,投資者對 DeepSeek 取得的進展存在誤解。它不代表 AI 公司不再需要任何計算,相反推理模型仍然依賴于大量的計算資源。
在 GTC 演講中,黃仁勳再度直言道," 在過去一年裏,幾乎全世界在這個問題上都犯了錯誤。AI 的計算需求及其擴展定律實際上更具韌性,甚至呈現出超加速的趨勢。由于代理型 AI(Agentic AI)和推理能力的發展,目前所需的計算量輕松達到了去年同期我們以爲所需的 100 倍。"
對于這一論點,他給出了更詳細的闡釋。黃仁勳表示,具備推理能力的 AI 會對問題進行逐步拆解,并以各種不同方式得出最佳答案,而不是一次性地随意給出一個結果。模型變得更加複雜,生成的 token 數量顯著增加了 10 倍。爲了保證模型的響應速度、使其具備交互性,避免用戶在等待思考的過程中失去耐心,計算速度也得提高 10 倍。" 因此,最終所需的計算量輕松達到原來的 100 倍。"
另一家芯片巨頭 AMD 也在釋放類似的态度。3 月 18 日,AMD 董事會主席兼 CEO 蘇姿豐亮相在北京舉辦的 AMD AI PC 創新峰會。她在發言中表示,AMD 最新發布的 Ryzen AI Max 處理器能夠高效運行推理模型,以期解決更複雜的問題、實現更深入的理解以及更自然的交互。蘇姿豐稱,"AMD 的軟件開發人員一直專注于優化 DeepSeek,每隔幾天就能看到性能的提升,這充分說明了推理技術還處于非常早期的階段。"
在黃仁勳看來,随着人工智能的擴展,推理将成爲未來十年最重要的工作負載之一。他認爲很多人忽視了推理背後的計算問題:一方面,想讓 AI 生成更多的 token,使其更智能;另一方面,又要平衡回答問題的時間,以防用戶因等待過長而離開。黃仁勳将新時代的計算機視作 AI 工廠,是 token 的生成器。這個工廠必須以極高的效率和性能運作,因爲一切都将直接影響 AI 服務質量、收入和盈利能力。
芯片路線圖再更新,卻帶不動股價
黃仁勳有套經典的計算理論,即在 AI 和加速計算領域," 買得越多,省得越多 ",因爲采用英偉達的技術能夠幫助企業節省成本。當推理成爲模型進化的新範式,黃仁勳又在最新演講中添上了後半句," 現在甚至更好,買得越多,賺得越多 "。
以此次預告将在今年下半年推出的下一代 Blackwell Ultra 芯片爲例,英偉達明确表示該系列産品是爲了 AI 推理時代鋪平道路。據其介紹,集成了 Blackwell Ultra 的 GB300 服務器在運行 DeepSeek-R1 模型時,每秒可以處理 1000 個 tokens,而使用 Hopper 芯片的前一代服務器每秒僅能處理 100 個 tokens。由于 Blackwell Ultra 單位時間内能夠生成更多内容,這讓 AI 工廠的收入機會也增加了 50 倍。

在 GTC 大會上,黃仁勳還披露了更多未來幾代 GPU 的性能細節。其中,以暗物質發現先驅、天文學家命名的 Vera Rubin 芯片将在 2026 年下半年發布。Vera Rubin 由名爲 Vera 的 CPU 和名爲 Rubin 的 GPU 組成,而 Rubin 又是由兩塊 GPU 組成的單獨 GPU。當和 Vera 搭配使用時,Rubin 可以在運行模型時處理每秒 50 千萬億次浮點運算,比當前 Blackwell 芯片每秒 20 千萬億次浮點運算的速度要高出 1.5 倍。
根據英偉達路線圖,2027 年下半年将繼續推出下一代 Vera Rubin Ultra 芯片。該芯片實際将包含兩個連接在一起的 Rubin GPU,性能翻倍提升至每秒 100 千萬億次浮點運算。黃仁勳還首次公開了 Vera Rubin 之後的下一代架構 Feynman,計劃将在 2028 年面世,但未給出關于 Feynman 的更多技術細節。

爲了進一步證明在後 DeepSeek 的推理模型時代,英偉達也将占據領先地位,在 GTC 上還釋出了一款開源的推理服務軟件 Dynamo。黃仁勳表示,這個名字象征着工業革命時代的 " 發電機 ",希望在推理成爲 AI 主流的背景下,該軟件能用最低的成本和最高的效率加速 AI 推理模型,爲部署此類模型的 AI 工廠最大程度地創造收入。英偉達舉例稱,在 GB200 上運行 DeepSeek 推理模型時,Dynamo 可以幫助将每個 GPU 生成的 token 數量提高 30 倍。
然而,受累于對關稅、經濟衰退等不利因素的擔憂,黃仁勳近兩小時的暢談還是沒能挽回投資者的信心。英偉達當日股票收報 115.43 美元 / 股,較前一日下跌 3.43%。今年以來,該股已累跌 16.54%。
這樣的市場反應或許也在黃仁勳的意料之中。他在演講中介紹芯片路線圖時提到,大家的常見反應都是," 嗯好的,接下來呢?" 他強調,對 AI 基礎設施的建設不像買一台筆記本電腦那樣,這涉及到土地、電力、資本支出、工程團隊,需要多年的規劃和布局。因此會對外公布英偉達在未來兩三年内的路線圖,而不是突然發布給市場一個驚喜。