英偉達的财報,再一次證明了其是這場 AI 浪潮中的 " 最大赢家 "。
北京時間 2 月 22 日,英偉達發布截至 2024 年 1 月 28 日的四季度業績報告。公司季度營收創紀錄,達到 221 億美元,遠超此前英偉達自己以及華爾街的預估,同比增長 265%。全年營收同樣創下新高,達到 609 億美元,同比增長 126%。對于未來,英偉達預計本季度營收将進一步走高至 240 億美元。
有意思的是,在英偉達公布财報的同一天,英特爾首屆 IFS 英特爾代工服務演講活動也如期召開了,OpenAI CEO 山姆 · 奧特曼(Sam Altman)也出席了活動。英特爾 CEO 帕特 · 基辛格(Pat Gelsinger)宣布,Intel Foundry Services 改名 Intel Foundry,目标在 2030 年成爲全球第二大半導體制造工廠。
OpenAI CEO 山姆 · 奧特曼(Sam Altman)
" 英偉達曾經是業界的邪惡博格人(《星際迷航》中半有機物半機械的生化人)," 追蹤半導體産業的 Futurum 研究公司 CEO 丹尼爾 · 紐曼(Daniel Newman)對《美國媒體》表示," 如今公司們正在走到一起,以确保英偉達不會變得更加強大。"
奧特曼的芯片野心不再是都市傳說,而這個野心标價 7 萬億美元,這個消息在本月被媒體披露,奧特曼本人也在社交媒體上表态。此外,本月還有另一則不同尋常的消息是,軟銀創始人孫正義正尋求高達 1000 億美元資金,計劃打造 AI 芯片巨頭,與軟銀旗下芯片設計公司 Arm 形成互補,抗衡英偉達。Meta 的第二代自研 AI 芯片 Artemis 今年将投産,應用于數據中心的推理任務。
英特爾及 Arm、OpenAI、Meta恰代表着半導體行業、AI 初創企業、科技巨頭三股勢力。接二連三的 " 大計劃 " 昭示着,各方在有朝一日終結英偉達 AI 領域 " 最強賣水人 " 地位上已經達成共識。或是分割蛋糕,或是擺脫依賴,三股勢力研發 AI 芯片的心,前所未有的堅定,對英偉達與 " 皮衣教主 " 黃仁勳的圍堵之勢也正式形成。
英偉達是 ChatGPT 掀起的 AI 浪潮中最大的赢家,其 GPU 是目前應用最廣的通用 AI 硬件計算平台。據富國銀行的統計,英偉達在 AI 芯片領域占據了 98% 的市場份額。英偉達數據中心業務已經取代遊戲業務,成爲其核心支柱。
更直觀的是英偉達飙升的市值。2022 年,英偉達本因 " 礦難 " 等因素股價連連下跌,市值一度跌至不足 3000 億美元,但在年底 ChatGPT 上線後,其股價一路上升。目前,英偉達的市值高達 1.7 萬億美元,并在本月一度超越亞馬遜、谷歌,短暫成爲美股第三大公司。
但 " 最強賣水人 " 也忙不過來了。整個 2023 年,AI 領域深受芯片短缺之苦。去年 7 月底,微軟甚至發出警告,稱如果無法獲得足夠的 AI 芯片,數據中心服務可能會中斷。同時,英偉達最新一代芯片 H100 一芯難求,在 eBay 上的價格甚至炒到了 4.5 萬美元一張。
與此同時,AI 對算力的需求還在持續膨脹。2024 年一開年,OpenAI 再次放出王炸産品 Sora,谷歌則發布了多模态通用模型 Gemini1.5,突破 100 萬個 tokens。算力,越發成爲當前大模型領域的一大核心瓶頸。
那個賣水人的門前排起長長的隊伍,有的顧客開始選擇自己帶水,有的對手已經起攤競争。圍堵黃仁勳成爲一種必然,但能否成功尚不可知——不斷推高的股價和飄紅的業績報告都在表明,英偉達更強了。
英偉達這次的業績報告,幾乎無懈可擊。
除了 2024 财年第四季度營收創新紀錄之外,以業務來看,其數據中心營收達到創紀錄的 184 億美元,同比增長 409%,去年同期該數字僅爲 36 億美元。遊戲業務營收 28 億美元,與上一季度持平,但同比增長 56%。此外,英偉達該季度淨利潤也表現亮眼,達到 123 億美元,同比增長 769%。
以全年來看,2024 财年(對應 2023 年 1 月後的一年),全年營收 609 億美元,同比增長 126%。
英偉達業績好并不意外,實際上市場本就期待其 " 遠超預期 "。高盛稱其是目前 " 地球上最重要的股票 ",财經博主 Fanancial Berg 在社交媒體上開玩笑:" 如果英偉達今天沒有超出盈利預期,地球會爆炸。" 公布财報前夕,英偉達甚至迎來了股價下跌,盤中跌幅一度達到 6.7%,收跌 4.35%。
黃仁勳
不過,英偉達頂住了壓力。财報發布後,其股價盤後一度漲超 10%。
" 加速計算和生成式人工智能已經達到了引爆點," 黃仁勳說," 全球各地的企業、行業和國家需求都在激增。"
英偉達表示,用于大語言模型和生成式人工智能應用訓練與推理的 Hopper GPU 出貨量增加,有益于數據中心業績上升,大型雲計算供應商占本季度數據中心收入的一半以上。
盡管供應鏈在改善,但其仍然難以滿足市場對英偉達芯片不斷飙升的需求。黃仁勳在電話會議上對分析師表示,在提高産量的同時,該公司無法在短期内 " 合理地 " 滿足市場需求。
" 增長面臨的最大問題是,供應仍将受到多大限制,以及随着時間的推移,需求會是什麽樣子。" 咨詢公司 Creative Strageties 的 CEO 本 · 巴賈林(Ben Bajarin)表示。
在英偉達飄紅的業績之外,各方對黃仁勳已經近乎形成 " 合圍 "。
在半導體公司中,英特爾和 AMD 早已吹響進攻号角。
AMD 已經在去年推出 MI300 AI 加速器系列産品,并聲稱其推理性能優于英偉達 H100。到了 2024 年,AMD 進一步将 AI 處理器的銷售預期提高 15 億美元,達到 35 億美元。一直在人工智能領域落後的英特爾也加快了腳步,去年舉辦 "AI 無處不在 " 發布會,宣布推出一系列新品,其中 Gaudi3 AI 加速器将在 2024 年上市。而最新的 " 英特爾代工服務 ",則是其作爲上遊企業深入 AI 芯片的新意圖。
進攻姿态是不加掩飾的。AMD CEO 蘇姿豐(Lisa Su)在去年 10 月接受采訪時表示:" 在市場發展如此之快時,我不相信有護城河的存在。" 英特爾 CEO 基辛格說得更加直白:" 整個行業都在被推動來減少 CUDA(英偉達推出的運算平台)的市場。"
孫正義的加入則有特别的意義。美國媒體披露,孫正義正在尋求 1000 億美元,創立一家 AI 芯片企業,旨在挑戰英偉達。該 AI 芯片項目暫定名爲 Izanagi,在日本神話中寓意創造與生命之神。
孫正義的意願很強烈。孫正義對人工智能已經關注多年,但遠景基金敗北、Arm 業績不佳,其一度隐居幕後。AI 浪潮讓其重燃信心,2023 年 6 月,孫正義重回台前,用 34 頁的 PPT 高調宣布軟銀開啓 " 進攻模式 ":" 現在該是換擋的時候了,人工智能革命的奇點即将到來。未來 10 年,人工智能會改變世界,軟銀要成爲人工智能領域的領導者,且軟銀已經準備了充足的彈藥。"
Arm 的定位在芯片行業中非常獨特,Arm 與英偉達并非橫向競争關系。英偉達、AMD、英特爾最終都是通過賣芯片賺錢,但 Arm 的收入來自 IP 授權。2020 年英偉達欲以 400 億美元收購 Arm,被定性爲 " 縱向收購 ",即産業鏈上下遊企業之間的并購行爲。
從目前的報道來看,孫正義下一步想做的和 Arm 的授權模式不同。背靠軟銀、以千億美元啓動、聚焦 AI 芯片。從縱到橫,和黃仁勳 " 哥倆好 " 的孫正義終于要與其坐下來掰手腕了。
孫正義
與此同時,初創芯片企業也十分活躍。The information 估計,全球目前有超過 18 家用于 AI 大模型訓練和推理的芯片設計初創公司,融資總額超過 60 億美元,企業整體估值共計超過 250 億美元,背後的投資方包括紅杉資本、OpenAI、字節跳動、五源資本等。
從 AMD、英特爾等吹響号角,到 Arm 背後的孫正義與軟銀加入戰局,初創企業摩拳擦掌,半導體行業添了許多變數。
那邊競争對手開始争當賣水人,這廂口渴的買水人也開始挖井取水——研發大模型的科技公司或開始或加快 AI 芯片自研的腳步。
在 ChatGPT 爆火之初,黃仁勳的超前眼光成爲佳話。一個廣爲流傳的故事是,2016 年,黃仁勳親自到訪 OpenAI 總部,将 " 全球第一台 AI 超算捐給了 OpenAI"。
全球第一台 AI 超算— DGX-1
研發 AI 大模型的科技企業和提供 " 燃料 " 的英偉達,原本是互相成就的合作關系。但如今,這種關系變得微妙起來。
科技巨頭因入局 AI 較早,又在資金和人才方面有優勢,對 AI 芯片的自研也早已開展。但随着 ChatGPT 後的 AI 浪潮,科技巨頭明顯加快了自研腳步。谷歌自 2016 年就推出了 AI 處理器,即張量處理單元 TPU,如今已經更新到第五代。亞馬遜向 AWS 客戶提供 AWS Trainium、AWS Inferentia 芯片,去年亞馬遜又最新發布了兩款 AI 芯片 Trainium2 和 Graviton4。Meta 自 2020 年就開始了自研芯片的設計,前不久,英國媒體報道稱 Meta 計劃今年就投産第二代自研 AI 芯片 Artemis。
就連一直在自研 AI 芯片上按兵不動的微軟也已經出擊。去年年底,微軟發布其首款用于雲端訓練和推理的 AI 芯片 Azure Maia 100,将首先支持微軟自己的 AI 應用程序。就在英偉達本次财報發布的兩天前,The Information 傳出消息,微軟正在開發一款新的網卡,入局 DPU(數據處理單元),其産品将類似于英偉達的 ConnectX-7 卡,可以提高 Maia AI 芯片的性能。
OpenAI 龐大的芯片野心,則是将 " 取代英偉達 " 寫在了臉上。OpenAI CEO 奧特曼想要自研芯片的消息已經流傳很久,2 月也得到了證實。奧特曼在 X(原推特)上表示:" 我們相信,世界需要的 AI 基礎設施——晶圓廠産能、能源、數據中心等——比人們目前計劃建造的還要多。"
據報道,奧特曼正在推動一個旨在提高全球芯片制造能力的項目,并在與包括阿聯酋政府在内的不同投資者進行談判。而這個項目的标價(奧特曼正在尋求的資金),高達 5 萬億至 7 萬億美元。
7 萬億美元也許不夠直觀:這個數字是 7 後面加 12 個 0;去年全球半導體芯片市場規模不過 5270 億美元。黃仁勳聽聞這個消息,笑稱 7 萬億足以買下 " 所有 GPU"。有人戲稱這個價格足以買下 4 個英偉達。
這個數字引發了輿論嘩然,如果說此前科技公司自研芯片還屬于自己挖點地下水的程度,那奧特曼則是想要做到建立一個新的全球輸水網絡。
芯片短缺,成本高築,是 " 圍堵黃仁勳 " 的原始動力。在英偉達業績飄紅,股價市值節節高的另一面,是科技公司痛恨的 " 英偉達依賴症 "。
據數據分析公司 Omdia 估計,英偉達在 2023 年第三季度僅憑其旗艦 H100 加速器,就售出了超過 50 萬個 GPU,其中微軟和 Meta 是其最大的客戶,分别購買了 30 萬和 15 萬個 H100 芯片。
初創企業則更 " 慘 ",A16Z 的投資人 Stephaie 稱,許多 AI 初創企業将其籌集的總資本的 80% 以上用于計算資源。
反過來以成本節約的角度看,SemiAnalysis 創始人 DylanPatel 估計,如果 Meta 自研 AI 芯片今年部署成功,預計每年可以省下數億美元的能源成本和數十億美元芯片采購成本。
而就目前來看,AI 熱潮沒有降溫的趨勢,算力需求依舊在膨脹。
2024 年剛到 2 月,谷歌發布的 Gemini 1.5,最高可支持 100 萬 token 的超長上下文。OpenAI 則公布了文本轉視頻産品 Sora,超高質量的演示視頻讓這款産品尚未公開測試就已引爆網絡。不論是 Sora 還是 Gemini1.5,都仍然遵循 Scaling Law 縮放定律,參數量擴大、模型性能提升,同時,對于推理端算力的需求也會進一步上升。相比于訓練端,這種需求的成本可能是 5 倍、10 倍甚至更高。
可以想見,在目前已經受制于算力限制的科技公司,對于未來大模型的發展若抱有樂觀預期,則解決 " 英偉達依賴症 " 也會愈發迫切。
但 " 自研芯片 " 并不是一條簡單的路,涉及芯片設計、制造、封裝、測試等多個環節,需要巨大的投入和長時間的試錯。
這是一場豪賭,而失敗而歸的案例時有發生。離我們比較近的 2023 年,OPPO 終止旗下已經投資上百億的芯片設計公司哲庫科技(ZEKU)的業務,星紀魅族傳出 " 終止自研 AR/VR 芯片業務 "。此外,Meta 也在去年傳出自研 AR 芯片遇阻、增加對高通的依賴的消息。
從設計到最終生産出産品,芯片的産業鏈冗長而複雜,想要生産出性能上乘的芯片需要集中細分領域的領頭企業。而目前,英偉達仍然手握供應鏈優勢。通過承諾不可取消的訂單,如上百億美元的采購承諾、産能義務和庫存義務,英偉達占據了台積電近六成産能和 SK 海力士、三星、美光 HBM 的大部分供應。而就連英偉達自己,其芯片短缺也主要受累于生産環節,主要涉及台積電的先進制程和封裝産能,特别是 CoWos 封裝。
這實際上也是奧特曼沒有将野心限制在 " 自研芯片 " 這個 " 小目标 " 上,而是着眼供應鏈搭建的原因。
此外,自研芯片需要人才支撐,而半導體行業的人才缺口遠遠無法滿足奧特曼們的野心。據德勤預測,2030 年全球半導體行業潛在勞動力缺口将達 100 萬人。
在積極部署自研芯片的背面,即便是積極部署自研 AI 芯片的科技巨頭,現階段也在擴大與英偉達的合作。Meta 宣布今年投産第二代自研 AI 芯片之前,還宣布了另一個消息:紮克伯格宣布要建立一個 " 大規模計算基礎設施 ",到 2024 年底将包括近 60 萬個 GPU 儲備,其中有 35 萬張英偉達 H100 顯卡,以售價保守估計這項支出就将高達 90 億美元。
亞馬遜也擴大了和英偉達的合作。2023 年 11 月,身着皮衣的黃仁勳現身亞馬遜雲科技 AWS 的 re:Invent 大會上,雙方宣布擴大戰略合作,正設計世界上最快 GPU 推動的雲 AI 超級計算機,配置超過 1.6 萬顆英偉達 GH200 超級芯片,以及構建更多基于英偉達芯片的雲實例等,提高生成式 AI、HPC 高性能計算性能。
與此同時,英偉達也在積極防守。
一手更快地推出新品,據 servethehome 披露的英偉達數據中心産品路線圖,英偉達将在未來兩年推出 12 款 GPU。
另一手則試圖縮短産品交付周期。台積電從 2023 年第二季度開始大規模擴增 CoWos 産能,這也是英偉達芯片生産的主要 " 卡點 "。近期,瑞銀(UBS)最新報告顯示,英偉達大幅縮短了 AI GPU 的交付周期,從去年底的 8~11 個月,縮短到了現在的 3~4 個月。
" 圍堵黃仁勳 " 之勢已經形成,但短期内,科技公司還難以擺脫 " 英偉達依賴症 "。那個賣水人隻是被圍住了,但攤位前長龍依舊。