供不應求,利潤受掣肘,如何破局?
英偉達看着供不應求的訂單,有點着急。
增加供應這句話,每發一次财報,英偉達都要再強調一次。
繼英偉達在第一季度宣布公司 " 正大幅增加供應,以滿足不斷增長的需求 " 後,英偉達 CEO 黃仁勳在近期又表示,正準備将其 GPU 的産量至少增加三倍。
具體來說,英偉達擴充的是 H100 芯片的産量。2023 年英偉達 H100 預計出貨量在 50 萬顆,但據英國《金融時報》報道,英偉達計劃明年出貨至少 150 萬顆 H100 處理器。
H100 是英偉達于 2022 年推出的一款專爲大型語言模型優化的 GPU,得益于 " 全民造模 " 的趨勢,推出至今長期賣斷貨,又被稱之爲英偉達的 " 印鈔機 "。
那麽,宣稱增加三倍産量的 H100,能爲英偉達賺多少錢?
01 産量受制于人
要想知道 H100 究竟有多賺錢,隻看兩點便可知。
一,H100 在芯片市場中擁有絕對統治力。 當今世界你第一時間想起的巨頭企業,都在搶購它。上到特斯拉、蘋果、微軟、谷歌等知名公司,下到研究大語言模型的初創企業,也有 Azure、GCP 和 AWS 等雲服務供應商(CSP),CoreWeave、Lambda 等大型私有雲。
二是 H100 擁有超過 90% 的毛利率。
H100 的物料成本主要有三部分:核心邏輯芯片、HBM 内存芯片、CoWoS 封裝。
H100 的核心邏輯芯片面積爲 814 平方毫米,采用台積電 4N 工藝制造(5nm+),以一塊報價爲 1.34 萬美元的 300mm 晶圓,結合良率、損耗來看,大概能切割 65 顆,平均算下來每顆單價 200 美元左右;HBM 内存芯片來自 SK 海力士的 HBM3 内存芯片,一共六顆,單顆容量爲 16GB,每 GB 爲 15 美元,合計 1500 美元;雖 CoWoS 沒有公布其價格,但據分析師 RobertCastellano 結合台積電财報推算,制造一顆 H100 需要 723 美元。
三大合計約 2500 美元(台積電拿走約 1000 美元的情況下),算上除此以外的成本約 3320 美元左右。
也就是說英偉達的毛利率超過 90%。
《巴倫周刊》資深撰稿人 tae kim 發帖估計 H100 的成本爲 3320 美元
但英偉達想賺錢,還得看台積電和 SK 海力士的臉色行事。
英偉達的 H100 确實在市場呈壟斷地位,說新一代 " 印鈔機 " 也無可厚非,但 H100 供不應求,在明年第一季度之前都是售罄狀态。
要看台積電臉色是因爲,英偉達受制于台積電先進的封裝技術— 2.5D CoWos(Chip on Wafer on Substrate)。
CoWoS 是一種 2.5D/3D 封裝技術,是将多個有源矽模闆集成在無源矽中介片上。然後将中介片和活性矽鏈接到包含 I/O 的包裝基闆上,将其連接到系統 PCB 上。
台積電 CoWoS-S 結構示意圖
CoWoS 能将不同制程的芯片封裝在一起,可達到加速運算但同時控制成本的目的。簡單來說,CoWoS 有節省空間、減少功耗的優勢
英偉達的 H100、A100 全部由台積電代工,并使用台積電的 CoWoS 先進封裝技術,除了英偉達外,其他廠商也對台積電的 CoWoS 有需求,爲此 CoWoS 産能供不應求。
有設備廠商估算,台積電 2023 年 CoWoS 總産能逾 12 萬片,2024 年将沖上 24 萬片,其中,英偉達将取得 14.4 萬 -15 萬片。
CoWoS 産能不足的背景下,依靠 CoWoS 封裝的 H100,自然被台積電扼住了咽喉。
HBM(高帶寬存儲)是限制英偉達 H100 生産的另一個重要瓶頸。
HBM 類似數據的 " 中轉站 ",就是将每一幀、每一幅圖像數據保存到幀緩存區域中,等候 GPU 調用。
相比傳統内存技術,HBM 帶寬更高、功率更低、功耗更低、尺寸更小,能夠使 AI 服務器的傳輸速率和數據處理量大幅提升,因此 HBM 也成了 AI 服務器的标配。
正如台積電壟斷了先進封裝一般,HBM 的供應也被 SK 海力士壟斷,市占率超過 95%,也是目前唯一量産 HBM3E(第三代 HBM)的廠商。
無論是 CoWoS 還是 HBM3,每年的産能都是固定的,除英偉達外,各大廠商需求也不少。AMD 不僅大量采用 HBM,其中 MI300 搭載的還是 HBM3;傳言谷歌在下半年推出的 TPU 張量處理器,也将搭載 HBM。
搭載 HBM 的芯片幾乎都需要像 CoWoS 這樣的 2.5D 技術,所以目前領先的 GPU 都有台積電打包在 CoWoS 上,也就是說芯片的産能進一步 SK 海力士和台積電的制約,英偉達并非說加芯就能加芯。
02 台積電沒有替代品
爲了不被捏住命門,也爲了芯片代工的議價權,英偉達開始 " 削藩 " 尋找更多代工廠。
英偉達在 CoWoS 封裝等的關鍵制程已開放給其他供應鏈代工廠。目前,英偉達正積極對接聯華電子,近日聯華電子将擴充旗下矽中介層(前段 CoW 部分)産能,月産能将由目前的 3 千片擴增至 1 萬片;封測廠 Amkor、日月光投控旗下矽品則負責後段 WoS 封裝。
某種意義上來說,英偉達構建的芯片帝國和台積電打造的頂尖芯片代工廠如出一轍——同樣擁有一騎絕塵的技術,是無可替代的存在。
所以扶持合作夥伴,并非短期有效解決措施,因爲英偉達的核心芯片、産量,還是離不開台積電的懷抱,否則英偉達今年由台積電代工的芯片,怎麽會占到台積電年出貨量的 40% 左右?
好比遠水救不了近火,擴産能這件事沒有快速捷徑。
一方面,建造周期較長,芯片從制作到包裝都是的整個生态系統都是在台積電周圍完成,如果另起爐竈,将制造業轉移尤爲艱難。
另一方面,台積電方也不會機會留給對手,對英偉達尋找替代工廠的暧昧态度,台積電以積極擴建産能做出了回應。
從營收結構來看,台積電也不會把嘴邊的肥肉放跑。2022 的 CoWoS 封裝已經占總收入 5% 以上,且将以每年近 20% 的速率增長。
台積電也是下了重金擴産,斥資 900 億元新台币在竹科銅鑼園區設立先進封裝廠,預計 2026 年底建廠完成,2027 年第三季開始量産,而位于日本熊本的工廠已建成,九月底預計将有 600 名來自台灣的員工移民熊本。
值得英偉達高興的是,至少在 HBM 上還有可選方案,不用等 CoWoS 的擴建周期。三星表示将投資 1 萬億韓元擴大 HBM 産能,并于今年推出 HBM3 産品;美光預計其相關 HBM 産品 " 将在 2024 财年貢獻有意義的收入,并在 2025 年貢獻大幅增加的收入 "。
但把台積電,看成英偉達的鐐铐,倒也不一定完全準确。
在硬币的另一面,産能短缺也絕非都是壞事,至少英偉達在全球缺芯的市場中,壟斷了市場,也讓自己的芯片單價水漲船高,售價 3.6 萬美元的 H100,此前在 Ebay 上的平均售價高達 4.5 萬美元。
要是沒有這場缺芯潮,芯片的二手市場怎會有如此高溢價,英偉達也沒有底氣開出如此高利潤的售價。
03 加不了量就加價
在産能制約下,英偉達損失了高達百億美元的收入。
據 GPU Utils,保守估計,H100 的供給缺口達到 43.2 萬張。按每個 GPU 價格 3.5 萬美元計算,意味着英偉達痛失總價值高達 150 億美元的訂單,這還不包括爲中國專供的 H800。爲了達到預期,英偉達采取的措施是推出更高端的芯片,提高收入和利潤。在産能有限的空間裏、市場普遍對英偉達預期樂觀的背景下,英偉達利用近乎壟斷的地位,讓廠商爲高端芯片買單,進而提高收入和利潤。
比如,英偉達正準備推出新一代 GH2000 Grace Hopper 超級芯片,将于 2024 年第二季投産。相比最熱門的 H100 芯片,該芯片内存容量高出 3.5 倍,帶寬高出 3 倍。
把英偉達曆代産品對比來看,就知道英偉達的利潤一直在水漲船高。從配置成本來看,H100 的前代産品 A100 的生産成本至少也要上千美金,售價 1 萬美元,而成本 3300 美元的 H100 如今售價高達 3.6 萬美元,利潤極有可能成倍數增長。
英偉達 A100 和 H100 配置對比
英偉達毛利率的提高也是證據。英偉達最近一個季度的毛利率爲 70.93%,對比去年的 43.48% 提升顯著。
至于英偉達的對手們,正在抓住那 43.2 萬張 H100 的缺口。AMD 就推出 MI300,對 A100 和 H100 發起挑戰。
但 AMD 的 MI300 和 A100 較量還好說,挑戰 H100 有點難,從搭載配置來看,MI300 搭載了 4 核 1.2GHz 處理器、Android5.1 系統、1GB 的 RAM 和 8GB 的 RAM,對比來看 H100 搭載了 4 核 1.4Ghz 處理器、Android8.1 系統、2GB 的 RAM 和 16GB 的 RAM。誰勝誰負高下立判,更别說 H100 T860 的 GPU。
至于英特爾,選擇了英偉達的弱勢出擊—在 H100 無法到達的地方,與其競争。
英特爾在中國市場推出第二代 AI 芯片 HabanaGaudi2。據悉,英特爾 Gaudi 2 國内首批将與百度智能雲、浪潮信息、美團、紫光新華三等公司合作。
促使英偉達做該項決策的可能是英偉達在中國日益減少的收入。2022 年,英偉達中國地區的收入從 71.11 億美元減少 13.26 億美元到 57.85 億美元。
無論未來芯片市場有何變局,未來如何,至少 AI 的風現在不會滅,英偉達也仍在芯片領域中叱咤風雲。
目前英偉達可能隻剩下甜蜜的煩惱:如何造更多的芯片,如何讓股價滿足分析師預期。
參考資料:
1、《英偉達 H100 加速卡物料成本僅 3000 美元,毛利率超 90%!》—— 芯智訊
2、《瘋狂的 H100》——矽基研習社
3、《誰卡了英偉達脖子》——遠川研究所
4、《Is CoWoS Capacity Causing a GPU Shortage》—— Phil Garrou.