本文來源:時代财經 作者:謝斯臨 實習生盧倩瑩
圖片來源:Pixabay
算力芯片的火,從 2023 年一直燃燒到 2024 年。
開年不久,英偉達 CEO 黃仁勳時隔四年到訪中國大陸,還穿上了東北大花襖與國内員工共舞,氣氛無比熱絡,似乎是在對自家芯片遇冷的傳言進行某種回應。
2023 年,英偉達的 AI 芯片成了科技界的硬通貨,一度一片難求,英偉達業績也水漲船高,其 2024 财年第三季度财報顯示,期内英偉達錄得營收 181.2 億美元,比去年同期增長 206%,遠高于市場預期的 162 億美元,創紀錄新高。
但近期,情況似乎發生了變化。據參考消息網,自去年 11 月以來,中國互聯網大廠就開始在測試英偉達 " 中國特供版 "AI 芯片樣品,結果并不理想——由于算力不足,相關公司已暗示英偉達,今年訂購的英偉達芯片數量将遠少于原計劃。
因此,黃仁勳在這個特殊時間節點突然到訪,引發了市場諸多猜測與遐想。有業内人士認爲,在國内廠商不願購買性能縮水的英偉達特供版芯片的情況下,黃仁勳來到中國大陸,很有可能是爲了穩住國内團隊和頭部客戶,并了解市場對英偉達産品的需求和反饋,以便進行相應的産品和策略調整。
對此,英偉達方面也回應媒體稱,黃仁勳的到訪并未涉及與政府官員的會面,也沒有重大的商業發布,最主要的目的是與中國員工 " 歡度美好時光 "。
" 這反映出我國相關産業在國際競争中的地位逐漸上升。" 深度科技研究院院長張孝榮向時代财經記者分析表示,在政策端的支持以及國内企業的不斷努力下,國内外芯片算力的差距已在不斷縮小,這給予了國内頭部大模型廠商轉投國産芯片的底氣,也爲英偉達敲響了警鍾。
H20" 遇冷 " 真相
2023 年 10 月,爲了繞過限制并滿足中國大陸市場需求,英偉達着手推出三款基于其 AI 芯片 H100 的 " 降級版 " 芯片:H20、L20 和 L2,并計劃在今年二季度量産。
然而這一針對中國市場研發的特供芯片未獲市場認可。性能上的不足,被普遍認爲是英偉達芯片遇冷的主要原因。
官方資料對比顯示,H20 爲三款芯片中性能最佳的一款,更适用于垂類模型的訓練、推理。H20 的内存高達 96GB,整數精度(INT8)算力爲 296TOPS;L20 則配有 48 GB 内存,整數精度(INT8)算力爲 239TFLOP;L2 配置爲 24GB 内存以及算力爲 193TFLOP。
然而即便是三款芯片中最強大的是 H20 芯片,其運算能力與 H100 相比還是大幅縮水。
半導體研究機構 Semianalysis 調研報告曾顯示,理論上 H20 整體算力比英偉達 H100 下降 80% 左右,但在大語言模型(LLM)推理方面的性能比 H100 快 20%,同時配置的 HBM3 顯存和 NVLink 互聯模塊增加了不小成本。
此外,多位業内人士向時代财經記者分析表示,性能表現不及預期,并非 H20 在華遇冷的唯一原因。
華芯金通半導體産業研究院院長吳全向時代财經記者指出,從 2023 年大模型爆火以來,國内一衆雲計算、大模型廠商就已經開始積極囤貨,大批量購買 A800、H800 等英偉達芯片,目前已部署的服務器總量尚能支撐市場需求,故而對 " 減量不減價 " 的 H20 興緻缺缺。
而前人工智能 NLP 企業首席科學家、千芯科技董事長陳巍進一步向時代财經記者透露,國内交易市場中還囤積有大量英偉達 GPU 芯片等待消化。這也給予國内大模型廠商一定的選擇餘地。
" 估計還有 20% 的存貨沒有出清。" 陳巍表示。
時代财經記者通過詢問小紅書、閑魚 APP 等線上渠道,以及線下走訪華強北芯片交易市場後發現,相比半年前囤貨惜售的場景,現在經銷商手中英偉達存貨普遍較多,側面印證了陳巍的說法。
多位賣家向時代财經記者透露,其目前擁有 A100 芯片現貨在 50 個以上,配置不同報價略有波動,單個售價集中在 12 萬到 18 萬元區間内,相較去年下半年價格維持穩定。也有賣家要求 50-100 個起售,交貨周期爲 1 個月,可在中國香港、日本、新加坡進行交易。
此外,陳巍強調,當下市場的觀望态度也與英偉達自身的動作息息相關。
除 H20 外,2023 年底,英偉達中國又在官網發布了定制的 GeForce RTX 4090 D。随後,又于今年 1 月初,推出了全新消費級顯卡 GeForce RTX 40 SUPER 系列,包括 RTX 4080 SUPER、RTX 4070 Ti SUPER 和 RTX 4070 SUPER 三款 GPU,均具備強勁的生成式 AI 性能。英偉達副總裁 Justin Walker 在發布會上強調,英偉達發布的新顯卡符合出口要求,可以提供給中國大陸消費者。
陳巍認爲,考慮到多數國内大模型廠商的發展趨勢是針對垂直領域開發數十億參數量級或百億參數量級的中小模型,而不是開發類似 GPT-3.5 175B 這樣的千億級大模型。因此對于雲計算和 IDC 廠商來說,4090D 等消費級顯卡在雲部署與推理計算上更具備性價比,H20 的吸引力進一步下降。
國産自研 AI 芯片加速
在爆出 H20 等 " 降級版 " 芯片在華遇冷的同時,參考消息網的相關報道稱," 短期來看,英偉達降級版芯片與中國本土芯片在性能上的差距不斷縮小,增強了中國自産芯片的吸引力。據知情人士稱,阿裏巴巴和騰訊正将一部分高性能 AI 芯片的訂單轉給本土企業,并更多地依賴内部自研芯片。中國另外兩大芯片買家字節跳動和百度也是如此。"
時代财經記者通過采訪以及公開資料梳理發現,目前國産 AI 芯片主要可以分爲三類:其一是大型科技企業自研的 AI 芯片,二是海光信息這類國資背景的科技公司,三是壁仞科技、天數智芯、摩爾線程、燧原科技、寒武紀等創業型芯片公司。
據晚點統計,上述芯片峰值算力大多相當于英偉達 A100 的 41% 到 82%。
從實際落地情況來看,絕大部分廠商仍處在商業化應用的早期階段,仍停留在具體場景下的應用。
目前,國内已有科技企業具備全棧 AI 軟硬産品,能夠真正大規模量産并投入業務使用。其研發的核心産品被普遍認爲是性能表現最接近英偉達的國産 AI 芯片。科大訊飛副總裁江濤曾在一次業績說明會上透露,該芯片的能力已經基本做到可對标英偉達 A100。
而據時代财經不完全統計,科大訊飛、百度、360、雲從科技、智譜 AI 等多家科技企業已在使用該芯片。
事實上,AI 芯片的算力比拼隻是第一步,對于國産廠商而言,接下來的生态構建又是新的挑戰。多位從業人士、分析師也一緻認爲,從配套生态、供應鏈等多個角度看,大模型廠商依舊難以徹底擺脫對英偉達 GPU 的依賴。
這不是一家國内廠商的難題。一位 AI 芯片設計相關的從業者向時代财經記者表示,英偉達于 2006 年發布的 CUDA 平台早已成爲應用最爲廣泛的 AI 開發生态系統,這導緻開發者難以脫離英偉達芯片,進行生成式 AI 的研發以及訓練。
" 從這個維度看,幾乎沒有芯片公司可以撼動英偉達的統治地位。" 上述從業者說。
還有上市 AI 企業高管向時代财經記者透露,目前,國産芯片價格基本與英偉達産品一緻,且産能出貨也難達預期。" 隻有成爲生态合作夥伴,才能勉強保證供應。"
" 隻要漸進就是一個好的趨勢 "
對國内大模型廠商而言,增加國産 AI 芯片比重仍是必然之舉。
" 保供已經成爲一項關鍵的問題。一方面,美國很有可能會采取各種手段保證自身在人工智能領域的優勢;另一方面,全球局勢也可能會影響供應鏈的穩定。基于這樣的預期,市場需要盡早尋得新的方案,這将成爲國産 AI 芯片發展的機會。" 陳巍認爲。
爲抓住這一機會,一衆國産 AI 芯片廠商都在重點發力,拓展市場。據寒武紀向時代财經記者提供的資料,旗下思元芯片近期接連宣布與百川智能、智象未來等廠商旗下大模型完成全面适配。
" 生态構建是目标,芯片隻是基礎,更重要的是在芯片之上構建函括架構平台、軟件工具、操作系統和應用場景等一系列生态體系。英偉達起步早,國産廠商需要快速追趕。" 吳全向時代财經記者分析道。
國際數據公司(IDC)披露數據顯示,2023 年上半年,中國加速芯片的市場規模超過 50 萬張。在陳巍看來,這是一個能夠讓那個國産市場份額拉升的機會。" 隻要漸進就是一個好的趨勢。AI 芯片要在實際應用中才能夠發現問題、加快叠代。我們一般認爲,市場份額占比超過 15% 之後,生态建設才能真正跑起來。"
吳全形象地将國産 AI 芯片的發展比喻爲樹木的成長," 目前我們隻是種下了一顆小小的樹苗,完成了最基本的培育工作。國内企業仍需在技術創新、人才培養、産業鏈完善等方面付出更多努力。"