集微網報道 (文 / 陳興華)英偉達最新一代 GPU 芯片 B100 即将亮相,除了多項核心性能升級,其散熱技術将從 " 風冷 " 轉爲 " 水冷 " 方案已成爲行業焦點。這不僅是風冷轉向液冷散熱技術的一個重要裏程碑,也将帶動整個散熱市場迎來全面革新,進而突破算力被散熱 " 卡脖子 " 的情況。
随着 AI 算力和功耗不斷迅速提升,業界主流觀點認爲,當單顆高算力芯片功率達到 1000W(瓦)時,現有散熱技術将會被革命,而液冷方案幾乎成爲必選項。這主要是因爲液冷散熱技術憑借其低能耗、高散熱、低噪聲等優勢,成爲兼具性價比和高效的溫控手段。
顯而易見,散熱技術行業的高景氣度,也傳導至國内 A 股市場相關上市公司的股市及業績表現上。近日,國内液冷概念股不僅表現強勢,獲國内多家機構密集調研,而且對未來預期增長信心十足。同時,國産超大規模算力液冷集群呼之欲出,将促使液冷服務器加速滲透。
轉向液冷技術是裏程碑
作爲 AI 芯片行業的年度盛會,英偉達 GTC 2024 即将于 3 月 18 日至 21 日在美國聖何塞會議中心舉辦。據報道,黃仁勳将在會上現身公布采用 Blackwell 架構的最新芯片 B100 GPU。B100 相較采用 Hopper 架構的 H 系列産品,整體效能均進行大幅提升,其 HBM 内存容量比 H200 芯片高出約 40%,AI 效能爲 H200 GPU 兩倍以上、H100 的四倍以上。
除了性能 " 例行 " 升級,B100 芯片的散熱解決方案也成爲焦點。
據悉,英偉達 B100 芯片的散熱技術将從此前的 " 風冷 " 升級爲 " 水冷 " 方案,而且未來所有 GPU 産品的散熱技術都将轉爲 " 液冷 "。英偉達 CEO 黃仁勳曾表示,堅信浸沒式液冷技術是未來方向,并将帶動整片散熱市場迎來全面革新。
對于英偉達此舉動機,國内散熱技術廠商廣州力及熱管理科技(NeoGene Tech)創始人陳振賢對集微網表示,B100 的功率達 1000W(瓦)時需要改爲液冷方案,因爲既有 H100(700W)的 3DVC 風冷散熱器已不堪負荷。" 這其中主要是熱阻值問題。目前,風冷的熱阻值約爲 0.05C/W,而由 H100 的 700W 增加到 B100 的 1000W,溫升就會增加 15 度。隻有降低熱阻值,才能控制芯片溫度在可接受的範圍。"
陳振賢稱,現在業界主要幾家散熱大廠都在開發采用風冷方案的 3D VC 散熱模組,加上風扇散熱能力可以達到六七百瓦,但弊端是體積太過龐大。比如目前英偉達 DGX H100 服務器搭載了 8 顆 H100 GPU,采用 3D VC 散熱模組,服務器爲 4U 尺寸。因此,對數據中心、高端運算而言,風冷 3D VC 散熱模組将隻是一個過渡性産品。
另外,散熱模組廠雙鴻董事長林育申曾指出,以往英特爾、AMD 等廠商會将芯片的散熱需求壓在 250-300 瓦。但 ChatGPT 帶動英偉達芯片需求暴增,散熱天花闆打開。H100 最大散熱設計功率(TDP)達 700 瓦,預計 2024Q1 量産的 AMD MI300,其 TDP 也達到 600 瓦。而英偉達的新一代 GPU B100,據傳 TDP 将高達 1000 瓦。
顯然,AI 芯片的算力和功耗正在不斷突破極值。在多位行業人士看來,當單顆高算力芯片功率達到 1000W 時,現有散熱技術将會被革命。陳振賢進一步指出,當高算力芯片跟功率挂鈎時,芯片功耗瓦數越來越高會使溫差越來越大,進而超過芯片外殼定義的溫度(通常不超過 85 度),這就是當前的散熱瓶頸所在,因而需要設計并制作出熱阻值更低的散熱器。
他還稱,黃仁勳所提及的浸沒式液冷技術,應該是指具有水冷闆的 " 自我漫冷式液冷服務器型式 ",而非一般的浸沒式液冷。" 水冷闆可以先将 GPU 的熱循環帶走,其餘的熱再藉由介電冷卻液循環帶走,這樣整個服務器的熱皆可帶離數據中心,而不用開冷氣。"
據了解,英偉達 B100 的液冷項目由代工廠英業達供應。英業達表示,今年 AI 服務器市場仍以英偉達産品爲主流,旗下 B100 産品将于第四季啓動量産。就服務器方面,英業達預估,自今年至未來二、三年内,都将有望每年保持雙位數百分比的增長,整體表現樂觀。
值得注意的是,也有業内人士指出,英偉達屆時也會先推出風冷版 B100,與現在的 H100 一樣功率是 700W,主要原因是爲了盡快将 B100 推向市場參與競争。
無論如何,在高散熱需求下,液冷成爲服務器溫控産業的未來發展方向。華爾街分析師 Hans Mosesmann 直言:" 液冷技術對于克服 AI 雲端運算挑戰非常關鍵,能爲超大規模雲端服務鋪路。" 陳振賢認爲,從今年下半年開始,風冷轉向液冷散熱技術将是一個重要裏程碑,芯片功率超過 700W 後就會加速液冷的發展步伐。
此外,還有行業分析稱,英偉達 B100 芯片的散熱技術升級,對整個 AI 服務器市場将是一場劃時代的技術革新,并将推動相關産業鏈的叠代發展。
未來,在芯片制程難以提升的情況下,效能功耗比難以進步,單卡功率将隻增不減。引領 AI 芯片的英偉達尚且如此,其他在自研 AI 芯片的谷歌、微軟以及國内廠商,想追趕英偉達需要比現在更強的功率以及更優的散熱,這會極大加劇市場對數據中心液冷的需求。
國内産業鏈獲強力拉升
多重迹象顯示,液冷散熱技術正在 AI 算力井噴之下正迎來重要發展契機,這主要是因其低能耗、高散熱、低噪聲等優勢,成爲兼具性價比和高效的溫控手段。
業内分析指出,早在 2022 年,英偉達曾推出過一個液冷版 A100,功率與非液冷版一緻,當時的考慮主要是綠色低碳。" 在單獨的測試中,Equinix(美國數據中心運營商)和英偉達均發現:采用液冷技術的數據中心工作負載可與風冷設施持平,同時消耗的能源減少了約 30%。英偉達估計,液冷數據中心的 PUE 可能達到 1.15,遠低于風冷的 PUE 1.6。
" 在空間相同的條件下,液冷數據中心可以實現雙倍的計算量。這是由于 A100 GPU 僅使用一個 PCIe 插槽,而風冷 A100 GPU 需使用兩個 PCIe 插槽。"
多年來,産業界一緻在探索散熱技術性能以及兼顧成本等的平衡點。财信證券表示,在數據中心發展的大型化、集約化的趨勢下,且液冷方案仍存在每年降本 5-10% 的空間,再考慮到液冷方案能夠有效延長服務器使用壽命,未來液冷數據中心總成本的優勢将更加明顯。
目前,作爲全球數據中心的重要陣地,中國正在大力推進散熱技術發展變革。IDC 預計,2022-2027 年,中國液冷服務器市場年複合增長率将達到 54.7%,2027 年市場規模将達到 89 億美元。而行業的高景氣度,正在傳導到 A 股市場相關上市公司的股市及業績表現上。
例如近日國内液冷概念股表現強勢。3 月 4 日,液冷服務器概念股集體爆發,英維克、佳力圖、科華數據、日海智能、英特科技等近 10 股漲停,歐陸通、強瑞技術、曙光華創、精研科技等跟漲。同時,近期機構密集調研液冷概念股,精研科技、潤澤科技三天内機構來訪接待量達 80 家以上。
另據數據統計,目前液冷服務器概念總計有 21 家公司公布了 2023 年業績預告,其中有 15 家年報淨利潤預增長上限超 50%。其中,飛龍股份 2023 年淨利潤預增長上限 233%,網宿科技預增上限 231%,暫居前兩位。雙傑電氣、精研科技、愛科賽博、歐陸通等 7 股 2023 年淨利潤預增上限均超過 100%,均顯示出較爲較勁的增長勢頭。
與此同時,國産超大規模算力液冷集群呼之欲出,液冷服務器将迎加速滲透。
據悉,中國電信已在上海規劃建設可支持萬億參數大模型訓練的智算中集群心。其中,單池新建國産算力達 10000 卡,是首個支持單池萬卡的國産超大規模算力液冷集群。同時,中國移動、中國聯通以及産業鏈企業也動作頻頻,促使液冷已成爲産業發展大趨勢。
民生證券表示,AI 産業快速發展,驅動液冷服務器滲透率逐步擡升。以往受限于數據中心建設面積及環保要求,傳統風冷難以滿足散熱需求,需要液冷技術提升服務器使用效率及穩定性。從發展趨勢來看,預計到 2025 年液冷服務器滲透率大約保持在 20%-30% 的水平。
在散熱技術産業鏈格局方面,陳振賢表示,目前全世界 90% 以上的散熱模組廠都集中在國内,包括熱導管、均溫闆、3D VC 散熱模組等等,其中很多是中國台灣地區的上市公司,但工廠基本都分布在大陸,可以說傳統的散熱模組産業已經比較成熟。
他還稱,在高算力芯片的影響下,散熱行業從風冷轉向水冷的過程中會對原有格局造成一些沖擊。這是因爲之前大大小小的散熱模組廠太多,受到沖擊再所難免。
無論如何,液冷技術的已逐漸顯露爲景氣行業。東方财富證券指出,未來幾年将進入液冷時代。從散熱性能角度來說,AI 的大規模發展帶動算力需求提升,芯片和服務器功率逐步升級,超出風冷散熱能力範疇,液冷将成爲智能數據中心的唯一解決方案。
但液冷也有多種業态,浙商證券的研報進一步稱,風冷散熱已趨于能力天花闆,機櫃功率超過 15kW 是風冷能力天花闆,液體導熱性能是空氣的 15-25 倍,升級液冷需求迫切。同時,散熱越來越貼近核心發熱源,預計将從房間級、機櫃級、服務器級向芯片級演進。