" 黃仁勳定律 " 尚需跨過政策、數據、安全幾道門檻
作者/ IT 時報記者 範昕茹
編輯/ 王昕 孫妍
3 月 23 日,在英偉達的 GTC 大會上,英偉達 CEO 黃仁勳借由 ChatGPT 的成功向世界展示了一個無限寬廣的 AI 未來圖景。在這個宏大場景之下,AI 不再是虛幻不可見的東西。它在芯片生産、醫療、文化創作等各個領域發揮着巨大的作用,給世界帶來天翻地覆的變化。
AI 終于從幻影中走出,迎來了清晰的商業化之路,黃仁勳将之稱爲 "AI 的 iPhone 時刻 "。
2022 年,在新一代顯卡的發布會上,黃仁勳直言 " 摩爾定律已死 ",往後的芯片性能不會再遵循這個定律。而借由 "AI 的 iPhone 時刻來臨 " 的口号,黃仁勳向世界宣告了 " 黃仁勳定律 " 的到來。
" 黃仁勳定律 " 誕生
CuLitho 計算光刻技術軟件庫是英偉達與全球最大晶圓代工廠台積電、全球最大光刻機巨頭阿斯麥、全球最大 EDA 巨頭新思科技合作,秘密研發近四年的 " 核彈 "。
根據黃仁勳的表述,CuLitho 在 GPU 上運行時,可以将計算光刻加速 40 倍以上,爲 2nm 及更先進的工藝奠定基礎。他舉例,NVIDIA H100 生産需要 89 塊掩膜闆,在 CPU 上運行時,處理單個掩膜闆需要 4 萬個 CPU 系統才能完成工作,如果在 GPU 上運行 CuLitho,這個過程隻需要 8 小時。與此同時,CuLitho 還能助力降低耗電以及對環境的影響,将功率從 35MW 降至 5MW。
在短期内,使用 CuLitho 的晶圓廠每天的光掩模産量可增加 3~5 倍,而耗電量可以比當前配置降低 9 倍。原本需要兩周時間才能完成的光掩模現在可以在一夜之間完成。
随着光刻技術臨近物理極限,這項技術通過加速計算光刻流程,将有助于晶圓廠縮短原型周期時間、提高産量、減少碳排放,爲 2nm 及更先進的工藝奠定基礎,并使得曲線掩模、high NA EUV、亞原子級光刻膠模型等新技術節點所需的新型解決方案和創新技術成爲可能。
對英偉達而言,CuLitho 展示了英偉達進入芯片制造生産銷售全鏈路的野心。黃仁勳定律的核心在于利用 GPU 芯片算力大幅度提升芯片制造效率,以此來加速摩爾定律削減帶來的生産瓶頸。
對英偉達而言,當它同時介入芯片的生産和銷售環節,成爲其中的一部分,CuLitho 将給芯片産業帶來巨大的變化:AI 芯片的生産環節本身也成爲 AI 芯片消費的一部分。GPU 芯片将成爲芯片行業主要的流通貨币。
當然,這一切發生的前提是 "AI 的 iPhone 時刻 " 真的已經到來。
算力卡了大模型脖子
在 GTC 大會上,黃仁勳對軟硬件市場空間做過一個回應。在他看來,人工智能軟件是一個比硬件大得多的市場,而硬件的銷售機會主要來自基礎設施服務市場。也就是說,GPU 芯片的市場多大,取決于 AI 軟件的商用程度。
如今,AI 大模型公司不得不面臨的一個主要困境——算力。每一個 AI 大模型背後,都需要巨量算力的支撐。爲了支撐 OpenAI 訓練出 ChatGPT,微軟專門爲 OpenAI 打造了一台由數萬個 A100 GPU 組成的 AI 超級計算機。TrendForce 研究推測,以 A100 的算力爲基礎,GPT-3.5 大模型需要高達 2 萬枚 GPU,未來商業化後可能需要超過 3 萬枚。
集之互動 CEO 陸文斌告訴《IT 時報》記者,1 年半前,其所在公司采購了 50 多塊 A100 芯片,用于高精度數字人的研發。在數字孿生的應用場景中,一位醫生可以隻需錄制 20 分鍾左右的視頻,便可以 " 孿生 " 爲一個數字人。之後,隻要輸入相應的數據,便可以由 " 孿生人 " 自己演講、互動或者授課,期間,無論是文字轉換爲語音,還是互動式的 NLP(自然語言處理),亦或是數字人逼真的面部拟人化,每個環節都需要消耗巨量的算力," 精度越高,需要投入的算力越多,需要的資金也越多 "。
圖源:pixabay
陸文斌以最簡單的 " 數字人說話 " 場景舉例,通常而言,人類的唇部大約有近千個神經元,這些神經元相互連接作用,當人開口講話時,每個字形成的唇形都不相同。他們公司制作的數字人,在其唇部部署了 300 個神經元,這在國内已經是相當高水平的精度,但要想做得更逼真,唯有投入更多的算力渲染。
這還隻是在研發端的算力消耗,商用化的道路上,終端成了落地的絆腳石。在強大算力的支撐下,高精度數字人可以進行流暢的表情演示,但目前市面上高性能的筆記本電腦卻難以支撐超高模數字人的流暢演示,更不用說手機。
更讓陸文斌擔心的是,此前購置第一批英偉達 A100 芯片時,限售令還沒頒布。第二批入手在限令之後,價錢已上漲了 50%。從公司的業務發展速度來看,加上芯片損耗,他擔心,可能 2~3 年後便買不起芯片了,也無更多算力可用。
但 ChatGPT 的成功,正吸引一批企業投身 AI 大模型市場。百度的 " 文心一言 " 已經上線;騰訊總裁劉熾平表示會持續優化混元 AI 大模型;字節跳動則傳出了前達摩院大模型 M6 帶頭人入職,并參與語言生成大模型研發的消息。創新工場 CEO 李開複、前搜狗 CEO 王小川、原美團聯合創始人王慧文、前京東 AI 掌門人周伯文、出門問問創始人李志飛、阿裏技術副總裁賈揚清,這些聲名赫赫的業界大佬,都紛紛入局大模型市場。
當大廠入局,企業對算力的争奪将更加激烈。而目前在 AI 芯片領域,英偉達舉着望遠鏡也看不到敵人。對國内企業來說,如果一直無法找到合适的替代方案,未來算力從何而來?
最近,陸文斌的數字人公司正在與國内 GPGPU 芯片廠商合作調試,以便當更大的 " 黑天鵝 " 來臨時,可以提前防範部分風險," 我們也在提前做一些研發布局,包括是否可以在低配置的硬件設備上,利用軟件跑出更好的效果。也很希望能和更多國内芯片、智能硬件廠商合作,盡量降低算力‘卡脖子’對國産人工智能産業的影響 "。
算力跨境,數據落地
針對中小企業算力缺失的問題,英偉達也給出了自己的答案—— DGX Cloud 算力平台。DGX Cloud 背後是 DGX(AI 超級計算機)的算力能力。通過這個平台,企業無須購買硬件,可以通過網頁浏覽的方式獲取高性能算力,享受到和 Open AI 同樣的算力引擎,擴展多節點 AI 訓練。企業可以通過月租的方式獲取算力,每月租金 36999 美元。可以說,DGX Cloud 雲平台降低了用戶使用算力的門檻。
然而,跨過了使用門檻,即便雲能力可以跨境,但數據不行。随着各個國家對數據管控的加強,跨境數據傳輸也成爲雲平台跨境運營的壁壘。美國《國家安全戰略報告》将數據安全作爲維護國家安全的核心戰略要素,強調要保持美國在網絡空間和數據資源上的優勢。歐盟的《數字化單一市場戰略》中也指出,歐盟将采取 " 内松外緊 " 的數據跨境流動管理思路。2022 年 9 月 1 日,我國《數據出境安全評估辦法》正式施行,對涉及個人信息的跨境數據傳輸進行管控。
互聯網企業跨境運營面臨的數據安全壓力也日漸凸顯。在數據安全的壓力下,蘋果将數據中心交由 " 雲上貴州 " 托管,将國内數據存放在我國本土。字節跳動旗下的 TikTok 則不斷面臨着來自美國的政策壓力。3 月 23 日,字節跳動海外短視頻平台 TikTok CEO 周受資參加主題爲 "TikTok:國會如何保護美國數據隐私,保護兒童免受網絡傷害 " 的美國衆議院能源與商務委員會聽證會。
這意味着,DGX Cloud 想要商用,勢必要将數據中心本土化。目前,英偉達對此采取的策略是與雲廠商合作,采用托管的形式進行。黃仁勳表示,未來中國也可以采用這項服務,中國創業公司可以期待阿裏、百度、騰訊提供的底層算力服務,但在算力需求急速增長的現在,服務得以開展的時間和定價都還很難判斷。
作爲軟件端的 ChatGPT 其實也面臨着同樣的數據風險。即便如今 ChatGPT 被接入微軟 Office 全家桶,其能力也讓 C 端用戶大爲震驚,但對企業用戶而言,由于其生産力的獲取需要通過數據的投喂進行,騰訊、阿裏等企業已經明令禁止員工向其投喂數據,ChatGPT 的商業化之路仍模糊難辨。
人工智能面臨政策拷問
除開數據帶來的安全隐患,"AI 的 iPhone 時刻 " 還将因相關政策監管而推遲到來。
自人工智能誕生以來,治理問題就一直是全球監管機構關注的熱點。歐盟正着手準備創建一個新的監管部門來負責 AI 的治理,以應對 ChatGPT 這類人工智能可能帶來的挑戰。
英國正在計劃如何分配監管機構管理人工智能的職責。英國政府 3 月 29 日發布了一項計劃,将不會專門成立一個負責人工智能技術監管的部門,并将避免可能扼殺創新的嚴厲立法,而是會根據安全、透明、公平和問責制等廣泛原則采取适應性強的監管方法。而國内針對 ChatGPT 這類人工智能治理相關的讨論也在業内不斷增加。
不僅如此,人工智能大模型帶來的風險已經引發了多位科技領袖的深切擔憂。近日,OpenAI 的共同發起人伊隆 · 馬斯克和一群人工智能專家及行業高管在一封最新發布的公開信中呼籲,在未來六個月暫停對 GPT 模型的訓練,以免該模型變得更加強大,從而對社會和人類造成潛在風險。這封公開信如今已經獲得 1000 多人署名,呼籲在 GPT 進一步強大之前,需要首先就此類大模型達成由獨立專家開發、實施并審核的共享安全協議。
當英偉達用 " 黃仁勳定律 " 迎接一個屬于 GPU 的時代來臨時,"AI 的 iPhone 時刻 " 或許将首先面臨政策、數據、安全的拷問,而唯有邁過這些門檻,"AI 的 iPhone 時刻 " 或才終将來臨。
排版/ 季嘉穎
圖片/ 英偉達 pixabay
來源/《IT 時報》公衆号 vittimes
E N D
大家都在看
請加「星标」不錯過我們