AI 熱潮,算力概念乘風而上。近日," 我國算力總規模全球第二 " 的話題熱度不斷飙升。
工信部 4 月 11 日公布的數據顯示,截至去年底,我國算力總規模達到 180 百億億次浮點運算 / 秒,存力總規模超過 1000EB ( 1 萬億 GB ) 。國家樞紐節點間的網絡單向時延降低到 20 毫秒以内,算力核心産業規模達到 1.8 萬億元。中國信息通信研究院測算,算力每投入 1 元,将帶動 3 至 4 元的 GDP 經濟增長。
不過,上述數據中的 " 算力 " 隻是一個籠統的算力概念,實際上根據不同應用領域分類,算力可以被分爲基礎算力、智能算力和超算算力。在産業數字化進程中,各行業轉型升級需要大量且不同類型的算力支撐,這其中超算憑借強大的計算性能,在尖端科學領域,比如行星模拟、藥物分子設計、基因分析、高端制造等等,逐漸成爲最優解。
超算被熟知,很大程度上與超算越來越 " 普惠 " 的市場化進展有關。钛媒體 App 了解到,與以往服務于高精尖科研項目的尖端超算不同,如今,超算逐漸演化出通用超算和行業超算,進一步的分化和場景上的針對性,以及将超算搬上雲端的服務模式,讓超算開始爲大衆與中小微企業服務。
超算的 " 最後一公裏 "
超算普惠,一是要 " 可用 ",二是要 " 好用 "。
通用超算和行業超算的分化隻是讓超算走下神壇," 可用 " 問題被解決。但要解決 " 好用 ",最關鍵的要解決超算資源有限而造成的 " 用超算,先排隊 " 的問題,同時再把超算的成本打下來。多種因素促成下,超算雲服務化進入公衆視野。
與傳統超算用戶自己購買設備、自己建機房、自己運維相比,超算雲化有明顯的性價比優勢。同時,算雲融合,也很大程度上降低了廣大科研和企業用戶使用超算的成本。但在實際落地過程中,由于目前國内各個超算中心的算力資源配置不一樣,應用軟件使用不一樣,每個用戶對計算效率的要求也不一樣,導緻用戶使用算力還面臨着資源選型困難、性能移植部署困難、技術獲取服務困難等各類問題。
也就是說,當用戶想使用超算的時候,通過什麽樣的軟件調取超算資源實際上也不是一件容易事,超算普惠的最後一公裏,讓超算 " 可用 " 和 " 好用 ",還需要在超算平台與實際用戶之間構建一個繁榮多元的超算軟件生态。
" 從真實應用運行特征入手,綜合考慮不同應用場景下各類算力資源和應用計算的性能表現,再通過對各類應用的精細化分析,爲不同用戶選擇更适合的應用程序。" 北京超算(北京超級雲計算中心簡稱)技術總監甄亞楠對钛媒體 App 表示。
北京超算的實踐經驗是将解決方案具體細化,隻有打通了超算軟件應用生态的最後一公裏,進一步才是向企業級用戶提供一些定制化的算力服務。" 包括算力資源、網絡資源、存儲資源的定制。" 甄亞楠說。
不過,有意無意間,在構建一個多元的超算軟件生态的過程中," 工業軟件 " 成爲了超算場景下成長最快的應用類型。
超算上長出 " 工業軟件 "
工業軟件被卡脖子,這是個被诟病已久的問題。在陸陸續續海外工業軟件停服的案例曝出之後,加大中國工業軟件的創新速度,就成爲了一件非常迫切的事情。而超算與工業軟件的化學反應,也在這一過程中産生。
論應用,工業軟件的研發實踐需要大量的高性能計算來輔助,它與超算能稱得上天然适配。近年來,我國的工業軟件領域時常面臨 " 卡脖子 " 問題," 打好科技儀器設備、操作系統和基礎軟件國産化攻堅戰 " 也被點名提出,因此,我國超算服務商也在逐漸走上助力國産工業軟件的道路。
助力國産工業軟件,首先是幫助其上 " 雲 ",建立算力供應鏈,借助超算雲服務化模式,在提供大量高性能的算力資源的同時,還能充分發揮算雲融合優勢。
但這一過程,具體是怎麽有效落地的呢?
钛媒體 App 了解到,最重要的是算力供應鏈的建立。通過幫助國産工業軟件實現上雲,能夠使産業鏈上各企業、部門進行高效協作,共同達成智能供應鏈協同;通過保穩算力供應鏈,超算平台從對接算力用戶到對接國産軟件研發團隊,充分發揮橋梁作用。
而提到保穩供應鏈,其實就是供應鏈安全性問題。钛媒體 App 了解到,北京超算主要是從保障算力供應鏈以及保障軟件供應鏈兩方面入手,來提升算力服務的支撐能力:
在保障算力供應的安全方面,現在北京超算擁有國内最大的通用算力資源池,同時也引入了百 PFlops 的國産算力資源,可以實現國産算力有效替代,滿足不同用戶的算力需求;
在保障軟件供應鏈方面:北京超算将國産算力資源帶入到國産應用軟件生産和研發的關鍵環節,來保障軟件供應鏈安全;目前,其平台已經部署了超過 200 款的通用計算軟件,還有覆蓋工業仿真、材料計算、生命科學等細分領域超過 30 款的國産工業軟件。
甄亞楠表示,許多軟件在研發之初都已經開始考慮直接基于雲上的環境進行安裝和部署,相對于傳統的比如刻光盤或者刻優盤去賣軟件的方式,雲端共享軟件的模式更爲靈活。" 尤其是國産工業軟件雲化,能夠搭載互聯網優勢,使用戶快速、及時地獲取國産工業軟件的最新功能信息。此外,國産工業軟件上雲也會加速軟件的開發叠代,通過雲化的服務模式開拓出更多的部署環境。" 甄亞楠說到。
不過,幫助工業軟件雲化和保障算力供應鏈安全隻是其一,随着 AI 時代的加速到來,不隻是超算,未來工業軟件對 AI 算力或者說智能算力的需求也會逐漸加大,大量的工業類數據需要分析和價值挖掘,超算平台在塑造多元軟件生态的過程中,這一趨勢也不得不考慮。
根據中國信息通信研究院發布的《中國算力發展指數白皮書 ( 2022 年 ) 》,2021 年全球計算設備算力總規模達到 615EFlops,同比增長 44%,其中智能算力規模爲 232EFlops,超級算力規模爲 14EFlops;2021 年中國算力總規模達到 202EFlops,其中智能算力規模達 104EFlops,增速 85%,占比超過 50%;預計 2030 年全球算力規模達到 56ZFlops,平均年增速達到 65%。
甄亞楠介紹,針對 ChatGPT 一類的大語言模型,考慮到其強勁的算力需求以及預訓練模型的數據處理需要,目前北京超算已經具備了百卡、千卡規模的算力服務能力。此外,北京超算在積極尋求與國内頂尖研究機構的合作,通過集成部署通用框架、自研算法等方式來滿足算力需要。截至目前,北京超算已經部署了如 A100、V100 等在内的多種 GPU 芯片,以及優化部署了一批常用的深度學習框架。
回歸應用,甄亞楠表示,在人工智能場景中,北京超算一方面建設以 GPU 或加速卡爲代表的算力資源,幫助加速科學計算以及人工智能計算結果生成。另一方面,面向推理場景,通過建設大量基于雲計算的雲主機資源,幫助用戶順利開展在線推理業務。
基于超算雲服務化模式,算力市場還有很大的拓展空間,北京超算助力國産工業軟件的實踐效果還有待驗證。而 AI 帶動的萬億藍海,就在那裏,依舊波濤洶湧。(本文首發钛媒體 APP 作者 | 賈雨微 編輯 | 秦聰慧)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App