回顧三次産業革命,會發現一個規律:基礎科學的突破,擡高技術的天花闆,推動大量先進技術成果的湧現,并向産業界轉化,最終實現社會經濟的指數級增長。
在物理、數學、工程學等的推動下,才有了蒸汽革命;電氣革命,源于電磁學、化學等學科的進步;量子物理、信息論等科學成果,則爲半導體、計算機等信息産業打下堅實的基礎。
今天,基礎科學整體已經發展到了一定高度,低處易摘的果實已經被摘走,科學家們向上攀爬的難度遠高于以往。
越來越多的科學領域,進入 " 第五範式 " 的新篇章,即由人工智能驅動的研究方式。而 AI 在處理多維、多模态的海量數據上有顯著優勢,因此,人工智能驅動的科學智能(AI for Science,AI4S)新範式,有望推動科學研究從 " 馬拉松 " 到 " 加速跑 "。
在今年的 WAIC 2023 上,科學智能的突破性進展,就備受産學研各界關注。
學術方面,中國科學技術信息研究所發布了 AI4S 科研創新地圖;應用方面,中國商飛上海飛機設計研究院基于昇思 MindSpore 打造的三維流體仿真大模型 " 東方 . 翼風 ",展示了流體力學等領域與 AI 的融合實踐。
可以看到,科學智能目前還是一些頭部科研院所,以及頭部行業、龍頭企業在踐行的新潮流。更廣大的科研群體和科學場景,距離 AI 技術依然遙遠。
有沒有一種可能,讓 AI 化作更多科學家手中的實用工具,加速科學智能的進程?這是昇思 MindSpore 一直在努力實現的命題,也在近期抵達了新的裏程碑節點。
近日,在物理方法、生物、流體力學等基礎科學領域,國内多個研究團隊基于昇思 MindSpore Science 科學智能套件的助力,取得重大突破。
在這些成功踐行的科學智能探索背後,我們可以進一步讀懂,科學家們對 AI 有哪些具體而迫切的需求,智能工具和平台又是如何與科學場景緊密嵌合的,科學與智能的緊耦合又會爲科學探索帶來哪些可能性。
找鑰匙,鑄鑰匙:
科學與 AI 的無縫嵌合
一場科學革命的發生,往往是以範式轉換作爲先導的,而科學智能的新範式,要讓科學與智能加速融合,以最高效率爲科學乃至社會帶來價值,還要解決一系列挑戰:
首先,科學和 AI 的語言難以對齊。
科學的本質是探索和改造客觀世界,科學智能則意味着數字世界、物理世界、生物世界,正在前所未有的融合。不同世界的語言、規則等跨度很大,比如,要将電磁、力學、氣象等物理規律(方程式)投射到數字世界中,需要轉化爲 AI 可以理解的數學語言(函數);生物世界的 DNA、氨基酸、蛋白質、神經元等,大量生命科學的奧秘還未完全揭開,直接用機器學習的算法,可能是無法運行的,或者效果不夠好。
接下來,還會遭遇 AI 技術本身的複雜性。
AI 技術體系複雜,落地科學計算,包括建立數據庫、數據清洗、模型選型、系統運維等一項項細節工程……對很多科研院所、高校師生、産業研究院來說,AI 是新生事物,缺乏相關經驗,導緻 AI+ 科學計算模型的開發難度大、周期長,進一步限制了科學智能的落地效率。
此外,在探索科學智能的過程中,計算工具平台不能成爲掣肘。
爲了推動 AI+ 科學計算,學術界探索出了三種計算模式,分别是物理驅動、數據驅動以及物理 + 數據融合驅動。
以流體力學爲例,物理驅動(PINNs)将物理方程引入到神經網絡的損失函數中,使學習結果滿足物理規律,但 PINNs 不依賴于傳統數值方法生成标簽數據,計算精度和收斂缺乏理論保證,導緻訓練困難,一旦物理約束變化,就需要重新訓練,泛化性不足。而數據驅動的流體力學,則有着龐大的數據維度,數據規模大、處理耗時長、整體成本高昂。物理 + 數據融合驅動的流體力學,通過仿真軟件獲得輸入和輸出的真實數據,比傳統數值仿真性能提升 40~80 倍,并且具有很強的泛化性,目前實現場景較爲聚焦,有效性也在持續驗證中。
這些計算模式要取得比較理想的效果,需要基礎硬件平台、核心 AI 框架、編譯器、應用工具套件等一整套端到端的軟硬件解決方案,離不開平台化的支撐。目前,隻有華爲、谷歌等極少數科技公司,在科學智能領域有較爲全面的軟硬件布局。
可以看到,科學智能的探索過程中,科研人員和開發者所期待的,是直接簡單地使用 AI 平台工具和能力進行開發,這就需要平台将複雜的硬件、算力服務、AI 框架、編譯器、模型、應用、環境等,像 IT 領域的 " 交鑰匙工程 " 一樣,整合成适配科學計算任務的方案,讓研究人員可以專注于 AI 科學計算的應用創造,進行更高效的研發探索。
昇思 MindSpore 原生支持科學智能,打造了昇思 MindSpore Science 科學智能套件,包含了業界領先的開源基礎模型、預置高精度模型和前後處理工具,支持物理驅動 / 數據驅動 / 物理數據融合驅動等多種 AI+ 科學計算範式的全場景 AI 框架。
AI 與科學計算的融合剛剛開始,有大量場景等待探索。昇思 MindSpore 面向生物、流體、電磁、量子計算等領域,推出了相應的行業套件,以加速應用開發和探索發現。
開鎖行動:
AI for Science 的價值自證
近日,中國科學家及其團隊,借助昇思 MindSpore SPONGE、MindSpore Flow 等科學智能套件,分别取得了多個突破性進展。從中,我們可以看到,AI 在科學場景中所能發揮的關鍵作用:
作用一,以 AI 方法加速助力物理學的理論突破。
20 世紀是物理學的世紀,我們今天仍在享受着上一次科技革命的遺澤,留給當代研究者的都是高處難摘的果實。比如,在流行病學、氣象科學、流體力學和生物學等領域中,很多的底層 PDE 方程仍未被完全發掘出來。
昇思技術團隊與中國人民大學高瓴人工智能學院孫浩教授團隊合作,基于昇思 MindSpore AI 框架,提出了物理編碼遞歸卷積神經網絡(Physics-encoded Recurrent Convolutional Neural Network,PeRCNN),實現了對非線性 PDE 的精确逼近。近日,該成果已在《Nature》子刊《Nature Machine Intelligence》上發表。
從中可以看到,AI 的兩個特點正在爲基礎研究的突破帶來可能。
一是計算效率。相較于物理信息神經網絡、ConvLSTM、PDE-NET 等方法,PeRCN 模型的泛化性和抗噪性明顯提升,長期推理精度提升了 10 倍以上,可以突破傳統計算瓶頸,推動偏微分方程的求解。
(PeRCNN 在預測和外推的性能上也優于 ConvLSTM/ResNet/PDE-Net/DHPM 等方法)
二是暗知識。AI 能夠發現隐藏在海量數據中的相關性,是人類無法感受又無法描述和表達的 " 暗知識 "。PeRCN 模型的可解釋性,可以從學習到的模型中進一步提取底層的基礎物理學表達式,有望準确可靠地發現潛在的物理規律,讓我們對物理世界的認識取得新突破。
作用二,首次實現 AI+ 蛋白質動态結構折疊,加速生命科學研究進程。
生物醫藥領域有著名的 " 雙十定律 ",即研發一款新藥需要花費至少十年時間、十億美元,90% 的臨床藥物研發都将以失敗告終。加速藥物研發的進程,對于提高人類的生命健康、生存質量,有非常重要的意義。
(FAAST 核磁共振數據解析流程)
而生物醫學領域的 AI 計算,具有數據量龐大、數據結構複雜多樣、有效算法稀缺的種種特性,尤其需要預測準确、簡單易用、高效協作的工具平台。昇思 MindSpore 的計算生物領域套件 MindSpore SPONGE,支持分子動力學、蛋白質折疊等常用功能,在大規模計算任務中快速完成計算,輔助研發人員高效研發。
近日,昇思技術團隊與高毅勤教授團隊(昌平實驗室、北京大學化學與分子工程學院和生物醫學前沿創新中心(BIOPIC))、田長麟教授團隊(中國科技大學、中科院強磁場科學中心)、王申林教授(華東理工大學生物反應器工程國家重點實驗室)合作,基于昇思 MindSpore+ 昇騰 AI 基礎軟硬件平台,開發了 NMR 數據自動解析方法 FAAST,将通過核磁共振試驗獲得的蛋白質動态結構,解析速度提高了十倍,解析時間從數月,縮短到數小時,全流程無需專家投入,大大減輕了研究人員的重複勞動,加速生命科學研究和藥物研發流程。
作用三,AI+ 流體力學指數級提升大飛機研發效率、降低研發成本。
曆史告訴我們,每一次工業革命,都需要将科研成果轉化爲産業可用、可接受的技術,很多産業也對科學智能投入了大量研發資源與期待。以流體力學爲例,大型客機的流體問題,就是一個非常具有挑戰性的科學難題,也是非常典型和高價值的力學場景。
傳統飛機設計,仿真過程複雜,需要進行物理建模、網格劃分、數值離散、叠代求解等步驟,經過千萬億次的模拟仿真,計算周期長。
在 WAIC2023 上發布的 " 東方 . 翼風 " 大模型,同樣是基于昇思 MindSpore 開發,實現了三維超臨界機翼流體仿真,可以對飛機全場景飛行狀況進行快速且高精度的模拟,助力飛機研發,該成果榮獲 WAIC 最高獎項 SAIL 獎。
具體來說," 東方 . 翼風 " 利用昇思 MindSpore Flow 流體仿真套件,結合流體領域專家經驗、數據,實現對飛機翼型全場景飛行工況模拟,在三維機翼幾何變化的情況下,全流場誤差達到了萬分之一,三維翼型仿真模拟時間降低爲原來的千分之一,加速了飛機設計的效率,減少風洞重複試驗的次數和成本。
這些科學智能的成功探索,用實打實的創新證明了,科學場景與 AI 技術,可以借助精細而易用的工具平台,高效快速地完成對齊、緊密嵌合,發揮 AI 的技術價值,解鎖更多的科學奧秘,滿足大衆、産業和社會對科技進步的殷切期待。
解鎖無盡前沿:
昇思 MindSpore 鑄就 " 全能 " 鑰匙
如果說,這三次科學探索的成功,是一個明晰的信号和方向,說明科學智能蘊藏了無比巨大的期待和潛力。那麽下一個問題就是:這些成功,究竟是案例式的炫技,還是可持續、可複制、可信賴的新科研路徑?
換句話說,昇思 MindSpore 構築的工具平台,也适用于其他未解的科學難題嗎?
目前來看,昇思 MindSpore 的 " 全能型 " 特點,也使其成爲一把 " 全能鑰匙 ",能夠從多個維度,支撐科學智能的持續探索,具體來說:
1. 深度。結合自研硬件、融合架構到編譯軟件,AI 框架能力,技術底座的全棧布局,可以滿足科研人員和開發者在科學計算中從算力到應用的全流程需求,消除後顧之憂。
2. 巧度。簡單易用的 MindSpore Elec、MindSpore SPONGE、MindSpore Flow 等行業套件,免去了衆多開發流程與運維成本,有效提升科研項目的開發效率,降低了科學計算和 AI 的開發成本,分子屬性、蛋白質結構、高空湍流等預測準确,切實提升了科學探索的成功率。
3. 廣度。昇思打造了南北向生态和開源社區,彙聚新模型、新技術、課程、專家和落地場景等豐富生态資源,在生态内推動産學研用一體化的協同創新,拓展科學邊界,将科研價值進一步打開。
4. 長度。科研不是一蹴而就的,有時要有坐冷闆凳的耐心。因此,科學智能的計算領域夥伴也要有長期紮根科研領域的長期戰略耐心和布局,持續升級基礎設施和技術、叠代模型和産品。這一點上,昇思 MindSpore 作爲産業智能化的基座,在通往無盡前沿的探索之路上,陪科研人員走得更遠。
四個維度,把科學與智能相融合的每一個環節、每一個阻礙,都一一解決掉,隻留給研究人員和開發者最簡單易用的開發體驗,這就是 MindSpore Science 如同 " 交鑰匙工程 " 一樣高效的使能模式。
陳寅恪先生說過:" 一時代之學術,必有其新材料與新問題。取用此材料,以研求問題,則爲此時代學術之新潮流。治學之士,得預于此潮流者,謂之預流。"
AI 就是這個時代的預流,昇思 MindSpore 正在推動更多治學之士與 AI 加速擁抱,融入科學智能的時代洪流。
更多科學領域和智能技術無縫嵌合,成功的 " 開鎖行動 " 不斷湧現,我們就距離科學的無盡前沿,更近了一步。