清華大學計算機科學與技術系教授、螞蟻集團副總裁、螞蟻技術研究院院長陳文光
9 月 5 日 -7 日舉行的 2024 Inclusion · 外灘大會 " 從 DATA for AI 到 AI for DATA" 見解論壇上,清華大學計算機科學與技術系教授、螞蟻集團副總裁、螞蟻技術研究院院長陳文光發表演講。
陳文光在演講中表示,科學發現過程中有四個範式,包括實驗科學、理論科學、數值模拟的高性能計算(HPC)範式,以及當前由 AI 和數據(BigData)形成的第四範式。未來傳統的科學計算(HPC)、Al 和 BigData 的融合計算将成爲趨勢,從而利用科學研究與應用推動計算系統不斷發展和變革。
" 不光 Data 和 AI 在融合,科學計算 HPC 和 AI 也在做融合。過去很多使用雙精度浮點計算的 HPC 問題,現在可以用半精度的 AI 計算來進行一定的近似,比如用機器學習的方法來預測蛋白質,用一些 AI 的方法來代替模拟的部分,當然,目前它還不能完全替代整個過去基于仿真的科學計算流程,所以它有可能是一部分用 AI,另一部分用傳統科學計算方法。" 陳文光表示,向 AI" 對齊 " 需要從底層系統角度出發,包括硬件的結構和對應的編程語言、編譯系統等。
陳文光強調,如同 " 三國演義 ",計算機編程也是天下分久必合,合久必分。當前 AI 熱潮下,跨領域代碼的融合和組合的優化依然存在巨大的技術機會。
會後,陳文光與钛媒體 AGI 等少數媒體進行對話交流。
陳文光于 2020 年加入螞蟻集團,負責螞蟻集團圖計算技術,2022 年起擔任螞蟻技術研究院院長,長期研究高性能計算編程模型和編譯系統。同時,陳文光還擔任清華大學計算機系教授,國家自然科學基金傑出青年基金獲得者,中國計算機學會會士和傑出講者、學術工委主任,北京計算機學會副理事長,2017-2020 年曾任 ACM 中國理事會主席,擁有清華大學計算機專業博士學位,發表了數十篇核心論文,其參與研發的高性能集群計算機與海量存儲系統 ( 2007 ) 曾獲得國家科技進步二等獎。
陳文光對钛媒體 AGI 表示,AI 擴展到自動駕駛、智能機器人等領域的數據起着更加重要的作用,現在 AI 技術的發展極大受到數據的驅動,如果有更多的數據,就意味着有機會獲得更好的模型質量。
陳文光認爲,提升 AI(智能)水平并不意味要訓一個能力越來越強的模型,通過 RAG 知識增強模型技術、行業私域數據訓練等方案,以及在數據量和數據質量之間的平衡,可以推動大模型技術不斷突破。
" 如果從人類學習做一些啓發,人其實沒有看那麽多東西,同樣的東西看一遍學會了,再看那麽多本對我來說沒有幫助了,從這個角度講,高質量的數據和更有效學習方法之間,也有互動的地方,這也有利于未來更有效的利用數據。通過提升數據質量、學習方法,以及在模型外增加能力,這幾個方面也都可以在數據量沒有增加情況下,進一步提升整個的智能水平。" 陳文光表示。
問及未來通過 AI Infra 等技術将推動 AI 推理算力成本下降原因,陳文光表示,目前有很多推理優化方法,包括模型量化、壓縮、動态批處理等等,而國産推理算力在軟件方面需要追趕英偉達生态的技術進展。
具體來說,推理包括兩個階段:一是計算密集的 prefill 階段,二是 Decode 階段,前一個階段是計算密集的,後一個階段是訪存密集的,如何在算力上合理分配兩個階段,需要在硬件和軟件兩個層面開展工作。
" 國産的算力上還是要做很多工作,因爲英偉達投入比較大,做的人也比較多,所以在英偉達上推理系統進展的非常快,效率也是很高的。一些國産算力上,因爲這些很複雜的新技術,還需要在推理軟件系統上不斷追趕英偉達生态。推理這個工作有點像過去的數據庫,它又要求很短的延時,又要求有一個大的吞吐率,在滿足延遲的條件下最大化吞吐率對系統的提供商是最好的,它又有很強的内存帶寬的需求,所以說怎麽把這樣一個複雜的計算在整個 AI Infra-Structure 支持好,還有很多工作要做。" 陳文光表示。
陳文光指出,當前行業大模型落地的最佳場景主要是金融和教育。其中,金融領域的行業大模型既有客戶需求的基礎,還有積極的反饋與良好的市場前景;教育方面,當前師資稀缺,而且高水平的教育沒有辦法做到因材施教,因此大模型提供重要機會,能夠用可接受的成本爲每個人提供教育服務。
當被問及數據共享機制,陳文光強調,現在數據共享存在諸多挑戰,比如通過密碼學和可信執行環境組合起來的方案,需要依賴硬件,在硬件規定的區域、内存裏面做相應的計算,如果信任這個硬件的話,安全性是有保證的。同時也有多方安全計算、聯邦學習,全同态加密等各種各樣的方法,其性能、效果之間會有不同權衡,解決這些問題還有很長的路要走。
(本文首發于钛媒體 App,作者|林志佳,編輯|胡潤峰)