大模型正在改變高校的什麽?
文|周享玥
編|趙豔秋
過去兩年,以大模型爲代表的新一代人工智能浪潮,在全球的發展中展現出蓬勃活力和巨大潛力。AI 已不僅僅是技術進步的象征,更已成爲國家戰略中的核心要素。
" 如果說今天有什麽事是我們一定要做的,那就是 AI For Science(AI4S)。難以想象今天還有什麽事情比它更重要,今年諾貝爾獎的頒布便是最好證明。"
11 月下旬,在深圳舉辦的 2024 年 IDEA 大會上,香港科技大學校董會主席沈向洋表示,當前做人工智能研究,一方面要全力推動大模型技術的落地,另一方面也要關注它在科學研究中的應用。
第二天,在前往香港與黃仁勳進行一場對談的過程中,沈向洋又再次提到了 AI for Science,并提及香港科技大學已圍繞這一熱門方向,投入大量的計算基礎設施和 GPU 資源。
黃仁勳則回應稱,高校目前确實面臨着一個嚴峻的結構性難題,即計算資源分散,反而導緻一些研究算力獲取難。這也是爲什麽,之前很多研究員選擇先前往英偉達、谷歌、微軟等大公司進行研究,再返回大學,甚至許多教授,會選擇在從事教學工作的同時,兼顧研究工作的原因。
黃仁勳因此建議 " 大學應該成爲基礎設施建設的引領者,通過集中資源來推動全校的研究發展 "。
實際上,業界觀察,最近兩年随着大模型的到來,尤其近期諾貝爾獎的發布,讓高校對 AI for Science、大模型和智算的投入熱情進一步高漲。
01
諾貝爾獎後,高校熱情高漲
最近,多位業界人士觀察,圍繞 AI for Science,高校對大模型、算力等方面的需求正在愈發活躍。
大模型方面,最近兩個月,教育依然是公開招投标市場上,出單數排名前列的幾大行業之一。" 現在不光是 211、985,還有大量地方級的一本、二本學校也都在主動聯系我們,探讨合作。" 一位大模型行業人士告訴," 高校都在努力擁抱大模型。"
算力方面,近期市場上,更是頻繁湧現大單,多所大學都在發布千萬元級别甚至上億元的算力采購需求。
AI for Science 并不是一個新概念,早在 2018 年,中科院院士鄂維南就在全球首次提出 "AI for Science(科學智能)" 概念。AlphaFold 在蛋白質結構預測方面的重大突破,也持續推動着這一概念深入大衆視野。而今年 10 月,諾貝爾物理學獎、化學獎紛紛頒給人工智能相關專家,則讓這一概念走向更大舞台,再一次成爲了熱門話題。
" 大家最興奮的是,原來 AI for Science 要由各種不同的模型去做,但現在搞蛋白質的、搞數學的 ...... 都可以‘揉’到大模型的方式中來,核心架構甚至全都是 transformer。" 百度傑出系統架構師王雁鵬告訴數智前線。
這讓一向作爲科研主陣地的高校們看到了新的确定性方向,都在集中火力,推進 AI for Science 的發展。
更頻繁的學術交流和經驗探讨是一方面。近期,全國各地湧現出了多場 AI for Science 相關論壇。其中,有不少是由高校主動發起。比如,10 月底的 2024 中國計算機大會上,複旦大學發起和組織了 " 第一屆科學智能(AI for Science)論壇——探索科學智能的邊界 "。11 月初,北京大學計算機學院,也和北京科學智能研究院一起,主辦了 "2024 科學智能峰會 " ……
一些高校也在成立專門的機構或組織,來推進 AI for Science 發展。比如香港城市大學,就在 10 月 21 日宣布成立了香港人工智能與科學研究院,并與多名學術和業界夥伴簽署合作備忘錄,共同推進人工智能(AI)領域的前沿科研。
人才方面的培養也在加速。數智前線注意到,10 月底至今,浙江大學已經與中國人工智能學會(CAAI)、國家開放大學、CAAI 教育工作委員會等一起,連續制作六期 " 諾獎後談 AI" 的人工智能通識課程系列直播公開課,推動大學生人工智能素養培養。
除此之外,大模型時代下的 AI for Science,正在對高校的算力問題提出新的要求。
業界觀察,高校傳統的算力建設方式,往往是不同院系甚至不同研究小組,自行采購和管理各自的計算資源,從而導緻一個學校内存在多個小型計算集群,容易出現算力資源分散管理、忙閑不均、共享不暢等問題,無法滿足大型模型研發所需的高速通訊要求,拖慢科研成果産出效率。
" 爲适應 AI4S 的需求,模型研發必須在算力、算法和模型框架等多個方面進行協同優化和建設,傳統的分散建設方式已不再适用。" 去年 10 月,在一場 AI 大會上,複旦大學人工智能創新與産業研究院研究員程遠曾表示。
爲此,早在去年 6 月,複旦大學就和阿裏雲、中國電信合作打造上線了号稱是當時 " 中國高校規模最大的雲上科研智能計算平台 CFFF"。而該平台由面向多學科融合創新的 AI for Science 計算集群 " 切問 1 号 " 和面向計算科學高精尖研究的專用高性能計算集群 " 近思 1 号 " 兩部分組成。
無獨有偶,更多高校也都在加速算力基礎設施的投入和建設。今年 1 月,浙江大學與中國移動簽署戰略合作協議,并宣布共同打造 " 全國首個校企合營模式算力中心——中國移動 - 浙江大學啓真算力中心 "。4 月,香港科技大學(廣州)智算中心也正式啓用……
今年 10 月,諾貝爾獎的發布,則帶來了進一步的需求刺激。" 最近,高校的熱情普遍很高,預算也在變多。" 王雁鵬告訴數智前線,他們已經看到好幾個高校,都拿到幾億元的資金,要加大智算基礎設施的投入。
像上海交通大學,已轉變傳統科研模式,期望科學與 AI 更緊密的結合。他們與百度智能雲合作建成了自己的 AI for Science 科學數據開源開放平台,支撐白玉蘭科學大模型的訓練。依托 AI for Science 平台,上海交大已在 Nature Computational Science 封面,發表了 AI+ 城市的科學成果。
02
大模型時代,産學研合作有了新内涵
高校紛紛加碼 AI for Science 的同時,産學研的結合正變得愈加密切。
中國科學院院士鄂維南曾不止一次在演講中表示,随着 AI for Science 的發展,科學研究将告别原來一個課題組完成所有科研任務相關事務的 " 作坊模式 ",轉爲類似 " 安卓模式 " 的平台科研,打破學科邊界。
" 在平台科研的基礎上,針對具體的應用場景,通過垂直整合方式組織科學團隊、實驗團隊、産業界專家聯合進行攻關,将極大提升科研的效率以及産業發展。" 鄂維南說。
一位來自國内大模型和算力服務企業的資深人士也告訴數智前線,随着大模型的到來和持續落地,校企合作目前已成爲普遍趨勢。" 原來很多東西都是我們要主動去找高校,但最近兩年,高校主動找來的比較多。" 該人士表示。
合作也在更加深化。" 原來可能隻是和高校本身簽一個戰略協議,在 IaaS 層合作,或者大家去找到一個點,做一些傳統應用的合作。" 上述人士介紹,但最近兩年,高校裏面的很多二級學院,也都在紛紛找他們進行合作。而這些二級學院,想要合作的業務方向也都不一樣,往往覆蓋了交通、藥品、能源制造等不同領域,畢竟他們手中握有一些專業數據,在大模型時代有必要條件。
不過,AI 雖然幫助突破了原來的科研瓶頸,但對科研團隊的 " 硬 + 軟 " 實力也提出了更高要求,校企合作更有利于實現優勢互補。
比如在隧道與地下施工領域,山東大學與浪潮雲合作,通過地質統計學、流體力學、計算機科學及信息科學等多個學科聯合,搭建了岩土工程領域大模型與災害預控數字孿生平台,探索形成地下工程災害由被動處治到主動、科學、智能防控轉變的關鍵技術。
而浪潮信息自 2020 年以來,持續參與了西湖大學算力平台的建設,在這家建設初衷是将創新從零到一做起的學校,加速其在藥物科研等方面的探索。
複旦大學,則在與阿裏雲、中國電信聯手打造 CFFF 平台一年後,已有超 300 個科研團隊在這該平台上開展研究,且幾乎都是跨學科團隊。一批垂直領域大模型也在此誕生和活躍,如國内首個多模态的對話式大語言模型—— MOSS 大語言模型;結合 3D 分子構象,預測藥物物理化學屬性的 ADMET 預測模型;研究長序列、細粒度的基因調控關系的女娲 DNA 大模型等。
值得一提的是,企業助力高校實現 AI for Science 的同時,高校們産出的科研成果,實際上也在反過來服務企業的客戶,實現某種意義上的 Science for AI。
" 比如,我們和某大學合作打造行業大模型的過程中,他們有研究幾十年的學術數據,我們有大模型和算力,通過合作,他們加速了科研成果的轉化,這些研發出來的産品,目前也正在面向我們的其他客戶,進行試點推廣。" 一位行業人士表示。
某大學與百度雲合作,将某制造行業的一些需求用大模型跑通後,也能嫁接到百度的模型上來,去大範圍服務客戶。
也因此,業界觀察,目前不管是高校還是企業,都對 AI 領域的産學研合作抱以厚望。
最近的高校招标項目中,就有不少項目都與 " 産教融合 " 有關。比如上海交通大學的 " 面向産教融合的可擴展異構協同智算平台 " 項目,哈爾濱工業大學的 " 人工智能産教融合創新平台總集 " 項目。
而在更早之前,複旦大學 CFFF 平台正式上線時,中國工程院院士、阿裏雲創始人王堅更是一度表示,複旦大學和阿裏雲的合作是産學研協同的創新," 甚至可以像當年 MIT 跟貝爾實驗室合作使得今天的大學工學院有了通信專業一樣,以産學研的合作創造出一個新領域、一個新機會。"
03
一些經驗正在形成
"AI for Science 在材料、生命科學、能源化工等領域落地成果的不斷湧現,讓我們看到其帶來的巨大前景。但 AI for Science 帶來的不僅僅是點狀的突破,而是系統性地帶動科學研究基礎設施的建設,推進邁向‘平台科研’時代。"2024 年 7 月,在 2024 世界人工智能大會的一場分論壇上,中國科學院院士鄂維南如是稱。
他同時強調,發展 AI for Science,落地 " 平台科研 " 模式,應該着重推進 " 四梁 N 柱 " 方面的綜合建設和發展。
其中," 四梁 ",即指新一代科學研究的基礎設施,包括基本原理與數據驅動的算法模型與軟件、高精度高效率的實驗表征方法、替代文獻的數據庫與知識庫,以及高度整合的算力平台。具體科學及産業問題,如新能源汽車、生命科學、能源材料等,則構成所謂的 "N 柱 "。
在這種大背景下,最近兩年,高校和企業都在紛紛加速推動 AI for Science 的基礎設施建設。而在這個過程中,一些經驗也在相互合作中逐漸積累。
比如在大模型方面,一位大廠人士告訴數智前線,高校在選擇合作夥伴時,往往最爲看中三方面的因素:公司體量是否夠大,能彌補他們資源上的優勢;算力和大模型技術方面的優勢是否突出;服務能力是否可持續,而不是一杆子買賣。而企業則看中高校科研團隊裏是否有資深的人才,更優質的行業數據等。
在科研計算平台建設方面,複旦大學研究員程遠則在去年 10 月的一場大會上,分享了複旦大學的三大關鍵建設思路。
其一,要提高集群計算的加速。尤其是在模型訓練相關領域,不僅要增加硬件算力,還需在并行訓練框架層面進行優化。
其二,将 AI 和 HPC 計算融合,以滿足不同科研計算需求。
其三,研發易于使用的 AI4S 工具,以滿足科學家對于 AI 易用性的需求。
随着今年合作的深入,效率、穩定性、節能等是這波熱潮中,高校對算力基礎設施的基本要求。
圍繞這些需求,AI for Science 基礎設施産業鏈上的一衆企業也在快速行動,推出對應的産品和服務。尤其是百度雲、阿裏雲、騰訊雲、華爲雲等多家雲廠商,都在這塊兒有不少探索。
百度繼上海交通大學後,在今年 1 月,與另一家 985 重點高校重慶大學簽署戰略合作協議,雙方将共建 " 重慶大學 - 百度智能雲聯合創新中心 ", 聚焦山地自動駕駛、大模型應用、信息安全等前沿關鍵領域,聯合開展高水平科技創新,共同打造 AI For Science 科研計算平台。
華爲則依托智能感知、智能聯接、智能中樞等全棧自主創新産品和平台,構建起實驗室科研園區、科研服務、科研計算三大科研平台能力,推出了智算實驗室解決方案,向外提供。
騰訊據悉也面向 AI for Science 浪潮,推出了 " 彈性服務、開箱即用 " 科研生态雲。
中國移動,在今年 10 月,發布了 AI 賦能科學 "AI For Science(AI4S)科學裝置智算節點 ",并提供 AI4S Station 科學工作站平台。該工作站集合了科研模型研發基礎工具集、科學模型服務平台、生物蛋白等科學領域工具套件,提供端到端極簡科研開發流程,讓科學家專注自身專業領域,提升科研模型研發效率。
一些創業公司也同樣瞄準在了 AI4S 領域的基礎設施搭建。比如深勢科技,正在爲有基礎科研需求的産業和企業提供 AI4S 研究工具和平台。
AI for Science 熱潮下,高校和企業還在持續不斷動作中……
© 本文爲數智前線(szqx1991)原創内容
進群、轉載或商務合作聯系後台
文章精選
>