上周,微軟總裁在接受采訪時,cue 到了一家中國機構:
我們認爲有三家公司處于絕對的前沿,一是與微軟合作的 Open AI,二是谷歌,三是北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)。
谷歌自然不難理解,但說到智源研究院,大部分圈外人可能都要懵一會。
這是哪家機構,怎麽之前好像沒聽說過?
事實上,這家機構确實很年輕—— 2018 年創建,誕生至今也不過五年。
但它做的事情可不小。
2021 年,智源推出了中國首個 + 世界最大超大規模預訓練模型【悟道 2.0】,參數量達到了驚人的 1.75 萬億,這是 GPT-3.5 的十倍,也超越了谷歌的超大模型 Switch Transformers(1.6 萬億)。
在國際公認的 9 項的機器學習任務 " 跑分 " 項目上,【悟道 2.0】都取得了優異成績,超過了 GPT-3、Google ALIGN 等領域内同類技術。
此外,悟道 2.0 本身的訓練過程,也獲得了中國超級計算機項目的幫助。事實上,它也是中國團隊首次在 100% 國産的超級計算機上訓練出來的深度神經網絡模型。
而國外媒體也對其表示了密切關注。
除了大模型,智源研究院還推出了 " 天演 " 生命智能模型、" 九鼎 " 智算平台、"FlagOpen 飛智大模型 ",推動我國人工智能行業從基礎設施到跨學科應用的層層進步。
2022 年 5 月,智源天演團隊發布天寶 1.0,即生物精度最高的仿真秀麗線蟲,能夠高精度模拟秀麗線蟲全部 302 個神經元及連接關系,邁出天演人工智能生命模拟工程的第一步。
同日,智源推出的大型雲計算服務平台" 九鼎智算平台 ",圍繞通用大模型、AI for Science 等方向,爲大模型訓練提供算力、數據、算法三方面的創新支持。
今年 3 月推出的 " 飛智 " 大模型技術開源體系,則是智源與多家産學研單位共同構建的大模型開源開放軟件體系,包含算法、模型、工具、評測等多個部分,能夠顯著降低大模型開發的難度。
盡管成立時間短,但智源已在業内聲名赫赫:一年一度的智源大會,已成爲業内的每年的重要活動之一。
這些都暗示着,在大多數人都未曾注意到的時候,中國的人工智能技術,正悄悄走到了世界前列。
起源
智源研究院的起源,是一場 " 群英荟萃 "(不是蘿蔔開會)。
2018 年年初,北京市出台《北京市支持建設世界一流新型研發機構實施辦法》,進行科技體制的飛躍式改革。
同年,北京爲建設懷柔科學城,聘請了清華大學藥學院教授魯白、原國家自然科學基金委員會主任楊衛院士、美國國家科學院院士楊培東、原微軟亞太研發集團首席技術官張宏江博士等四位專家擔任戰略專家。
在那年的一場研讨會上,專家們圍繞 " 如何推動北京人工智能創新工作發展 " 提出了六項建議:
建設 " 北京智源 " 等人工智能軟硬件計算平台
建立 " 産學研用 " 聯合創新的人工智能基礎研究模式
積極推動政府數據和企業數據開放共享
開放人工智能應用場景和加大基礎保障
加大人才培養、引進和完善保障措施
加大國際交流力度
于是,2018 年 12 月,在科技部和北京市委市政府的指導和支持下,北京智源人工智能研究院正式成立。
資料顯示,智源人工智能研究院依托了北京大學、清華大學、中國科學院、百度、小米、字節跳動、美團點評、曠視科技等北京人工智能領域優勢單位共建,實行理事會領導下的院長負責制,張宏江擔任理事長,北京大學信息科學技術學院教授黃鐵軍擔任智源研究院院長。
智源研究院的員工彙集了來企業、學術等不同背景的專家,集合了一支包括清華、人大、北大等知名學府不同專業方向的團隊,也有各合作企業的員工進駐。
對于人才,智源通常給予四類定位:首席科學家、研究項目經理、研究員,和青年科學家。在每一個研究不同技術方向的子團隊當中,都有不同資深程度、專業和技能方向、供職背景的成員,員工構成非常多元化。
2019 年,智源推出了 " 智源學者計劃 "。截至 2021 年,已遴選智源學者近百人,其中 38 歲以下的青年科學家就有 40 位。
主要涉及的研究方向包括人工智能的數理基礎、人工智能的認知神經基礎、機器學習、自然語言處理、智能信息檢索與挖掘、智能系統架構與芯片等。
可以說,智源研究院彙聚了中國 AI 圈内的頂尖人才," 集中力量辦大事 ",誓要将北京在 2028 年建設爲國際領先的人工智能創新中心。
自由探索 + 目标導向
智源人工智能研究院的定位是 " 新型研發機構 ",但在這一領域上,如何規範、高效地運作,國内始終未有成熟且成功的樣闆參考。
通過摸索,智源提出了一套 " 智源模式 ":
即建立自由探索與目标導向相結合的科研管理機制,以小同行視角遴選支持智源學者自由探索,以 " 集中力量辦大事 " 的科研組織模式推動 " 悟道 " 大模型等重大科研任務的實施。
所謂 " 自由探索 ",指智源研究院能夠賦予科學家最大的技術路線決定權和經費使用權,給予科學家盡可能大的研究自由度。
而 " 目标導向 ",就是對于學界共識的方向,智源學者們的研究能夠聚焦在一個統一的願景上,并自然錯開研究方向,頻繁相互交流反饋,形成來自組織的合力。
在這一體制的滋養下,智源研究院實現的科研成果斐然。
根據 2021 年智源研究院三周年時公布的數據,智源研究院發表或支持發表國際 AI 頂會頂刊論文 1470 餘篇,其中,被 AAAI、CVPR、ACL、ICLR、NIPS、SIGIR、TPAMI 等國際頂級會議期刊收錄論文約 1060 篇,占比逾七成,形成多個國際首創、首發重大成果。
科學研究的探索之路往往曲折而漫長,作爲學者的後盾,研究機構需要給予自由度,以鼓勵創新和促進進步,但同時也需要進行一定的引導,避免 " 迷失方向 "。
正如智源研究院理事長張宏江在爲圖靈獎獲得者 Yann LeCun 的自傳《科學之路》作序時所寫:
曆史上多數突破性研究成果的出現都是偶然事件,而研究機構所有努力都是爲了提升這類偶然事件發生的概率。
智源要做的就是希望通過構築協作社區,打造用于未來研究的計算和數據平台,更重要地是,集結最優秀的同行,專注未來可能産生原始創新與長期影響的領域(包括過往投入不足、重視不夠的領域)等一系列機制和努力,讓創新系統更高效地運行,通過我們的努力能讓中國出現突破性成果的概率增加。