The following article is from 騰訊研究院 Author 胡璇 黃詩宜等
第二期華夏基石數智時代領導力特訓營熱招中!
報名即送十月管理論壇名額一個!價值 12800 元!
來源 | 騰訊研究院,管理智慧
咨詢合作 | 13699120588
文章僅代表作者本人觀點,圖片來源于 pixabay
2024 年的諾貝爾化學獎被授予三名科學家,美國華盛頓大學教授大衛 · 貝克(David Baker)及谷歌 Deepmind 公司的德米斯 · 哈薩比斯(Demis Hassabis)與約翰 · 江珀(John Jumper),以表彰他們對破解蛋白質結構之謎的卓越貢獻。
蛋白質結構問題一直是諾貝爾化學獎的熱門領域,1958 年來共有十餘次獎項與之相關,既包括重要結構的發現,也包括工具和方法的改進,如晶體電子顯微鏡和冷凍電鏡的發展。計算機和人工智能方法的成功引入,不僅預測了幾乎全部人類已知的蛋白質結構,更能創造全新的蛋白質分子,爲生物醫藥打開更多可能。
三名獲獎者中,貝克教授是以計算預測蛋白質結構這一工作的領軍者,而吸引 Deepmind 兩名 AI 專家加入的 " 接力棒 ",則是一款叫做 Foldit 的遊戲。
Foldit 遊戲
聚合 " 人工的智能 "
蛋白質是生命的基石,其結構決定了功能。雖然組成蛋白質的氨基酸隻有 20 種,但它們在三維空間中的組合方式卻近乎無限。因此,對蛋白質結構的精準描繪困擾了科學家們數十年。傳統方法是觀測已有的蛋白質,準确但需要借助大型精密儀器,因此又慢又貴。從 1971 到 2006 的 40 年間,全球蛋白質數據銀行(Protein Data Bank)也僅收集了 4 萬個結構數據,相比上億的總數可謂九牛一毛。
《環球科學》2024 年 10 月刊中 "AI 重塑結構生物學 " 專題配圖
于是科學家們逆轉思路,從觀測變爲預測,并希望借助性能不斷進化的計算機,準确找到更多的蛋白質結構。蛋白質通常會折疊到能量最低的狀态,而科學家也知道如何去計算它的能量。基于此,貝克教授團隊在 1998 年發布了重要的計算平台羅塞塔(RoseTTA),它能進行蛋白質的預測乃至設計。計算機雖然擅長運算,但缺乏人類的空間想象能力,加上單台設備算力有限,因此進展不算迅速。
貝克團隊發現,蛋白質折疊這項工作具有有明确的目标、規則和打分,恰好構成了一項遊戲的全部要素。那爲什麽不用這一點吸引更多人參與進來呢?他們進行了一項大膽嘗試——遊戲化科學衆包。2008 年,基于羅塞塔構建的功能遊戲 Foldit 應運而生,允許用戶以闖關形式,将氨基酸的 " 鏈 " 折疊成适當的三維形狀,再由科學家檢驗結果。它富有趣味,簡潔易懂,很快吸引了全球幾十萬沒有科學背景的普通用戶加入。
Foldit 通過在線平台将科學問題和普通人連接起來并聚合智慧
很快,人類在模式識别上的優勢就顯現出來,不僅準确度超過了計算機,也在多個科研難點中發力。比如玩家曾在 10 天内破解了艾滋病逆轉錄酶的晶體結構,一個存在了 15 年的科學難題。2010 年,57000 名 "Foldit players" 作爲論文作者登上《Nature》,這是 " 人工的智能 " 在蛋白質結構預測中的裏程碑。新冠疫情爆發後,20 萬人共同尋找阻止新冠病毒傳播的蛋白質結構。這些公民科學家們還爲包括癌症、阿爾茨海默病和埃博拉病毒在内的廣泛醫療挑戰的研究做出了貢獻。
" 超級玩家 " 哈薩比斯接棒
AI 通關蛋白質折疊遊戲
Foldit 這顆子彈,将在多年後擊中 Deepmind 創始人、遊戲人工智能專家哈薩比斯的眉心。
他是一名不折不扣的 " 超級玩家 ",棋類和 Foldit 點亮了他對遊戲和智能的關系的思考:12 歲成爲國際象棋世界亞軍,編寫了自己的第一個人工智能下棋程序;15 歲和畢業後設計的《主題公園》《黑與白》等作品 " 都以 AI 爲核心 "。在 MIT 做博後時,他接觸到了 Foldit,驚訝于人類直覺在遊戲中發現新模式的巨大潛力。
成立 Deepmind,是他從遊戲智能出發、追尋通用智能的重要一步。他在接受采訪時說到:" 從一開始,我們就将遊戲作爲證明和開放 AI 算法的試驗場。因爲遊戲非常高效,也很容易有指标來查看 AI 系統如何思考和改進。" 同時," 最終目标是使用遊戲中訓練的智能來引導通用學習系統,并應對現實世界的挑戰 "。圍棋智能 AlphaGo 和 AlphaZero 獲得巨大成功,後者甚至僅靠自學就在數天内獲得人類數千年的知識,開發出全新的策略,擊敗人類冠軍。這證實了深度學習算法在處理複雜問題上的強大能力。
AlphaGo 和 AlphaZero 尋找最優策略并獲得勝利
繼續挑戰更複雜、更綜合的遊戲,比如《星際争霸》《我的世界》,自然是一種路徑。那有沒有一個規模和條件都合适的現實問題,能夠快速遷移團隊在圍棋上的成果呢?
遊玩 Foldit 的經曆在哈薩比斯腦海中閃現。他在目睹 AlphaGo 戰勝圍棋世界冠軍李世石的那一刻想到:如果人工智能可以從 0 知識開始訓練,并擊敗人類頂尖選手;那同樣可以像 Foldit 的玩家那樣,不具備生物化學知識卻完成科學家的工作。遊戲固定的規則和無窮的可能性之間,形成了極大的張力;找到通向勝利的路徑和解法,就是智能的體現。
于是,蛋白質折疊問題,成爲 Deepmind 團隊從遊戲智能邁向解決現實問題的關鍵一步。他們着手設計 AI 蛋白質折疊算法 AlphaFold,基于蛋白質銀行中已有的 14 萬條結構數據,像遊戲中找最優解一樣分析數據、尋找規律,反複訓練提高預測準确性。AlphaFold 于 2018 年在蛋白質結構預測領域的 " 奧運會 "CASP 上首次亮相,取得了 2.5 倍于第二名的好成績。但這距離準确預測還遠遠不夠。
第三位主角約翰 · 江珀在此時加入 Deepmind,牽頭設計了新的 transformer 架構和許多革新。2022 年發布的 AlphaFold2 真正改變了這一領域,大部分預測超過了百分制的 90 分。随後,Deepmind 一舉公布了 2.18 億個人類已知的蛋白質結構,宣告 50 年來蛋白質三維結構預測問題的解決。
AlphaFold 基于數據庫訓練和改進預測結果
自此,不僅蛋白質折疊問題得到突破,用 AI 解決科學問題的方法更逐步深入人心。新版本 AlphaFold3 在 2024 年 5 月上線,引領生物學預測技術進入下一階段:構建蛋白質與其他分子(如 DNA 或者 RNA)結合的複合體結構。AlphaFold 已被來自 190 個國家的 200 多萬研究人員用于推進關鍵工作,包括了解抗生素耐藥性和開發可分解塑料的酶等重要應用。META 也跟進發布了 ESMFold 的研究成果:由機器學習創建的 6.17 億個宏基因組蛋白質結構的數據庫,包括土壤、海洋和人體中的微生物。
下半場:
科學衆包和遊戲人工智能加速前進
Foldit 仍在不斷叠代,逐步成爲了科研人員和普通公衆互動的社區。遊戲不僅持續将前沿問題轉化爲遊戲關卡,收集玩家的高分解答并吸收到成果中,也鼓勵用戶間對解題策略的讨論。遊戲功能同樣與時俱進,2019 年時加入了蛋白質設計模塊,後續更引入了 AlphaFold 幫忙給玩家的作業打分。
更多科研項目采用了類似的衆包機制,科學家們甚至搭建了專門的公衆科學遊戲發布平台,如 Kaggle 和 Zooniverse,以供科研人員和機構發布遊戲并招募志願玩家。從生物學、神經科學、天文學、高能物理學到語言學、藝術史學,都已有成千上萬的普通玩家的參與。例如,在 Eye Wire 中,玩家通過簡單有趣的操作即可映射神經視網膜通路;在《星系挑戰》(Galaxy Challenge)中,玩家能夠給星系形态分類;Metropolitana 和 ARTigo 則允許玩家爲社會語言、藝術作品打标簽。
同時,遊戲 AI 也在《星際争霸》《王者榮耀》等複雜遊戲中獲得更全面的能力後,助力解決機器人訓練,能源和交通調度等現實問題;更有望讓 AI 進一步理解我們所處的真實世界,獲得空間智能。微軟、Deepmind、Meta、騰訊等科技公司都是參與者。騰訊開悟遊戲 AI 研究開放平台依托騰訊在算法、算力、實驗場景方面的核心優勢,爲學術研究人員和算法開發者開放研究與應用探索的資源及工具。
國内的遊戲人工智能人才培養,在産學研各界合力下加速前行。2024 年,川渝政府聯合騰訊,共同發起川渝大學生人工智能大賽暨騰訊開悟人工智能全球公開賽,吸引國内及 17 個海外國家超過 5200 名學生參賽,并協同燧原、Intel、Vivo、成都智慧交通集團,聯合開發芯片算子開發、交通應用場景、算法與工程等産業賽道。2023 世界人工智能大會期間,廈門大學聯合中國傳媒大學、北京理工大學、上海交通大學等多所高校,籌備成立 " 遊戲人工智能高校聯合研究中心 ",持續深化遊戲人工智能的研究。
未來的科研新星和下一個 Deepmind,會不會從這些創新青年中誕生?
AI&Game for Science 的
更多想象力
盡管今年的諾貝爾物理與化學獎被調侃爲 " 理科綜合 "" 圖靈獎 ",但這恰恰反映出學科間的交叉融合越來越廣泛深刻。一方面,物理、化學等基礎學科受到人工智能等新的研究方法影響,發展出全新的、數據驅動的研究範式。另一方面,人工智能本身也是計算機和數學、神經科學等領域交叉的産物,神經網絡、貝葉斯都極大推動了人工智能的演進。
袁越等學者指出,科學研究和創新正從因果關系走向 " 複雜系統 "。例如,獲得醫學或生理學獎的 microRNA 背後所代表的基因調控就是一個龐雜到無以複加的複雜系統,難以用簡單的因果鏈條加以解釋。神經網絡也是複雜系統的計算機模拟,呈現出 " 黑箱 " 狀态。
在大融合、大系統的背景下,AI for Science 已帶來科學界的新潮流,此次諾貝爾獎的 " 風向 " 指引性也很明顯。2024 年 5 月,英國皇家學會發布了《人工智能時代的科學:人工智能如何改變科學研究的性質和方法》報告。科學家們正扮演着導師、同伴或助手的角色,利用人工智能以史無前例的速度和規模執行任務;AI 則幫助識别大型數據集中的新模式和關系,預測新内容。除了 AlphaFold 等标志性案例外,AI 應用可見于所有 STEM 領域,包括醫學、材料科學、機器人技術、農業、遺傳學和計算機科學等。過去十年,與科學相關的人工智能專利申請激增,中國、美國、日本和韓國提交的專利數量占據主導地位,其中中國貢獻了約 62% 的專利。
英國皇家學會 2024 年《人工智能時代的科學》報告插圖
正如哈薩比斯在獲獎後表示,"AlphaFold 應該被視爲人工智能加速科學發現和造福社會潛力的證據 "。《知識分子》總結,應用人工智能方法分析數據、構建複雜生物現象的強大模型用例包括:用 AI 識别新的抗生素、揭示希格斯玻色子,建模和分析星系形成,篩選粒子對撞機或機器人望遠鏡産生的大量數據、尋找其中的規律,識别具有電池或太陽能電池所需特性的材料等等。
Game for science 同樣值得期待。科學研究過程呈現出複雜性和不确定性。不同領域間的相互啓發有如 " 蝴蝶效應 ",而遊戲正扮演那隻扇動翅膀的蝴蝶。遊戲是科技的産物,同時推動科技發展。如果沒有 3D 遊戲,或許先進 GPU 開啓的人工智能時代不會這麽快到來。遊戲更與智能有着非常緊密的連接,也是科技人才的搖籃,馬斯克、喬布斯、林納斯,許多領軍人物都受遊戲啓發而走進編程世界,探索創新邊界。
AI、遊戲與科學的故事,未完待續。
參考文獻來源:
2024 化學諾獎接力青睐 AI,蛋白質結構預測新工具獲一半獎項, 郭貝一、郭曉強 https://mp.weixin.qq.com/s/4ISr4rJRw_60O63ipvGWPQ
AlphaFold 開發者獲 2024 諾貝爾化學獎,AI 搶奪科學家的最重要榮譽,知識分子
https://mp.weixin.qq.com/s/BqO1-UN3hQ4Bagcp206_uw
今年的諾貝爾化學獎,意味着我們從此不需要科學家了?
https://mp.weixin.qq.com/s/ny4kbYctjBW7dzIKBAMu2g
DeepMind 創始人 Demis Hassabis:AI 的強大,超乎我們的想象,經緯創投
https://mp.weixin.qq.com/s/SaNX-zE7NG9jlHuPifv6Zw
騰訊遊戲年度發布會上提到的這款遊戲,你聽過嗎?, 騰訊互娛社會價值探索
https://mp.weixin.qq.com/s/OXiZTnVDxu23iezObLTWxw
玩遊戲玩出來的 Nature?,果殼 - 未來光錐
https://mp.weixin.qq.com/s/q8_oxouEUrTM2ijrqjTuzg
The challenge of designing scientific discovery games
https://grail.cs.washington.edu/projects/protein-game/foldit-fdg10.pdf
Demis Hassabis:from video game designer to Nobel Prize winner
https://www.theguardian.com/science/2024/oct/09/demis-hassabis-from-video-game-designer-to-nobel-prize-winner-google-deepmind-ai-
AlphaFold 2: Why It Works and Its Implications for Understanding the Relationships of Protein Sequence, Structure, and Function
https://pubs.acs.org/doi/10.1021/acs.jcim.1c01114?__cf_chl_tk=IzRdl._BLUB6TWJy7OjISGlkHoME4f_PgabMM3z2Ya0-1728619960-1.0.1.1-CRrp5_YPKHQtjlQo6ffFZwmGx8PpCyrFenJw2rM9go4
Science in the age of AI: How artificial intelligence is changing the nature and method of scientific research
https://royalsociety.org/-/media/policy/projects/science-in-the-age-of-ai/science-in-the-age-of-ai-report.pdf