現在,強化學習不僅能下圍棋,還能設計蛋白質了!
RoseTTAFold 團隊獨創性方法,利用強化學習、自上而下設計蛋白質複合物結構,登上最新一期 Science。
利用該方法,團隊設計出了上百個蛋白質結構。
經電子顯微鏡等觀測證實,這些結構大部分都能在實驗室中合成。
而且預期納米結構和實際納米結構之間的平均偏差小于單個原子直徑,即實現了精确原子級設計。
在實際應用上,由該方法設計出的蛋白質能有效在小鼠體内産生有用抗體,并爲未來開發出更有效的疫苗和藥物創造可能。
因此團隊表示,這是 AI 設計蛋白質領域的一個裏程碑式研究,或将爲蛋白質設計領域開創新時代。
作爲 AI 設計蛋白質領域的明星團隊,華盛頓大學 David Baker 教授曾率隊開發出精度上可媲美 AlphaFold2 的蛋白質預測設計方法RoseTTAFold。
并在實際計算中達到了更快更輕便的效果,隻需要一個英偉達 RTX2080 GPU,10 分鍾就能算出蛋白質結構。
先給預設再不斷優化
強化學習的原理,就是通過不斷地試錯學習,讓 agent(智能體)通過與環境進行交互獲得獎賞指導行爲,目标是獲得最大的獎賞。
将它應用到蛋白質設計方面,科學家們爲程序提供了數百萬個簡單的起始分子,然後讓軟件進行一萬次嘗試,随機地改善每一個預定目标。
程序将以特定方式拉長或彎曲蛋白質,直到學會如何将它們設計爲所需的結構。
該方法先給出了先驗約束和得分函數定義目标結構,然後通過強化學習不斷探索,以得到定制化的構建模塊。
它有别于此前自下而上的設計方法。程序将不再局限于依據已知的寡聚體原件來設計蛋白質,并能從全局角度來優化整個蛋白質結構。
然後再通過蒙特卡洛樹搜索算法,确定骨幹生成。
該方法能實現給出一個 " 遊戲狀态 " 并選擇勝率最高的下一步。AlphaGo 中應用了這一原理。
在展開的每個階段,如果出現了違規情況就中止搜索樹;在模拟完成後,則通過一系列分數函數進行最終評估。
結果表明,面對傳統 " 自下而上 " 方法無法構建的蛋白結構,最新方法不僅能設計結構,而且結果和冷凍電鏡結構和計算機模型非常接近。
研究人員構建了數百種結構後表示,這些結構中的大多數都能在實驗室中構建。
而且團隊表示,這種方法不僅準确性高,還高度可定制化。
比如可以要求它設計出無孔隙、小孔或大孔不同要求的球狀結構,這種能力還有待進一步挖掘。
據了解,該團隊緻力于設計由許多蛋白質分子組成的新型納米級結構。這需要設計蛋白質組件,并能夠讓納米結構自組裝。
在由 AI 設計的結構中,每個原子都出現了預定的位置上。即預期結構和可實現納米結構之間的平均偏差不到一個原子的直徑,這也可以被稱爲精确原子設計。
由此團隊認爲,這種方法能夠設計出藥物、疫苗等方面的蛋白。
華盛頓大學幹細胞和再生醫學研究所的研究人員使用血管細胞中的原代細胞(Primary cells)模型,證明了新方法設計的蛋白質結構優于此前方法。
比如在結構上構建出了更爲聚集的信号接收受體,這提升了血管的穩定性。
團隊介紹
該研究來自華盛頓大學 David Baker 教授團隊。
David Baker 現在是華盛頓大學蛋白質設計研究所所長。1984 年在哈佛大學本科畢業,後赴加州大學伯克利分校攻讀博士學位。
他緻力于研究蛋白質結構預測、設計以及蛋白質折疊機制等領域。是利用 AI 探索蛋白質結構領域的大佬級人物。
最爲人熟知的工作是RoseTTAFold。
這種蛋白質結構設計方法,不僅在精度上媲美 AlphaFold2,并且在算法上更輕便。更有意思的是,它和 AlphaFold2 同天開源,一個登 Sciecne,一個登上 Nature。
去年,該團隊還提出了一種新的蛋白質設計策略,針對幾乎任何感興趣的靶點蛋白,RoseTTAFold 都能設計出與之緊密結合的蛋白質分子作爲候選藥物,應用可覆蓋癌症、新冠等諸多疾病。
而後該團隊發表在 Science 上的研究表明,機器學習可以比以前更快速和精确地構建蛋白質分子。
值得一提的是,在産業化方面 David Baker 以科學聯合創始人身份,加入了英國 AI 創新藥企 CHARM Therapeutics,去年該公司獲得了 5 千萬美元融資。
論文地址:
https://www.science.org/doi/10.1126/science.adf6591
參考鏈接:
https://phys.org/news/2023-04-board-games-protein.html