AI 藥物研發是人工智能未來應用的重要方向之一。
自新冠病毒(SARS-CoV-2)首次爆發以來,新冠病毒的小分子藥物研發備受關注,于近期舉行的首屆 AI 藥物研發算法大賽便聚焦于此。
在比賽中,來自微軟研究院科學智能中心的團隊,憑借創新的 AI 模型系統 AI2BMD 和 ViSNet 取得了絕佳的成績,斬獲桂冠。
近日,由清華大學藥學院、百度飛槳、百度智能雲和臨港實驗室聯袂主辦的首屆 AI 藥物研發算法大賽公布了比賽結果,來自微軟研究院科學智能中心的團隊,利用研發的量子精度動力學模拟系統 AI2BMD 和通用分子三維結構網絡 ViSNet 在初賽、複賽、決賽中均位列第一,并獲得大賽的總冠軍,展現了 AI 在促進藥物研發方面的應用潛力。
微軟研究院科學智能中心團隊獲得首屆 AI 藥物研發算法大賽冠軍
本次大賽由中國藥學會等機構支持,共有來自全球的 878 支團隊參賽。作爲一場全球性的技術創新活動,此次大賽聚焦于新冠病毒(SARS-CoV-2)小分子藥物研發。
事實上,自新冠病毒首次爆發以來,新冠病毒的小分子藥物研發就備受關注。
若要抵抗新冠病毒肆虐,深入了解病毒複制與感染機制至關重要。其中,新冠病毒主蛋白酶(Mpro)作爲關鍵酶,負責感染過程中剪切病毒産生的蛋白質前體,促進病毒複制,所以主蛋白酶是一個潛在的治療靶點,抑制其活性可有效幹擾病毒的複制過程,爲治療方法提供突破口。
因此,本次比賽的初賽階段,參賽者需要使用深度學習、分子對接等方法進行建模,預測小分子抑制主蛋白酶活性的概率,複賽則重點關注小分子在 Caco 細胞上抑制新冠病毒複制的概率。
在初賽對新冠病毒主蛋白酶的藥物預測中,面對常用分子對接軟件無法有效區分正負樣本與靶點蛋白結合自由能的問題,微軟研究院科學智能中心團隊利用了最新開發的 AI2BMD 模拟系統,将藥物預測精度顯著提升。
AI2BMD 模拟系統實現了對超 10000 原子的各種蛋白質能能量和力的精确計算,并具有廣泛的适用性。相較于密度泛函理論(DFT),AI2BMD 模拟系統的計算時間縮短了數個數量級。
憑借幾百納秒的動力學模拟,AI2BMD 展現了在探索蛋白質構象空間、預測核磁共振實驗數據以及模拟蛋白質折疊過程等方面的卓越能力。與傳統分子對接、經典動力學模拟方法相比,AI2BMD 系統在計算結合自由能方面也有明顯優勢。
AI2BMD 模拟系統論文鏈接:https://www.biorxiv.org/content/10.1101/2023.07.12.548519v1
複賽中,團隊運用自主開發的分子建模幾何深度學習模型 ViSNet 化合物分子進行了表征學習。ViSNet 是 AI2BMD 模拟系統中的機器學習勢能函數。
作爲一種等變的幾何增強圖神經網絡,ViSNet 能在線性計算的複雜度下提取幾何特征(距離、角度、二面角等)。在多個分子動力學基準(包括 MD17、rMD17 和 MD22)上,ViSNet 表現均優于其他先進方法,同時也在 QM9 和 Molecule3D 數據集上實現了卓越的量子化學性質預測。
團隊在複賽階段,還利用自主研發的首個蛋白大分子全構象空間數據集 AIMD-Chig 和小分子公開數據集 OGB 分别對蛋白和小分子的三維結構表征進行了預訓練,然後通過多任務學習對模型進行微調。
該方法不僅取得了最佳的預測精度,而且以大比分領先比賽的第二名團隊。在最終的決賽答辯中,微軟研究院科學智能中心團隊的新冠藥物預測算法方案取得了總分 99.60 分的絕佳成績,相較比賽亞軍 90.76 分、季軍 85.31 分的最終成績具有顯著優勢。
微軟研究院科學智能中心團隊提出的新冠藥物預測算法方案
通過此次藥物研發大賽,微軟研究院科學智能中心開發的量子精度動力學模拟系統 AI2BMD 展現了出色的實際應用潛力。
未來,AI2BMD 有望在生命活動的分子機理解釋、藥物設計、酶催化等方面進行更廣泛的探索,助力 AI 藥物研發的加速發展。
雷峰網雷峰網