出品 | 虎嗅醫療組
作者 | 陳廣晶
編輯 | 王一鵬
頭圖 | 視覺中國
在商業化上磕磕絆絆幾十年的 AI 制藥,終于讓更多大藥廠慷慨解囊了。
就在 10 月 10 日,百度 CEO 李彥宏創辦的 AI 制藥公司百圖生科,首次官宣與跨國大藥企的戰略合作協議——雙方将基于百圖生科的生命科學大模型,共同開發生物治療藥物發現的模型。
在這一合作中,賽諾菲将支付百圖生科 1000 萬美元的預付款,加上多項有望近期支付的模型開發款、裏程碑款等,交易總金額将超過 10 億美元。
" 本次合作是生命科學領域中基于基礎模型的最大規模合作。" 百圖生科首席技術官宋樂博士如此評價道。
宋博士這一結語中,有一個關鍵的限定詞,就是 " 基于基礎大模型 "。
近年來,AI 與生命科學的合作越來越多、範圍越來越廣、規模逐年提高。
就在百圖生科官宣此次和賽諾菲的合作以前,9 月 27 日,諾和諾德中國宣布的一項與美國科技公司 Valo Health 的合作,就是要利用人工智能來發現和開發心髒病、中風、糖尿病等疾病新療法的。這一合作總額不超過 27 億美元,首付款和近期裏程碑款總額 6000 萬美元。5 月 31 日,晶泰科技也官宣了與禮來一項總規模 2.5 億美元的合作。此前艾伯維等全球知名藥企也都在積極與 AI 制藥企業合作。
根據生物技術市場研究機構 Deep Pharma Intelligence 的統計,2017 年到 2023 年 6 累計的合作數量 232 起。其中巅峰數據是 2022 年,一年就達成合作 66 起。這些合作的預付款金額從幾千萬到上億美元,這也是決心的體現。該組織的研究者更是認爲,在研發模式轉向 " 以數據爲中心 " 的創新模式後,大藥企對 AI 制藥的态度已經從 " 懷疑和謹慎的興趣 ",轉向認爲 AI 應該發揮戰略性作用。
此次賽諾菲與百圖生科的合作,已延伸到了大模型研發的環節,标志着 AI 與制藥的結合更加深入了。
事實上,AI 制藥作爲投資界的寵兒,一直沒能達到制藥界的期待。盡管 AI 技術在小分子晶型預測、化合物篩查、密碼子優化等方面,幾乎是标配了,也确實可以達到降低成本,加速研發的作用,但是,這些都還是集中在臨床前階段,在花費巨大的臨床試驗階段作用仍然有限,時至今日到底能将新藥成功率提高多少還很難說。
在這種情況下,藥企對 AI 的态度爲什麽變了?更多藥企重視 AI、增加投入,真的能幫助 AI 制藥企業撕掉 " 不賺錢 " 的标簽?在其背後,AI 制藥企業的發展趨勢發生了怎樣的變化?
2017 年以來,AI 制藥企業與大藥廠的合作情況。
來自:Deep Pharma Intelligence
生成式大模型帶來新的可能性
藥企越來越青睐 AI 制藥,主要得益于大模型和大分子碰撞迸發出的火花。
" 大分子藥物的設計、大分子本身維度的困境,事實上是和生成式大模型最好的結合點。"智源研究院顧問、美國國家工程院(NAE)外籍院士張宏江院士在今年 9 月召開的 " 第二屆中國生物計算大會 " 上公開表示。
長期以來,新藥研發的過程一直是 " 靠天吃飯 "。在小分子時代,新藥研發的過程中,化合物篩選就占據了很大的工作量。從各種可能的分子空間中找到能夠對特定靶點或基因起效,并且可以在人體内穩定發揮作用的分子,往往需要幾個月,盡管這些分子還比較簡單,一般由 10 到 500 個原子組成。
比如百濟神州成功出海美國的澤布替尼(BTK 抑制劑),其編号是 BGB-3111,其寓意就是百濟神州成立後合成出來的第 3111 個化合物,而爲了找到這個分子,研究人員一共合成化合物的總數超過了 1.5 萬個。
進入大分子時代,由于藥物本身更加複雜,篩選的難度也在提升——一般蛋白質有幾百個氨基酸,空間結構已經可以達到 10 的 300 次方個,如果再算上與靶點的結合,至少還要加上幾十個數量級;過去兩年在抗擊新冠疫情中立功的 mRNA 疫苗,比蛋白質更加複雜,其序列可達 10 的 600 次方種之多。
數據量大的問題,在各種小分子與大分子、大分子與大分子的組合、偶聯正逐漸成爲新藥研發主流的今天,變得更加嚴峻,數據量不僅超出了人類推理思考的極限,普通計算機的算力也逐漸難以支撐。
來自:視覺中國
藥企已經越來越無法承受 " 開盲盒 " 式新藥開發帶來的成本壓力。加之過去三年,在全球對抗疫情的大戰中,制藥界新秀們利用 mRNA、AI 等新技術,搶占了先機,已經給行業老前輩們結結實實上了一課。大藥企們已經再不敢小觑 AI 技術了,這也體現在了公司的戰略布局上。
比如:此次與百圖生科合作的賽諾菲,在新冠疫情以後,先後高調宣布布局 mRNA 和 All in AI。
從該公司與百圖生科合作的情況看,除了利用大模型開發藥物,還涉及 AI 大模型的開發——開發用于生物制劑設計和優化的特定任務模型。
也就是說,跨國藥企與 AI 制藥企業的合作已經不僅僅局限于 " 金子 ",而更在于點石成金的 " 手指 " 了。
在其背後,關鍵的一點在于,大模型有望解決長期困擾 AI 制藥的優質數據供不應求的問題,更快破解生物醫藥研發的密碼。根據百科生科相關負責人在關于與賽諾菲合作的公告中所說,經過預訓練的基礎模型基礎上,下遊任務模型可通過有限數據做出精準預測。
基于大模型在自然語言中的表現,有科技領域投資人認爲,大模型完全有可能以一種人類不能理解的方式,從海量未标注數據中總結出新藥研發的規律,再以人類能夠理解的方式輸出。而根據百圖生科此前公布的信息,大模型還可能模拟人體免疫系統,達到提前驗證藥物安全性、有效性的目的。
對于賽諾菲來說,投入幾千萬美元 " 量身定制 " 一個 AI 大模型,既有可能盤活自家數十年積累數據,也押寶未來,賭一個徹底改變新藥研發靠天吃飯命運的可能性,可以說,是非常值了。
AI 制藥的商業化路徑要通了?
百圖生科公開的數據顯示,他們在生命科學領域構建起人工智能大模型 xTrimo,已經有超過 1000 億參數,在抗體結構、抗體親和力、酶功能、免疫細胞功能等 20 多個下遊預測任務中實現了 SOTA 表現(虎嗅注:也就是新技術的最佳表現的意思)。
如果大模型功能确實如此強大,有賽諾菲積累 50 年專有數據集的加持,AI 制藥技術可以跑得更快。而越來越多藥企的加入,也有望讓 AI 在生命科學領域的 "ChatGPT 時刻 " 更快到來。
不過,這還不意味着,AI 制藥就要跑通商業化路徑了。
自從 2007 年,AI 技術首次正式用于藥物發現領域以來,爲了解決商業化問題,相關企業就探索了很多模式。這裏面最爲大衆熟知的就是買軟件(AI+SaaS)、賣服務(AI+CRO)、賣管線(AI+Biotech)。
在全球創新藥投資遇冷的背景下,原本服務産業的前兩種模式逐漸呈現頹勢,特别是集中在臨床前某一個具體細分領域提供服務的模式,雖然現金流尚可,但是發展前景已經不被看好。
" 越來越回歸到制藥的邏輯上來了。" 浙江大學藥學院教授謝昌谕告訴虎嗅。
Alphaford 成功預測蛋白質結構,還隻是 AI 影響制藥界的開始。
來自:Nature
客觀來說,龍頭藥企對 AI 制藥産業發展确有非常重要的作用,可是,從曆史經驗看,大藥廠能爲 AI 制藥企業業績增長貢獻的力量,一直是少得可憐。
從曆史數據看,即便是有 " 全球 AI 制藥第一股 " 之稱的 " 薛定谔 ",有 30 多年銷售 AI 制藥軟件的曆史,TOP20 大藥企都是其客戶,它每年從與大藥企合作中拿到的錢也非常有限。
根據該公司财報,這些大藥企每年給薛定谔貢獻 2000 萬美元的營收,平均每家 100 萬美元,這也已經頂到了各家藥企對 AI 投入的天花闆了。這樣的收入水平隻能維持薛定谔每年 20% 的業績增長,既不能向投資人交代,也很難突破自身發展的瓶頸。
這也從側面說明,大藥企的慣性仍然存在。" 他們雖然也用了很多 AI 計算,但是習慣性仍然會依賴實驗做配合。" 謝昌谕告訴虎嗅,這意味着大藥企對 AI 的使用還遠遠不夠,提供 SaaS 軟件的 AI 公司未來也有一定成長空間,中國也有望跟上,但是都需要時間。也許企業和資本都等不起了。
而提供 CRO(合同研發)服務的公司,通過與藥企的合作可以獲得較好的現金流,不過,在整個創新藥投資遇冷、CRO 競争激烈的情況下,注定隻能保持低利潤運營。這決定了他們 " 即使短期可能是不錯的賽道,後期壓力會很大 "。謝昌谕向虎嗅表示。
相比之下,"AI+Biotech" 逐漸成爲最有潛力的方向。就在今年年初," 薛定谔 " 已經開始努力撇清與 AI 的關系了,而将自身定義爲軟件 + 制藥公司,就像一家 " 使用 Office 軟件的公司 ",實際上也在向 Biotech(生物科技公司)靠攏。
即便是 "AI+CRO" 方向,龍頭企業晶泰科技也不滿足于爲藥企提供服務了。從晶泰科技的官網看,已經有 13 個自研管線,既有小分子也有大分子,前沿的 PROTAC、ADC 都在其列。
相比單純的平台或軟件銷售公司,有産品的公司商業化價值更高。
就在今年 9 月,中國 "AI+Biotech" 龍頭英矽智能将一款處于臨床一期的在研藥物 license-out(對外許可)給美國上市藥企 Exelixis 公司,預付款就有 8000 萬美元,是中國生物醫藥小分子領域最大的一項交易,這也讓行業人士感受到 AI 制藥,以賣出在研管線的方式實現商業化突破的可能性。
不過,這條路到底能不能跑通,還要看後續藥物推進是否順利,裏程碑款能否一一 " 落袋 "。而且這是一條非常難的路,隻有少數企業能夠走通。
AI 制藥發展進入 " 硬碰硬 " 階段
AI 制藥的能量一直是被高估的。制藥企業期待 AI 制藥可以解決所有不能成藥的靶點,想降低臨床試驗費用、提高臨床試驗成功率。這些還沒有辦法滿足的過高期待也指向,AI 制藥不能再避重就輕,不僅要解決臨床前的問題,還要解決臨床問題。
而要在臨床試驗中,在記錄數據之外,有更多作爲,就需要克服至少四方面問題。
首先," 數據仍然是最核心的問題," 謝昌谕說道,"AI 制藥要進入臨床階段,相關數據太少是最大的問題。"
在醫療領域,醫聯 MedGPT 項目負責人王磊曾透露,如果沒有經過醫學專業數據的訓練,即便是 ChatGPT 在回答醫學問題時也不盡人意。
這也表明高質量的專業數據,對 AI 而言非常重要。制藥比材料更難,從蛋白質到藥,除了知道序列、結構還要知道對應的功能,這方面的信息仍然不足。
臨床前數據的問題,AI 制藥公司已經在用自動化實驗室的 " 濕實驗 " 和高通量計算機的 " 幹實驗 " 解決了,但是在臨床階段,優質數據不多,且還存在分享不通暢等問題沒有真正解決。
大量的數據還是 " 藏 " 在藥企内部,特别是大量失敗的數據,相比發表出來的成功案例,這些數據更有價值。這些數據是藥企真金白銀砸出來的,被藥企視作珍寶,是重要的商業機密,過去幾十年裏,各大藥企之間也是互不相通的,這造成了很多重複研究和浪費,但是藩籬始終很難拆除。
本來,AI 制藥企業與大藥廠合作的目的也是想解決這個問題。上海市經濟信息中心陳銀玉今年 2 月的一篇撰文中就曾總結稱,AI 制藥市場主體合作模式中," 大型藥企 + 創業公司 " 已經成爲主流。在這種模式中,AI 制藥初創公司,可以利用頭部藥企的資金、成果轉化、市場優勢,提高藥物創新效率。
而現在随着 AI 制藥公司爲藥企提供的服務越來越 " 定制化 "" 個性化 ",某種程度上,也意味着數據壁壘正在加厚。因爲這種方式下,藥企可以在技術的 " 高牆 " 之内,玩轉自有數據,其他組織更難沾邊。
AI 制藥公司想靠自主研發來獲得臨床數據,也因門檻高、花費大很難實現。對于 AI 制藥公司來說,即便可以拿到藥企數據,這些數據不規範、不統一,甚至沒有實現數字化,也是非常棘手的問題。
某知名藥企研發實驗室
其次,人才問題也是 AI 制藥産業發展的一大障礙。在起步較晚的中國尤其如此。
在上述撰文中,陳銀玉指出,約 90% 以上的 AI 制藥企業選擇跨界合作推進 AI 新藥研發,但是,因爲複合型人才匮乏,藥物研發團隊和 AI 團隊難以融合。有 40% 的藥物研發科學家不了解 AI 技術。
而對于很多 AI 制藥公司,制藥人才缺乏也非常關鍵。可以看到,英矽智能之所以可以有産品如此快速推進到臨床二期,與聘請到制藥界資深人士任峰做高管有很大的關系。
中國醫學科學院的郭旭、王鈴在《AI 制藥産業發展瓶頸和對策》一文中指出,要解決這一問題,高校應适當提高相關專業碩士、博士的招生名額。 探索 " 高校 + 企業 " 聯合培養人才的模式。同時,加強海外人才的交流和引進,爲其創造好的創新創業環境。
隻是,整個環境的升級,也不是短期内可以解決的。
第三,中國在政策法規、産業标準體系等方面還不盡完善。陳銀玉認爲,AI 研發工具缺乏統一的獨立測試數據庫及有效的評價标準,是引發無序競争、低水平重複建設等問題的關鍵,同時,缺乏對高質量靶标等核心數據的積累、嚴謹的知識産權保護等,也不利于産業發展。
要解決這些問題,都需要從官方層面有更多的突破。
第四,也是最重要的,必須有一款由 AI 從頭設計的藥物獲批上市。這其中除了需要更多 AI 設計新藥進入臨床,也需要 AI 技術的叠代更新。
同濟大學生物信息系長聘教授劉琦在第二屆生物計算大會中就曾指出,Transformer 在 AI 結構中隻是一個非常小的點,對于 AI 技術發展來說是一個起點。在生命科學領域,未來 " 一定會有更加優秀、有效的架構被提出來 "。
據市場調研機構 Research And Markets 預測,到 2026 年,AI 制藥的市場規模有望達到 29.94 億美元(約合人民币 231.9 億元)。這幾乎是 2022 年 AI 制藥市場規模的三倍;相比過去 9 年全球累計投入到 AI 制藥領域的 600 多億美元,還隻是零頭。
在快速狂奔的過程中,大藥企的加盟固然重要,法規政策和 AI 制藥企業自身能力突破,更加關鍵。這也意味着,AI 制藥還有很長的路要走。