超實時計算!智源模拟心髒,實現了生物時間與計算時間比爲 1:0.84。
一般來說,仿真時間與生物時間比達到 1:1,就已經算是實時計算了。而在此之前的虛拟心髒仿真系統還沒有實現過,如今,在更大規模和更高複雜度的心髒模型上實現了 180 倍的速度提升。
智源研究院開發了具有精細細胞電生理與解剖結構的人心室模型。
該模型包含了 19 種細胞生理狀态變量和 70 多個公式,能夠實現複雜的心髒電生理與病理仿真,爲臨床與醫藥工業應用提供豐富的場景。
構建虛拟生理心髒
心髒,作爲重要器官之一,其功能正常與否直接影響人類的生命延續。電生理特性反映了心髒的健康和疾病狀态。心髒電生理活動的異常,往往會導緻心律失常,從而引至心髒泵血功能衰竭等嚴重健康問題。因此,深入理解和研究心髒的電生理過程,對于提高心髒病的診斷和治療水平至關重要。
傳統的心髒電生理研究多依賴于實驗室内的動物模型和臨床數據,但這類方法往往受限于倫理問題、實驗條件和數據獲取的複雜性。随着計算技術的發展,計算機仿真成爲了一種新興且強大的研究工具。
通過建立數學模型和計算機程序,研究人員可構建數字孿生心髒,能夠在虛拟環境中仿真并重現心髒器官的電生理活動(虛拟生理心髒),分析其動态特性,并進行不同生理與病理條件下的實驗。
虛拟生理心髒的構建可利用生理組學的研究方法,綜合分子生物學、生物化學、生理學、解剖學及臨床醫學的最新成果,數學化以及模式化地整合從基因、蛋白質、細胞、組織到器官的解剖(多物理尺度:空間尺度跨越 10^9 量級,跨時間尺度:時間尺度跨越 10^15 量級,如圖 1 所示)、生理和生化信息,應用計算機強有力的計算和圖形顯示能力,通過賦予其心髒所具有的動力學特性、生化特性和各種生理病理特點,使之從形态、結構和功能等方面逼真地再現心髒的生理和病理活動過程。
△圖注 1:構建虛拟生化生理人體的時間和空間尺度。時間尺度橫跨由分子事件(µ s)、細胞信号傳導(ms)、細胞功能(s)到人體壽命 ( decades ) 的 10^15 跨度。空間尺度橫跨由分子(nm)、細胞(µ m)、器官(cm)到軀幹 ( m ) 的 10^9 跨越。
虛拟心髒電生理仿真對計算資源要求極高,即使是幾毫秒的仿真,也需要累積求解數十億次微分方程。使用複雜的虛拟心髒模型進行研究時,重現 1 秒鍾的心髒電活動也可能需要數小時或更長。這給虛拟生理心髒的臨床應用與藥物研發帶來重大挑戰。
在早期虛拟生理心髒研究中,心髒一個生物秒的電生理活動往往需要數日甚至數月來仿真計算。随着顯存技術的發展,這個時間縮短到數天。近年,有研究緻力于提升虛拟生理心髒的計算速度。比如通過将三維心髒空間劃分爲矩形子區域來實現并行心髒模拟 [ 9 ] ,使運算速度大大提升。另一項研究通過 WebGL 将高性能心髒模拟擴展到普通計算機上,甚至有 GPU 的手機也可以模拟三維心室的電動态。一些研究試圖通過自适應時間步長來提高運行速度,結果表明,固定時間步長比自适應時間步長方法具有更好的效率。
但這些研究僅能達到 " 準實時運算 ",離真正意義上的 " 實時運算 ",即仿真時間與生物時間比達到 1:1,還有難以逾越的距離,更不用說仿真精度的提升帶來的運算量爆炸式增長。高計算複雜度帶來的海量運算,使得虛拟生理心髒模型難以實現實時計算,阻礙其大規模應用。
爲解決這一問題,智源研究院開發了一套實時心髒電生理仿真系統。該系統不僅能夠實時模拟心髒的 3D 電活動,還能通過多種參數的調節,深入探讨不同生理、病理因素對心髒功能的影響。
這一實時心髒仿真平台,一方面可在醫學基礎研究領域發揮作用,幫助臨床醫生和研究人員更直觀地理解心髒的電生理過程,探究心律失常産生機制、預測猝死發生率等;另一方面,可用于構建虛拟藥物安全性評估平台,對推動藥物安全評估發展具有重要意義;更重要的是,可以在臨床應用中提供手術方案預演與決策支持,比如射頻消融方案規劃,心髒起搏器最佳植入方案規劃等。該技術的推進将爲醫學研究和臨床治療提供新的範式。
實時計算爲了在更高分辨率、更高精度和更大規模的心髒模型上實現實時仿真,智源研究院開發了具有精細細胞電生理與解剖結構的人心室模型。
爲實現實時計算,智源對模型底層計算進行了深度優化。針對心髒仿真中計算強度大和 I/O 密集等瓶頸問題,智源充分結合 A100 平台的硬件特點,設計了多種優化策略,如量化和循環展開。這些措施有效降低了計算複雜度和 I/O,使得在更大規模和更高複雜度的心髒模型上實現了 180 倍的速度提升。
最終,智源虛拟心髒仿真系統實現了對心髒電生理功能的實時仿真,達到生物時間與計算時間比爲 1:0.84。這一成果不僅提升了心髒仿真系統的性能,還爲更廣泛的醫學研究和臨床應用提供了強有力的支持,标志着心髒仿真技術的又一重大裏程碑進展。
△圖注 2:實時心髒計算概覽圖
技術路線
在 GPU 的架構設計中,順序訪問内存(如連續的數據訪問)相較于随機訪問具有更高的性能。此外,在執行順序訪問時,通常會采用預取技術提前加載數據,以進一步提高訪問效率。
同時,在虛拟心髒模型中,大約有 2/3 的物理空間位置是空餘腔體空間,有效心肌組織僅占 1/3 的物理空間。心髒仿真的主要計算和 I/O 操作都集中在對有效心肌組織中的每一個單細胞中的離子通道和細胞膜電位進行時間上的更新,同時考慮鄰近細胞的電耦合影響。
基于 GPU 訪存特點和心髒解剖結構的特殊性,智源設計了适合稀疏數據的數據結構。利用順序訪存提升 I/O 速度,确保并行線程僅處理有效細胞,從而最大限度地提高 GPU 内存的利用率。通過這種創新的結構,顯著優化了計算性能,使得心髒仿真能夠在 IO 訪存上達到最優效果。
△圖注 3:心髒模型有效數據在 GPU 内存上的排布
在計算層面,采用量化策略,有效簡化模型中的對數和指數等複雜計算,從而顯著降低了計算複雜度。
此外,爲進一步減少 I/O 操作次數,采用循環展開策略,實現在一次讀取中進行多次計算,大大降低 I/O,顯著提升 SM 核心的計算利用率。
基于 A100 平台,智源設計了高效的 P2P 通訊方式,利用 GPU 直連實現在節點内快速的數據交換,确保數據傳輸的低延遲與高帶寬。在節點之間,采用 RDMA(遠程直接内存訪問),進一步增強跨節點數據傳輸的效率,充分發揮硬件平台的并行計算與通訊能力。
△圖注 4:技術路線圖仿真結果
團隊測試了不同優化策略對仿真 2 生物秒心髒功能所用計算時間的影響,結果如下圖所示。
對 2 生物秒心髒功能的模拟,基準模型在未優化的情況下 A100 單卡需要計算時間爲 304.25 秒。在采用分布式、量化、循環展開策略後,其所用時間分别是 9.75、3.93、1.68 秒。其中采用循環展開後,計算時間達到 2 秒内,達到計算時間 / 生物比小于 1,實現實時 / 超實時計算的要求。其中,分布式計算對于系統仿真速度影響最大,達到了 32 倍提速。量化策略和循環展開策略分别将仿真速度提升了 2.48 和 2.34 倍。在同時采用分布式、量化、循環展開策略的情況下,系統仿真速度整體提升了 181 倍。
△圖注 5:不同優化策略的計算時間
△圖注 6:不同優化策略的速度提升
拓展曲線
△圖注 7:不同優化策略的拓展曲線
如圖 7 擴展曲線所示,随着 GPU 卡數的增加,基準模型和優化後的模型仿真時間都在減少。基準模型在增加到 48 卡後,計算時間不再減小。此時的生物:計算時間比爲 1:5。再采用量化和循環展開策略後,32 張卡即可實現實時計算,生物:計算時間比達到 1:0.84。
主要 GPU 指标
△圖注 8:不同優化策略的計算密度和計算強度
△圖注 9:不同優化策略的内存和 SM 利用率
通過 GPU 指标可以看出(圖 8,圖 9)量化策略通過提升 IO 同時降低計算的方式提高整體計算性能;循環展開通過大幅度降低 I/O 同時提高計算密度的方式提高計算性能。
計算精度
團隊統計了加速前與加速後的結果誤差,仿真的膜電位 V 的時程差别 <2 ms ( 0.6% ) ,模電位平均誤差爲 0.72mV ( 0.4% ) ,均滿足生理準确度要求。優化前後主要離子通道的仿真曲線吻合(如圖 10 所示)。
△圖注 10:仿真前後細胞主要離子通道電流與胞内離子濃度在一心律節拍間的變化
最後總結,智源研究院從心髒模型的解剖結構、心肌細胞電生理的計算特點及計算系統的硬件架構出發,設計了心髒仿真系統的數據結構和優化策略,以提高計算效率。智源采用先進的并行處理方法,充分利用現代 GPU 設備的強大計算能力,優化數據傳輸和通訊方式,以減少延遲并提高數據吞吐量。通過這些策略,不僅提升了仿真系統的計算速度,還保證了在可接受誤差範圍内的計算精度,最終成功實現了心髒仿真的實時計算目标,達到超實時計算結果。
這一成果爲進一步研究心律失常産生的離子通道與分子機制等關鍵醫學問題,也爲手術規劃如房顫射頻消融方案等臨床應用,以及新藥研發與其心髒安全性篩選奠定了堅實基礎,同時也爲其它超大複雜物理系統的實時仿真提供堅實基礎。
* 本文系量子位獲授權刊載,觀點僅爲作者所有。
— 完 —
量子位 QbitAI
վ ' ᴗ ' ի 追蹤 AI 技術和産品新動态
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>