機器之心報道
編輯:澤南、杜偉
用人工智能挑戰最緻命的癌症。
日常生活中,我們經常會與人工智能進行互動,從解鎖手機,使用搜索引擎到地圖導航 ……AI 正在爲我們帶來越來越多的便利。不過在臨床醫學中,AI 技術的應用速度要慢得多,絕大多數診斷和治療建議仍然完全基于人類判斷。
直到最近,AI 在醫療影像的新突破,讓事情有了變化。
上周,最新一期自然雜志子刊《自然醫學》(Nature Medicine)上一個名爲「PANDA」(PAncreatic cancer Detection with AI)的胰腺癌早篩 AI 模型正式亮相,成爲了人們熱議的話題。
該研究通過「平掃 CT+AI」的方法,讓我們首次擁有了大規模早期胰腺癌的篩查手段。
據研究團隊介紹,PANDA 早期篩查模型的特異性達到了 99.9%,這意味着每 1000 次測試中隻出現一個假陽性;其檢測胰腺腫瘤的能力可達 92.9%;鑒别胰腺癌的能力比放射科醫生獨立判斷時的平均表現提高了 34.1%。
這或許是人類在與「癌症之王」胰腺癌的鬥争中第一次掌握了主動權。《自然醫學》對此還專門刊發評論文章:「基于醫療影像 AI 的癌症篩查即将進入黃金時代」。
癌症的早篩一直被認爲充滿挑戰,人們一直期待出現一種簡便通用的技術,來對大規模無症狀人群進行癌症篩查。利用 AI 算法的 PANDA 或許會成爲給我們帶來希望。
破解「癌症之王」
關于胰腺癌, 我們可以列舉兩個殘酷的數據:平均五年生存率不到 10%,80% 的情況下發現就是晚期。時至今日,胰腺癌已經成爲中國乃至全球生存率最低的惡性腫瘤。
圖片來源:http://www.china-rt.cn/special/856.html
胰腺癌早期發現困難的原因之一在于其明顯症狀很少,而且在癌症進展之前很難進行自願檢查。此外,由于胰腺位于身體最深處,一些影像學檢查(例如腹部超聲檢查)可能無法顯示整個胰腺。而增強 CT、增強 MRI、PET 等影像診斷,由于需要注射造影劑、輻射劑量、檢查周期長、費用昂貴等原因,不太适合用于大規模胰腺癌篩查。
在體檢及醫院常用的平掃 CT 圖像上,同樣由于圖像對比度低,很難識别早期胰腺病變,容易出現漏診或誤診。
因此,胰腺癌的早篩早治具有重要的臨床意義,在篩查手段上進行革新也顯得尤爲必要和關鍵。AI 技術或許能夠幫助我們解決這個問題。
在 PANDA 論文中,基于阿裏達摩院的醫療 AI 技術,上海市胰腺疾病研究所、浙江大學醫學院附屬第一醫院、中國醫科大學附屬盛京醫院、複旦大學附屬腫瘤醫院、布拉格查理大學第一附屬醫院、上海交通大學醫學院附屬新華醫院、約翰霍普金斯大學等機構首次提出以「平掃 CT+AI」進行大規模的胰腺癌早期篩查。
PANDA 模型在這十多家頂尖醫療機構進行了大規模多中心驗證,顯示了穩定的泛化性能。此外,在上海市胰腺疾病研究所的體檢、急診、門診、住院等場景中實驗,僅通過最簡單的平掃 CT,就在 2 萬多真實世界連續病人群體中發現 31 例臨床漏診病變,至今已有兩例早期胰腺癌病患已完成手術治愈。
目前,這項研究成果已向全球醫生和研究人員開放。
這也是中國放射影像領域的科研成果首次登上《自然醫學》雜志:
論文鏈接:https://www.nature.com/articles/s41591-023-02640-w
開放地址:https://g.alicdn.com/medical-engineering/d3viewer/0.0.87/index.html#/panda
在 AI 加醫療領域,我們見證過很多醫療影像的研究成果,本次登上 Nature 子刊的工作有哪些創新之處?首先,針對胰腺癌變位置隐匿、在平掃 CT 圖像中無明顯表征等特點,達摩院爲 PANDA 設計了獨特的深度學習框架,模型概覽圖如下所示。
上圖 a 爲模型開發,PANDA 以平掃 CT 爲輸入,輸出可能發生胰腺病變(包括 PDAC 和其他 7 種非 PDAC 亞型)的概率和分割掩碼。PANDA 接受了病理學确認的病患級标簽和增強 CT 圖像上标注的病變掩碼的訓練。b 爲模型評估,評估 PANDA 在内部測試組、平掃和增強 CT 、外部測試組、胸部 CT 組等真實世界多場景研究中的性能。c 爲模型臨床轉化。
達摩院醫療 AI 高級算法專家、也是這次 PANDA 項目負責人張靈進一步解釋稱,PANDA 并不是一個單純的視覺分割模型,它兼具了分割、檢測和分類功能,其深度學習框架(下圖)包括以下三階段,每個階段「各司其職」。
第一,通過構建分割網絡(U-Net)來定位胰腺;
第二,采用多任務網絡(CNN)來檢測異常情況;
第三,采用雙通道 Transformer 來分類并識别胰腺病變的類型。
達摩院在 PANDA 模型的訓練策略上也做了一系列技術創新,從而實現了高效、安全的大規模胰腺癌早篩。其中的關鍵在于如何更加準确地識别平掃 CT 圖像中肉眼難以識别的細微病例特征。
同樣重要的是數據,AI 篩查模型的訓練需要醫生手工标注大量腫瘤,但平掃 CT 圖像對比度極低導緻醫生幾乎無法标注。達摩院醫療 AI 團隊先讓合作醫生們在增強 CT 上勾畫,然後利用提出的知識遷移訓練方法,通過精确的适用于腹部 CT 圖像配準的算法将增強 CT 上的先驗知識遷移到平掃 CT 相應位置。這樣一來,以往 AI 識别癌症普遍存在的勾畫難、标注難、訓練難等問題得到有效解決。
同時,由于該研究主要通過腹部 CT 訓練,而現實中胸部 CT 大量存在,達摩院算法團隊提出一種基于模拟裁剪的數據增強方法,解決了模型泛化到胸部 CT 通常可能出現胰腺腫瘤掃描不全的問題。
得益于 PANDA 訓練架構和策略的創新,該研究構建了迄今最大的胰腺癌腫瘤 CT 訓練集(包含 3208 名真實病人)。該 AI 算法在一個由全球十多家醫院約 6200 名患者組成的多中心隊列中進行了驗證,其中包括确診的胰腺癌病例和無胰腺病變的對照病例。
随後,PANDA 進一步在包含 20530 名真實世界連續病例的多場景驗證中測得了 92.9% 的敏感性(判斷存在胰腺病變的準确率)和 99.9% 的特異性(正确判斷無病的幾率)。
截至目前,PANDA 模型已在醫院、體檢等場景被調用超過 50 萬次,幫助醫生成功發現多起臨床漏診的早期胰腺腫瘤病例,平均每 1000 次隻出現一次假陽性。研究人員表示,未來還将持續進行多中心前瞻性臨床驗證, 以期改寫「胰腺腫瘤不推薦篩查」的悲觀論點。
複旦大學附屬腫瘤醫院放射診斷科主任顧雅佳教授表示,這篇論文提出了一種有潛力的大規模胰腺癌篩查方法,在提升檢出率的同時,又不會給病人帶來額外的輻射與經濟負擔,「設想一下,我們去體檢時做個最簡單的平掃 CT,就能查出有無胰腺癌,這将幫助到很多胰腺病人,減少悲劇的發生。」
達摩院醫療 AI 團隊負責人、IEEE Fellow 呂樂表示,這項研究是一個重要的裏程碑,在臨床上證實了「平掃 CT+AI」的癌症篩查技術路徑的可靠性。
構建實用的 AI 影像診斷體系
AI 加持的醫療影像技術,正在爲當前的醫學帶來各種新的可能性。
迄今爲止,美國食品藥品監督管理局 FDA 已批準了 300 多種醫療影像相關的人工智能工具。通過深度學習技術,醫生們可以在一些領域的病竈識别、标注、靶區勾畫等任務上獲得幫助,更快發現隐藏病竈,完成診斷、治療工作。
在癌症的 AI 醫療影像工作上,此前大多數方法聚焦于協助醫生進行病竈檢測和診斷。此次 PANDA 研究帶來的突破,則爲人們在基于影像的大規模多癌篩查上開辟了一條新道路,有望提高重大癌症的早期檢出率。
對于達摩院的 AI 加醫療探索來說,這隻是近年來成果的一小部分。
「AI 應該解決那些尚未得到解決、而病人又真切需要的臨床需求。我們需要在病人性命攸關的臨床問題上,做出不可或缺的貢獻。」這是達摩院醫療 AI 團隊秉持的醫療技術第一性原則。
我們了解到,達摩院醫療 AI 團隊長期緻力于 AI 與醫療影像的融合研究,重點布局精準癌症診療、精準慢性病診療、神經退行性疾病預篩三大方向,其中研發了包括規模篩查、精準診斷、預後治療、響應評估在内的全流程的癌症診療技術。
除了技術探索之外,達摩院醫療 AI 團隊還與全球多家頂尖醫療機構的合作,利用 AI 技術探索低廉、高效的多癌篩查新方法,希望通過一次平掃 CT 就能查出多種早期癌症。
截至目前,相關工作已經在胰腺癌、食管癌肺癌、乳腺癌、肝癌、胃癌、結直腸癌等七種高發癌症上取得階段性進展,相關研究成果先後登上 Nature Medicine、Nature Communications 等醫學期刊及 CVPR/MICCAI/IPMI 等 AI 頂會。可以說基于醫療影像 AI 的前沿技術與癌症篩查這個領域實現了「雙向奔赴」。
達摩院的 AI + 醫療影像重要研究,還包括但不限于:
2022 年 10 月,其醫療 AI 團隊初步驗證了 AI 與平掃 CT 結合的技術可行性,敏感性和特異性均超過專家醫生水平,有望用于早期食管癌檢查,相關論文發表在了 MICCAI 2022;同月基于深度學習對頭頸癌 42 個危及器官進行高效精準自動規劃,有效減少放射治療并發症,研究登上 Nature Communications。
論文地址:https://www.nature.com/articles/s41467-022-33178-z
2023 年 6 月,針對 CV 領域的 OOD 難題提出全新醫學圖像語義分割框架,讓 AI 更準确識别腫瘤中的疑難罕見案例,并已在胰腺和肝髒腫瘤上得到驗證。該研究被 CV 頂會 CVPR 2023 評爲 Highlight 論文。同月基于增強 CT 的胰腺腫瘤鑒别診斷也有了新進展,成果在醫學圖像處理頂會 IPMI 2023 上發表。
2023 年 8 月,發布多癌影像分析通用模型 CancerUniT ,利用增強 CT 實現 8 種主流癌症的輔助診斷,研究成果被 CV 頂會 ICCV 2023 收錄。同月發布的首個可以分割全身 143 個器官的連續深度學習框架也被 ICCV 2023 接收。
CancerUniT 檢測、分割和診斷 8 種癌症腫瘤的示例。圖源:https://arxiv.org/pdf/2301.12291.pdf
不久後,達摩院免費開放 100 件 AI 專利許可,其中有 3 件是專門針對癌症的精準治療和解決關鍵的醫療圖像配準問題(後來在 10 月份 MICCAI 2023 Learn2Reg 競賽上, 達摩院相關醫療圖像配準技術以比較明顯的優勢,獲得所有兩個賽道的冠軍)。
2023 年 10 月,基于 CT 圖像的肝髒腫瘤篩查與診斷、胃癌篩查、肺結節自動檢測及良惡性鑒别、胰腺癌預後等幾項工作也在 MICCAI 2023 發表。
再加上胰腺癌早期檢測模型 PANDA,達摩院的醫療 AI 技術,成爲了一個又一個 AI for Science 的範例。
不僅如此,在達摩院的設想中,AI 不僅可以輔助醫生進行多個癌症疾病篩查,同時還可以進行心髒病、腰椎、骨骼等疾病篩查,希望能在一張平掃 CT 的基礎上同時檢測出 8 種腫瘤和 5 種慢性病,實現基于醫療 AI 的普惠篩查。
據了解,達摩院已與浙大一院、複旦腫瘤、北醫三院等多家三甲醫院建立了臨床科研合作關系,其醫療 AI 産品已成功對接落地 30+ 家醫療影像合作夥伴,累計落地醫療機構數超過 1000 家,爲全球 2000 萬人次提供了智能化醫療健康服務。
結語
有了 AI + 平掃 CT 技術,我們或許可以想象:在未來通過完成常規、有限的體檢項目,我們就能在 AI 加持輔助下獲得很多疾病的篩查結果。
此外,在 AI 技術進一步實用化以後,不僅是醫療影像數據,人們的就診記錄、行爲模式,甚至聲音等各種信息都可以作爲數據進行模型的訓練,并用于檢測病症,爲病人提供精準治療的數據決策支持。
而這些能幫助人們獲得健康的科技,會有一部分來自于阿裏達摩院。
達摩院自 2017 年成立以來,一直以探索未知,以人類願景爲驅動力爲目标,面向未來開展基礎科學和創新性技術研究。位于科技趨勢重要位置的 AI for Science,是其努力方向的重中之重。随着近年來一系列技術突破和應用的鋪開,很多原本存在于我們想象中的事正在逐步實現。
「任何一家公司生命周期都是有限的,但能留下來的,是阿裏巴巴的技術、經驗以及對社會的擔當。達摩院必須要解決社會問題,才能活得長。」正如馬雲在達摩院創立之初所期許的,達摩院要成爲一家面向未來、以科技解決重大社會問題的企業研究機構。
迎戰「癌王」,實現大規模癌症早篩的 PANDA,隻是一個開始。