" 嶄新的計算平台已經誕生,AI 的‘ iPhone 時刻’已經到來,加速計算和 AI 技術已經走進現實," 在 3 月 21 日 GTC 2023 春季大會的開場演講中,春風得意的英偉達創始人兼首席執行官黃仁勳這樣總結近來 AI 技術的突破——在本次 GTC 上,與生成式 AI 相關的主題會議超過了 70 場。
這一看法并不誇張。一天前,微軟和 Nuance 發布一款讓醫生臨床記錄 "iPhone 化 " 的殺手級 AI 應用,也是醫療行業第一款結合 GPT4 模型的應用,距離 GPT-4 發布不到一周時間。微軟在此前投給 OpenAI 創紀錄的 100 億美元看起來非常超值,不僅創造了微軟在醫療領域的高光時刻,也代表了科技巨頭在醫療領域持續加碼的大潮。
在 GPT-4 發布的前一日,谷歌剛剛拿出了專門針對醫療的生成式 AI 模型。雖然比爆火的 ChatGPT 來得晚了一些,但生成式 AI 在醫療上有着充分的發揮空間,這場馬拉松比拼的不是誰先起跑,而是誰能堅持到最後。
已經入局的科技巨頭正在持續深耕,還未進入的則在抓住每一個潛在的機會入局。對此,半導體巨頭 AMD 也直呼 "Yes"。畢竟它幾十年來首次将自己的箭頭标志刻印到了醫療領域。
科技巨頭在醫療的加碼内卷,會帶給我們什麽?值得期待。
微軟巨資收購 Nuance,
GPT-4 加持醫療後發制人
微軟進入醫療的時間其實很早,早在 1999 年就投資了醫療信息網站 WebMD。此後數年,微軟也陸續收購了一些醫療相關企業。但彼時微軟并未将醫療當作主要業務,也未對這些業務進行整合。
2017 年,微軟啓動了 Healthcare NExT,開始系統性進軍醫療。這一次微軟将方向指向當時方興未艾的醫療 AI,希望利用微軟在 AI 和雲計算方面的優勢推動醫療創新,主要目的包括減輕醫生的數據錄入負擔、分流病人及監督病人院外護理。
在此後幾年,微軟在醫療領域基本延續了這一方向。并在 2020 年推出了微軟第一個專門針對醫療行業的雲計算解決方案—— Microsoft Cloud for Healthcare。
不過,坦白而言,擁有這些業務的微軟在醫療領域的名氣并沒有後來被收購的 Nuance 大。Nuance 曾是語音 AI 領域的領導者,不僅是蘋果 Siri 語音引擎的開發者,更曾經在全球智能語音市場中占據六成以上的市場份額。在受到科技巨頭的挑戰後,Nuance 将業務重心轉向醫療領域,并通過數年深耕建立了很高的競争壁壘。
2021 年 4 月,微軟宣布以 197 億美元巨資收購 Nuance。這筆交易是微軟成立迄今第三大收購案,極大地加強了微軟在醫療垂直領域的影響力。
Nuance 的服務已經被嵌入微軟醫療雲,可以爲醫生提供語音識别和轉錄服務。語音 AI 能夠智能識别醫生與患者的對話内容,并進行語境分析,随後将數據輸入到電子病曆中自動創建臨床記錄,以提升醫生診斷的有效率。
Nuance 的 DAX 可通過語音生成臨床記錄(圖片來自 Nuance 官網)
GPT 模型的加入将大幅度提升臨床記錄的生成時間。一般而言,未引入 GPT-4 模型的 DAX 生成臨床記錄需要約四個小時左右。依靠 GPT-4 強大的生成式大語言模型和推理能力,DAX Express 将這個過程縮短到僅僅幾秒鍾。
這極大地改善醫生的使用體驗,減少其處理文書工作的負擔,使得無延時的臨床記錄成爲可能,并提升了效率。
對于微軟來說,率先引入 GPT-4 将使其在醫療領域的影響力有極大提升——現在知道微軟也在深耕醫療的人比以往顯然要多出幾個數量級。
這種搶先并不難理解。微軟過往幾年持續投資 OpenAI,并在 1 月底追加了據說 100 億美元的投資;還爲其提供 Azure 雲服務;甚至還專門爲 OpenAI 打造了一台超級計算機,用來在 Azure 公有雲上訓練 GPT-3。能夠滿足這種訓練所需海量算力的商業實體,在全球也屈指可數。
相比 ChatGPT 背後所使用的 GPT-3.5,GPT-4 的解答能力及正确率都有大幅提升。GPT-4.0 在美國 SAT 考試獲得了 163 分(滿分 180 分)的高分,超越了 88% 考生的成績。同時,它在律師資格考試中也超過了 90% 的考生,相比之下,GPT-3.5 隻有倒數 10% 的水平。
不過,大衆在使用 ChatGPT 的過程中也發現,生成式 AI 仍然存在一些問題,尤其是 " 一本正經的胡說八道 " 可能會制造相當多的認知偏差和虛假信息。畢竟這項技術的本質是通過概率最大化不斷生成數據,而不是完全通過邏輯推理對問題進行解答的算法模型。此外,由于生成式 AI 具有一定的自主性,數據安全和隐私洩露也被認爲是一大隐患。
無論如何,在這場科技大佬加碼醫療的競争中,微軟的提速已使它領先了半個身位。
多年探索醫療叫好不叫座,
谷歌的調整需要時間
就在微軟攜 GPT 殺入醫療領域的前一天,谷歌剛剛召開了 "The Check Up with Google Health" 年度活動,以展示其在醫療領域的最新發展。醫療 AI 則是其中的重點。
在 ChatGPT 走紅之前,谷歌一直被認爲是 AI 領域的頂流。DeepMind 和 AlphaFold 在彼時的熱度絲毫不比 OpenAI 和 ChatGPT 現有的熱度差。在去年 ChatGPT 發布後短短幾周,谷歌便和 DeepMind 拿出了 Med-PaLM。
這是一個專門針對醫療健康領域的大型語言模型——在過去幾年,谷歌一直在進行醫學大型語言模型的研究,以應對醫療領域所需的專業性和特殊性。
Med-PaLM 模型取得了不俗的成績。它是第一個在美國醫療許可類問題上獲得 " 及格分數 "(>60%)的 AI,不僅準确地回答了多項選擇題和開放式問題,還提供回答理由并對自己的回答進行評估。
在本次活動上,谷歌展示了 Med-PaLM 2。據谷歌介紹,新版本模型的表現比之前提高了 18%,遠超過其他同類的人工智能模型(當然,彼時 GPT-4 還未發布)。在醫學考試中,Med-PaLM 2 的表現已經基本接近 " 專家 " 醫生的水平,得分達到了 85%。
不過,谷歌也坦承這些進步雖然可喜,但距離在真實環境中部署仍有不小的距離。來自不同背景和國家的臨床醫生和非臨床醫生根據 14 項标準(包括科學真實性、精确性、醫學共識、推理、偏見和傷害等)對模型進行了評估。谷歌團隊發現 Med-PaLM 2 在回答醫療問題和滿足谷歌對産品卓越标準方面還有一些距離。未來,谷歌也将會持續與研究人員和全球醫學界合作,希望能夠讓這項技術真正幫助改善醫療服務。
雖然 Med-PaLM 2 暫時不能投入實用,但谷歌在影像 AI 上倒是取得了不少進展。在去年 10 月,Google Health 與 iCAD 達成協議,将谷歌的乳腺影像 AI 技術整合到其乳腺影像産品中。這也是谷歌首次将其乳腺成像 AI 模型部署到臨床實踐。
在本次活動上,谷歌也宣布将進一步加強超聲 AI 模型的構建,用于孕産婦護理及乳腺癌早篩等,從而幫助解決全球超聲影像醫生普遍缺乏及超聲檢查質量參差不齊的痛點。
同時,谷歌也在和妙佑醫療國際合作,利用 AI 輔助放療規劃。此外,谷歌還将在非洲推動 AI 輔助早篩結核病——根據統計,全球超過 25% 的結核病死亡發生在非洲。
谷歌在醫療上的進展雖然看起來熱鬧,但與同期微軟的亮眼表現相比,就有點 " 沒有對比就沒有傷害 " 的意味了。
事實上,谷歌近年來在醫療領域的探索并不如意。2021 年,這家科技巨頭的業務業務迎來巨震——谷歌宣布改變其醫療保健戰略,解散了曾經獨立的 Google Health,其人員也被融入到現有的其他業務線。
商業化一直以來是谷歌在醫療健康領域面臨的難題。在谷歌的年報中,Other Bets 業務指不同發展階段的新興業務,包涵了醫療及互聯網服務等業務。這一業務單元的收入長期沒有什麽長進,一直維持在 6-7 億美元左右;其虧損倒是逐年增加,2021 年已經達到了 53 億美元之多。
組織架構導緻業務重疊或許也是谷歌近來在醫療領域表現一般的原因。從 2015 年谷歌改組爲 Alphabet 開始,各條醫療健康産品線逐漸聚合和獨立的業務單元。到了 2021 年初,谷歌的醫療健康業務大緻可以分爲 Google Health、Verily 和 Calico 三個單元。這些單元的業務之間長期存在交叉重疊,使得原本就不順暢的商業化更加雪上加霜。
在如今的新架構下,谷歌能不能在醫療領域上找到感覺還需要進一步驗證。但它的例子也說明醫療領域的特殊性——即使是戰無不勝的科技巨頭,也很難玩得轉。
緻力打造醫療 AI 基座的
英偉達,正迎來人生巅峰
如今火遍全網的 GPT 是大型語言構建模型的一種,所謂 " 大型 ",從近幾年 GPT 模型的規模變化上可見一斑。2018 年發布的初代 GPT 參數量隻有 1.17 億,預訓練數據量僅有 5GB。GPT-3 的參數量則已經暴增到 1750 億,預訓練數據量更是達到了 45TB(1TB=1024GB)。
已經亮相的 GPT-4 并未公布相應的指标,但以 OpenAI 的風格,以及大幅優于上一代的表現來看,模型規模大概率會高出不少。這需要巨大的算力才能完成模型訓練和推理,且成本極爲高昂。
根據媒體報道,微軟爲 OpenAI 模型訓練打造的超級計算機擁有 28.5 萬個 CPU 核心及超過 1 萬顆在當時尚屬頂級的 V100 GPU ——即使将 V100 更換爲目前主流的 A100,仍然需要 3000 顆的規模。
此外,GPT3 一次訓練的花費超過 460 萬美元,相應的雲資源成本一年下來也要近億美元。整個 2022 年,OpenAI 在 GPT-3 的訓練上花費超過 5 億美元。全世界也沒有幾家企業有這樣的财力應付這樣一個暫時無法産生任何收入的 " 吞金獸 "。這也是之前這類大型語言模型未能流行的重要原因。
随着生成式 AI 逐漸獲得認可,對于算力的需求正在急劇膨脹。據 OpenAI 測算,自 2012 年以來,全球頭部 AI 模型訓練算力需求幾乎每 3-4 個月就翻一番,每年頭部訓練模型所需算力的增長幅度高達 10 倍。
對于 AI 基礎算力提供者的英偉達而言,沒有比這更好的消息了。在 ChatGPT 引發的生成式 AI 熱潮下,英偉達的股價自年初以來已經上漲近八成,達到了 271.91 美元(3 月 23 日),市值逼近 6500 億美元,一舉超過特斯拉。
英偉達創始人兼首席執行官黃仁勳表示,AI 的 "iPhone" 時刻已經到來(截圖自視頻直播)
在近日召開的 2023 年春季 GTC 大會中,與生成式 AI 相關的主題會議超過了 70 場。同時,英偉達火速拿出了專門針對生成式 AI 的 H100 NVL GPU。雖然未能來得及打造全新的架構,但通過将兩顆目前頂級的 H100GPU 拼接,仍然可以将算力提升 2-3 倍。
英偉達和日本頭部商業财團三井物産合作研發 Tokyo-1 超級計算機,以利用生成式 AI 爲日本制藥行業和初創企業的藥物研發賦能。包括安斯泰來制藥、第一三共制藥和小野制藥等日本藥企頂流都已計劃應用這一超級計算機。
同時,英偉達還推出了 NVIDIA AI Foudations 雲服務,以幫助需要構建、完善和運行自定義大型語言模型及生成式 AI 的客戶加速生成式 AI 的引入。這一服務包括用于自然語言處理的 Nemo、圖像處理的 Picasso,以及針對制藥業的 BioNeMo。
其中,BioNeMo 可以加速加速藥物研發過程中最耗時、費用最高的階段。它可提供預訓練模型,并使用專有數據自定義服務于藥物研發流程各階段的模型——其中就包括生成式 AI,如幫助研究人員設計特有蛋白質的 ProtGPT-2。
通過這些模型,BioNeMo 可以幫助研究人員識别正确的靶向目标、設計分子和蛋白質并預測它們在人體内的相互作用,從而研發出最佳候選藥物。
生成式 AI 模型能夠快速識别潛在的藥物分子,在某些情況下甚至可從零開始設計出化合物或基于蛋白質的治療藥物。這些模型在小分子、蛋白質、DNA 和 RNA 序列的大型數據集上進行訓練後,可以預測蛋白質的 3D 結構和分子與目标蛋白質對接的程度。
目前,已有不少藥企嘗試使用生成式 AI 設計新的候選藥物。安進(Amgen)就使用了 BioNeMo 來加快其生物制劑的研發流程,來探索和研發出新一代藥物中的治療性蛋白質。
除了藥物發現外,生成式 AI 在藥物設計、劑量選擇等藥物開發環節中也可提高效率并完善治療效果。預計到 2040 年,生成式 AI 可能會爲醫療行業帶來 1 萬億美元的價值。
通過多年的持續加碼,英偉達在醫療領域已經成功構建了一個龐大的 AI 底座,并與醫療生态互爲賦能。一方面,通過硬件升級持續提供基礎算力,并加入軟件及服務幫助客戶快速導入應用,英偉達正持續挖掘醫療 AI 這一肉眼可見的巨大 " 金礦 "。另一方面,醫療 AI 也通過英偉達軟硬件的加持獲得了巨大的提升,從而在更多的場景發揮更大的作用。
500 億豪賭讓 AMD
在醫療也可以 Yes!
2022 年,在進軍醫療領域的科技巨頭上又多了一個響當當的名字,這便是 AMD。作爲英特爾和英偉達的老對手,AMD 同樣也是基礎 AI 算力的提供者。不過,一直以來,它都沒有在具體業務中嘗試醫療領域。
2020 年 10 月,AMD 宣布以 350 億美元收購 FPGA 巨頭賽靈思(Xilinx)。由于賽靈思是 FPGA 第一大廠(2020 年其市占率高達 49%),這起收購引發了各國曠日持久的反壟斷審查,直至 2022 年才正式完成。随着在此期間賽靈思的股價上漲,并購規模也達到了近 500 億美元,創造了半導體産業并購重組的新紀錄。
深耕 FPGA 的賽靈思數十年來在醫療、航空航天、汽車、國防等行業積累了諸多客戶資源,對新 AMD 價值連城,也爲其赢得了包括醫療在内諸多高壁壘細分市場的 " 入場門票 "。
FPGA 在醫療成像領域早已得到廣泛應用。全球主要醫療器械廠商都在大量使用 FPGA。其應用範圍主要有超聲成像、3D 渲染、X 射線的數據采集、核磁共振成像接口等。此外,在内窺鏡或者是除顫器、病人監護儀中也可以看到 FPGA 的蹤影。在這些應用中,FPGA 可以提供比 DSP 更強的運算能力,讓成像過程中的一些算法得到高速執行。
作爲 FPGA 領域的領導者,賽靈思在這些應用上早已有多年深耕。借由收購賽靈思,AMD 也得以首次把自己的 " 箭頭 " 标志刻印到醫療領域。
AMD 通過收購進入到醫療領域(截圖自活動海報)
2023 年初的 CES 展會上,AMD 發布其首個用于 Vitis 2022.2 統一軟件環境的醫學成像庫(Medical Imaging Library),以提供更好的超聲成像質量——目前,繼續提升超聲成像質量和成像精準性正面臨越來越大的挑戰。
AMD 的醫學成像庫可極大地提升成像質量并降低延時。通過爲賽靈思的 FPGA 芯片硬件部署超高性能的超聲波束成形算法,超聲設備即使在難以掃描的腹部或心髒部位,也将可以獲得以低延時高質量的成像效果。
此外,這一醫學庫還采用了三級庫設計,從第 1 級的模塊構建到第 3 級的完整超聲波束成形器設計一應俱全,這将爲設備廠商提供豐富的選項,從而幫助他們縮短開發時間,将産品更快推向市場。
坦白而言,AMD 目前在醫療領域的應用場景還較爲單一,但未來可期。這是因爲配合專用算法的 FPGA 因其較爲靈活的可配置特性和特定環境不遜于 GPU 的性能可以成爲 AI 公司的另外一個選擇。
比如,在輔助病情診斷(慢性病篩查和風險評估)等場景,通過學習過往慢性病患者數據可以預測未來患病風險。這類場景使用 FPGA 也可實現模型訓練、推理性能的提升。
再加上既有的 CPU 和 GPU 産品線,AMD 在醫療領域還有很大的潛力可以挖掘。
科技巨頭爲何
紛紛進軍醫療,難點何在?
科技巨頭紛紛加碼醫療領域并不奇怪。首先,醫療市場的規模實在可觀。根據統計,美國醫療市場規模在 2021 年達到 4.09 萬億美元。這個數字包括醫療保健設施和服務、制藥、醫療器械和産品、以及醫療保險等多個領域的支出,還沒有包括與醫療相關的研究和發展支出。
同時,醫療領域的支出往往都是剛需支出。這并不難理解——畢竟,砸鍋賣鐵治病并不少見,但砸鍋賣鐵僅僅隻是爲了一時的享受實在罕見。正因爲此,當經濟下行時,消費科技領域受到的沖擊遠遠大于醫療領域。很不幸的是,這就是目前發生的情況——根據世界銀行的研究報告,目前全球經濟正處于 1970 年以來最嚴重的下滑。
盡管如此,科技巨頭多年來在醫療領域的表現能夠對得起其投入的實在是鳳毛麟角。動脈網認爲,科技巨頭在醫療健康領域表現不佳,通常來說有幾個原因。
基于其屬性,科技巨頭進軍醫療健康領域往往選擇自身技術優勢的延伸,以技術創新的方式入手。這種創新一旦成功必然建立起牢固的優勢,比如英偉達基于 GPU 在 AI 加速上取得的巨大成功。遺憾的是,技術創新的失敗率非常之高,往往需要多次的嘗試。
科技巨頭在進入醫療後會發現行業環境發生了巨大的改變,患者隐私保護、數據收集标準在以往或許并不是個大問題,但在強監管的醫療健康領域往往成爲巨大障礙。以往通過數據驅動的方式很難解決醫療保健中最複雜的事情。
由于之前的成果,科技巨頭往往會迷信以往的成果,天真地以爲技術可以解決醫療領域的所有問題。遺憾的是,對于患者而言,問題更多的是整體體驗,而不是技術本身。事實上,人們在醫療問題上往往偏于保守,甯願選擇經過驗證、成熟穩妥的方案,新技術的應用推廣往往需要相當長時間的蟄伏期。
與專注于醫療健康的科技公司不同,難以盈利的醫療健康業務在科技巨頭中隻能獲得少數公司資源,也沒有連貫的企業級戰略,很難将分散于各部門的零散醫療業務聚集起來形成合力。對于醫療的長期投入也缺乏心理準備,業務部門的策略不得不經常變動,難以持續。這在需要長期穩定投入和高度耐心的醫療領域是行不通的。
如何将自身的優勢與醫療的特點相結合,從而在醫療領域實現破局,真正在醫療領域 " 叫好又叫座 "。對于已經或者想要進軍醫療領域的科技巨頭來說,都将是一個值得深思的問題。
我們期待科技巨頭們能夠更好地介入醫療領域,從而爲推動醫療行業的數字化轉型和智能化升級做出更多貢獻。
* 封面圖片來源:123rf
近
期
推
薦
動脈網,未來醫療服務平台