AI 的特點在于超強的學習能力,聊天、繪畫、寫作、作曲,就沒有它不會的。
你爲 AI 焦慮到頭秃,Google 倒希望 AI 幫你照顧好自己的身體。
這次,AI 的學習材料變成了咳嗽聲。
基于 YouTube 等平台無版權的公開視頻,Google 收集了 3 億條 2 秒左右的音頻數據,包括咳嗽、抽鼻子、打噴嚏和呼吸困難的聲音,然後訓練了一個 AI 基礎模型:HeAR。
HeAR 可以通過你的聲音,了解你的健康狀況,甚至能在疾病的早期給出診斷。
Google 沒有讓 HeAR 在實驗室束之高閣,已經和印度 AI 醫療初創公司 Salcit Technologies 展開合作。
Salcit 有自己的 AI 模型 Swaasa(梵語裏意爲「呼吸」)以及 app,在一些情況下可以替代傳統的肺活量測試,用戶提交 10 秒的咳嗽樣本,就能檢測某些呼吸道疾病。
HeAR 拓展了 Swaasa 的技能,又延續了 Swaasa 的精神。兩者的強強聯合,首先用在基于咳嗽聲的結核病早期檢測。
爲什麽是結核病?首先,HeAR 有這個能力,訓練材料裏,咳嗽聲就占了大概 1 億條。
其次,結核病的情況比較特殊,可以治愈,但每年有數百萬病例未被診斷,耽誤了病情,原因無非是醫療落後,患者沒有條件。如果不治療,結核病的死亡率高于 50%。
這就能體現 AI「聽診」的好處了——與血液測試、成像等相比,聲音是更容易獲得、成本也更低的信息,可以直接通過智能手機上的麥克風和 AI 軟件收集、分析。
不過,在更廣泛地落地前,HeAR 還有一些問題需要解決,包括音頻樣本的背景噪音過多。
除了 Google,還有一些大廠和初創公司,也在嘗試讓 AI「聽見」疾病。
2021 年,301 醫院、北京大學第一醫院等聯合發起呼吸健康研究,華爲在其中扮演了重要角色。
擁有華爲 WATCH 4 系列、WATCH GT 4 等智能手表的用戶,可以在華爲創新研究 app 選擇加入呼吸健康研究,錄制咳嗽音,采集生理數據,實現肺部感染風險篩查。
「咳幾聲」,怎麽就能知道肺部有沒有感染?肺部感染的患者,咳嗽的爆發音、頻譜衰減和其他人不同,所以能被區分開來。
背後默默提供支持的,是海量專業的模型數據,以及環境音識别、高精度咳嗽識别和呼吸健康篩查評估三重算法。
另外,AI 也正在通過我們說話的聲音,深入我們的内心世界。聲音會因爲精神健康而改變,有研究可循。
抑郁症患者講話通常更單調、更平淡、更柔和,音高範圍和音量較小,有更多停頓,也會更頻繁地停下來。焦慮症患者則會因爲身體緊張,往往說得更快,呼吸更加困難。
基于微軟雲服務 Microsoft Azure 的美國初創公司 Canary Speech,可以捕捉并處理 40 秒的對話語音,追蹤壓力、情緒等,從而檢測健康狀況。
人類可能會自欺欺人地說「我很好」,但算法不會騙人,而是觀察你的表達方式,根據語氣詞、停頓等,做出客觀的評估。AI 不僅關注你說什麽,更關注你怎麽說。
美國國立衛生研究院的願景則更爲廣闊,有些「兼濟天下」的意思。
研究人員計劃到 2026 年,創建一個大型的開源語音數據庫,訓練 AI 診斷疾病,最終開發一個 app,幫助全科醫生将患者轉診給專家,将服務輻射到農村等醫療欠缺的地區。
他們知道聲音裏有大量的信息——說話低聲、緩慢的人可能患有帕金森病,口齒不清是中風的征兆,抑郁症也能在聲音中找到端倪。
不過,收集的語音還是有優先級,包括五種疾病:神經系統疾病、聲音障礙、情緒障礙、呼吸系統疾病、自閉症和言語遲緩等兒科疾病。
某種程度上,從手表、手環、戒指等可穿戴設備到 AI「聽診」,技術都是在将人類的感官數字化,并且功能越發豐富,更加關注身體的綜合狀況。
你做冥想了嗎,你的心血管如何了,月經周期怎麽樣,運動圓環合上了嗎 ......
首款 Apple Watch 于 2015 年發布,距今已有 10 年,我們漸漸習慣,讓身邊的智能設備,随時、安靜、非侵入性地檢測身體。
而語音是一個更日常的場景,用我們的手機就可以實現交互。不過,語音數據的偏見性、準确性、隐私問題,以及算法的黑盒本質,也讓很多研究人員擔心語音檢測的負面影響。
可能未來的某一天,Siri、小愛同學等語音助理,會這樣提醒我們:親,今天咳嗽了幾次,心情跌到谷底幾次,呼吸急促了幾次 ...... 這是科技的進步,還是現實版的《美麗新世界》?