意念打字新紀錄誕生!
受試者通過植入設備,平均輸入速度能達每分鐘 62 個單詞,是團隊之前紀錄的 3 倍。
同時準确率也有明顯提升,面向 50 個單詞詞彙表,識别準确率比先前紀錄提升 2.7 倍。
據研究者稱,這已開始接近正常人溝通速度(每分鐘 160 個單詞)。
不信?那就看看現場實況。
受試者 " 按詞輸入 ",點點頭就出了個句子,還是蠻絲滑的:
相比下,此前研究按 " 字母 " 逐個輸入,顯得更費勁不少:
△ 2021 年登 Nature 封面的成果展示
創造該紀錄的團隊來自斯坦福,前兩天,他們剛将相關論文預印本放上 bioRXiv,引來不小關注。
未參與項目的加州大學舊金山分校研究員 Philip Sabes,将之稱為 " 重大突破 "。他認為,相關技術很快将走出實驗室,進入落地階段。
不少網友也對該成果也相當興奮,Reddit 點贊上萬,有人恨不能立馬給家人整一套。
值得一提的是,論文發表同一天,共同主要作者之一的 Krishna Shenoy 因胰腺癌去世,不少學者與研究機構為此悼念。
所以這回,科學家們如何創造出意念打字新紀錄?與之前方式有什麼不同?
繼續往下看。
識别開口說話的神經活動情況
意念打字過去一直是腦科學領域的熱門研究方向,也備受社會大衆關注,更早之前的實現方法是——讓受試者在腦中手寫字母,或是在腦中讀出特定讀音,再靠系統識别。
此次,科學家們用了不同的信息識别辦法——直接讓受試者 " 說 " 出來,哪怕隻在大腦裡。
具體來說,他們依靠一套語音腦機接口(BCI)系統,識别人類說話中相關的口腔、面部神經活動情況,通過解碼其動作控制信号,再去輸出受試者想表達的文本。
基于上述思路,科學家們開展了一系列實驗。
此番受試者是一位女性,時年 67 歲,她在 57 歲時被診斷出患有肌萎縮性側索硬化症 ( ALS ) ,該病症讓她在很長時間被吐字發音不清折磨,說話僅能發出幾個元音,輔音幾乎很難分辨。
為保護隐私,該受試者被團隊稱為 T12,2021 年的研究中,他們也用了同樣方法,将另一位男性受試者稱為 T5。
2022 年 3 月,經當事人同意,科學家為其在腦中植入四個微電極陣列,以檢測語言相關神經活動情況。
在植入後的實驗中,科學家先讓受試者嘗試做不同動作,觀察相關區域的神經活動狀況。
比如,讓受試者睜眼、閉眼、眨眼以觀察控制眼皮相關神經元活動;再比如讓嘴唇張開、閉合、微笑,以檢測相關腦區活動。當然,實驗觀察部位還包括:額頭、下巴、喉部、舌頭等。
科研團隊發現,不同動作之間神經活動高度分離,在特定檢測頻率下,他們針對 34 個口部面部動作進行解碼,準确率為 92.7%,若面向 39 個音素,解碼準确率為 60%。這側面說明原計劃具備可操作性。
下一步是将說話的相關神經活動和文本關聯起來。
科研工作者預先準備了一個 RNN 解碼器,以 80ms 為間隔,檢測識别神經活動信号,這當中,神經網絡會依靠最大概率判斷輸出單詞,錯誤的發音也将被糾正,最終輸出文本。
為訓練該網絡,受試者需要每天嘗試輸出 260-280 語句的數據。
百天之後的測試中,無論是否發出聲音,對單詞的識别速度均在每分鐘 50 詞以上,該表現大約是該團隊此前 2021 年紀錄的 3 倍。
且無論面向 50 個單詞,還是 12500 個單詞,解碼效率差異不大。
識别錯誤率也有大幅改善。
針對 50 個單詞的表達,識别錯誤率在 9.1%,即便受試者進行不發聲表達,錯誤率也僅 11.2%。
針對 12500 單詞庫時,表達識别的錯誤率為 23.8%,不發聲輸出錯誤率為 24.7%,該錯誤率與之前研究面向 50 詞的測試情況正誤情況基本持平,能看出該方法準确度大幅上升。
上述測試之外,科學家還探究了哪些方向能進一步優化該系統。
他們考慮了三個維度——語言模型詞彙量、植入腦部電極數量、訓練數據集大小。
結果顯示,随着單詞數量提高,錯誤率的确會升高,但在 1000 詞量級趨于平緩(下方左圖),團隊由此認為,日後研究通過壓縮單詞數不一定有效。
但對于植入電極數量來說,更多的通道數(精度)的确會帶來錯誤率降低。如下方右圖,從 500 提升到 1000,錯誤率從 4%,降低到了 1.9%。
另值得一提的是,即便未經訓練,面向新數據,系統單詞錯誤率也隻有 30%。且通過訓練,錯誤率會不斷下降。
對于後續研究,團隊指出該成果目前還不是完整的、臨床上可落地的系統。此外,24% 錯誤率在日常生活中也還不夠低,後續研究将在各方面努力。
意念打字一直熱度不減
本文一作是 Francis Willett,來自斯坦福霍華德休斯醫學研究所,主要研究領域為腦機接口、運動神經科學,他也對人工神經網絡模型有所涉獵。
2021 年登上 Nature 封面的意念打字研究中,他也是一作。跟上次一樣,此番他表示——将會公布研究的代碼和數據。
另一位主要作者是 Erin Kunz,來自斯坦福電氣工程系在讀博士,此前,她還曾在通用擔任自動駕駛工程師。
前文提及剛剛過世的 Krishna Shenoy 也是本文主要作者。
2021 年登 Nature 的論文,他亦是貢獻者之一,此前研究中,他破譯了與手寫筆記相關的大腦信号,讓截癱患者快速準确地打字。
該項工作十分關鍵,因為當時他們使用的方法是——讓受試者在腦中 " 寫出 " 字母。
除該團隊,在 " 意念打字 " 這件事上,還有更多科學家在努力。
比如 2022 年 11 月,加利福尼亞大學舊金山分校(UCSF)提出的一種不同方法。他們通過植入 128 通道皮質電圖(ECoG)陣列,外加一個經皮連接器,用來連接植入設備和外部系統。
在識别方式上,他們所想到的是——讓受試者在腦中默念字母 NATO 代碼(比如 α 代替 a,β 代替 b),完成逐個字母輸入,平均 2 秒可鍵入一個字母,最終平均字符錯誤率僅 6.13%。
之前,量子位智庫對該趨勢也有所展望,認為 " 意念打字 " 乃至背後的腦機接口技術已在商業化發展上初具雛形。
清華李路明團隊、瑞金醫院、浙江大學及浙大二院神經外科等團隊或機構,均有所積累。
另值得一提的是,去年末馬斯克及 Neuralink 還讓猴子搞了一回 " 意念打字 ",雖說是用訓練猴子意念點擊屏幕中的黃色按鈕,但也算 " 蹭 " 了一波。
當時,馬斯克還說,他和 Neuralink 已向 FDA 遞交了諸多文件,預計 6 個月後(預計今年六月)開啟人體試驗。
但能不能等到,還真不一定……
畢竟同樣的話,他在 2022 年 4 月已說過一次了。(狗頭)
參考鍊接:
[ 1 ] https://www.technologyreview.com/2023/01/24/1067226/an-als-patient-set-a-record-for-communicating-via-a-brain-implant-62-words-per-minute/
[ 2 ] https://www.freethink.com/hard-tech/speech-bcis
[ 3 ] https://www.biorxiv.org/content/biorxiv/early/2023/01/21/2023.01.21.524489.full.pdf