神經網絡是一種以人類大腦結構為基礎建模的計算系統。它構成了許多在語音識别、計算機視覺、醫學影像學等方面被廣泛應用的人工智能系統的基礎。
在神經科學領域,研究者們經常試着用神經網絡來重現大腦所執行的任務。他們希望這些模型能夠提供關于大腦本身如何執行這些任務的新假設。然而,麻省理工學院(MIT)的一組研究人員認為,人們在解釋這些模型時應更加謹慎。
在一項分析中,研究者們訓練了 11000 多個神經網絡來模拟網格細胞(grid cell)的功能。網格細胞是大腦導航系統中的重要組成部分。研究者們發現,這些神經網絡隻有在被賦予生物系統中所不存在的、非常特定的約束條件時,才會産生類似網格細胞的活動。
" 這表明,為了使模型能模拟網格細胞的活動,訓練這些模型的研究人員需要令其采取一些特定的、生物學意義上不可行的實現方式。"MIT 的前高級研究助理瑞蘭 · 謝弗爾(Rylan Schaeffer)說。
MIT 的這一研究團隊發現,如果沒有這些約束條件,神經網絡很難産生網格細胞樣(grid-cell-like)的活動。這表明,這些模型并不一定能帶來對大腦如何工作的有效預測。
這篇研究的第一作者謝弗爾已經在 2022 年 11 月的神經信息處理系統大會(Conference on Neural Information Processing Systems)彙報了這一工作。他現在是斯坦福大學計算機系的一名博士生。MIT 腦與認知科學系教授、麥戈文腦科學研究所成員伊拉 · 菲特(Ila Fiete)是這篇文章的通訊作者。MIT 物理系的博士生米克爾 · 科納(Mikail Khona)是另一位作者。
論文題目:
No Free Lunch from Deep Learning in Neuroscience: A Case Study through Models of the Entorhinal-Hippocampal Circuit
DOI:
https://doi.org/10.1101/2022.08.07.503109
建模網格細胞
幾十年來,研究人員一直在使用神經網絡來執行各種計算任務,這些神經網絡由數千乃至數百萬個處理單元相互連接而組成。節點與節點間有不同強度的連接。當用大量數據訓練網絡時,連接的強度會随網絡學習執行任務而改變。
在這項研究中,研究人員關注于那些被開發來模拟大腦網格細胞功能的神經網絡。這些網格細胞存在于哺乳動物大腦的内嗅皮層(entorhinal cortex)中。網格細胞與海馬體(hippocampus)中的位置細胞(place cells)一起構成了一個大腦環路,這一環路幫助動物們知道它們在哪裡,以及如何導航到另一個位置。
科學家已經證明,隻要動物處于一個特定的位置,其對應的位置細胞就會做出反應,而且每個位置細胞可能對一個以上的位置做出應答。而網格細胞的工作方式則非常不同。比如,當動物在一個空間(如房間)中移動時,網格細胞隻在動物處于布滿空間的三角形栅格的某個頂點時才發放。不同的網格細胞群對應不同特征 * 的栅格,它們相互重疊。這使得網格細胞可以用相對較少的細胞數量來編碼大量獨特的位置信息。
* 譯者注
不同網格細胞在給定環境中的放電模式形成的網格可以有不同的方向(orientation)、相位(phase)和比例(scale)。
這樣的位置編碼使得大腦可以根據一個給定的起點和速度來預測自身的下一個位置。這種技術被稱為路徑整合(path integration)。在最近的幾項研究中,研究人員已經訓練了神經網絡來執行這一任務。
- Christine Daniloff, MIT -
為了訓練神經網絡來完成這項任務,研究人員向其輸入一個起點和一個随時間變化的速度。該模型基本上模拟了動物在空間中漫遊(roaming)的活動,并在其移動過程中計算出最新的位置。當模型執行這一任務時,神經網絡中不同單元的活動模式可以被測量。每個單元的活動可以被表示為一種發放模式(firing pattern),類似于大腦中神經元的放電模式。
在此前的幾項研究中,研究人員報告稱,他們的模型能夠産生活動模式與網格細胞的放電模式非常相似的單元。這些研究得出的結論是,在任何為執行路徑整合任務而訓練的神經網絡中都會自然地湧現(emerge)網格細胞樣的表征。
然而,MIT 的研究人員得到了非常不同的結果。在對用路徑整合任務訓練的 11000 多個神經網絡的分析中,他們發現,盡管其中近 90% 的網絡成功地學習了這一任務,但隻有約 10% 的網絡産生了可被歸類為網格細胞樣的活動模式。這還包括了那些隻産生了單個網格細胞樣單元的網絡。
MIT 團隊表示,此前的研究更有可能産生類似網格細胞的活動,隻是因為研究人員在這些模型中加入了一些約束條件。
" 之前的研究講了這樣的一個故事:如果你訓練網絡進行路徑整合,你就會得到網格細胞。我們發現的是,相反,你必須對一系列參數進行選擇,然後在使用了其中一小部分參數組合後,才能得到期望的結果。這與生物學不一緻。" 謝弗爾說。
- Victor Cavazzoni -
更基于生物學的模型
在之前研究中存在的一個約束條件是,研究人員要求模型将速度轉換為一個特定的位置,并由一個對應單個位置細胞的神經網絡單位報告出來。為了做到這一點,研究人員還要求每個人工位置細胞隻對應一個位置,但這并不是真正的位置細胞的工作方式。研究表明,海馬體中的位置細胞可以對多達 20 個不同的位置做出應答,而不是隻有一個。
當 MIT 團隊調整模型,使人工位置細胞更像生物學上的位置細胞時,這些模型仍然能夠執行路徑整合任務,但它們不再産生網格細胞樣的活動。同時,如果研究人員指示模型産生不同類型的位置輸出,例如在有 X 和 Y 軸的笛卡爾坐标系(而不是六邊形或三角形網格)上的位置,或由相對于原點的距離和角度所表征的位置時,網格細胞樣活動也會消失。
菲特說:" 如果你要求這個網絡做的唯一的事情是路徑整合,并且你對輸出單元施加了一套非常具體的、并不符合生理學的要求,那麼就有可能獲得(人工)網格細胞。但如果你解除了對這個讀出單元的任何一個限制,那就會急劇降低網絡産生(人工)網格細胞的能力。事實上,通常研究人員不會這樣做,盡管這些更松的條件下産生的神經網絡仍然能解決路徑整合任務。"
因此,如果研究人員不是已經知道網格細胞的存在并引導模型産生它們,那麼,這些人工網格細胞就很可能不會作為模型訓練的自然結果而出現。研究人員稱,他們的發現表明,在解釋關于大腦的神經網絡模型時需要更加謹慎。
- DeepMind Design -
" 當你使用深度學習模型時,它們可以是一個強大的工具,但在解釋它們時必須非常謹慎,并确定它們是否真的在進行全新的預測,甚至揭示大腦優化的東西。" 菲特說。
倫敦大學學院的計算神經科學教授肯尼斯 · 哈裡斯(Kenneth Harris)說,他希望這項新研究能促使神經科學家在通過類比神經網絡和大腦來論證觀點時更加謹慎。
沒有參與這項研究的哈裡斯說:" 神經網絡可以成為預測的一個有用來源。如果你想知道大腦如何解決一個計算,你可以訓練一個網絡來執行它,然後測試大腦是否以同樣的方式工作。無論這一假設是否被證實,你總會學到一些東西。這篇論文顯示,‘事後預測’(postdiction)的作用不大。神經網絡有很多參數,所以讓它們複現出一個現有的結果并不那麼令人驚訝。"
MIT 的研究人員說,當使用這些模型對大腦如何工作進行預測時,重要的是在建立模型時要考慮到現實的、已知的生物學約束條件。他們現在正在研究網格細胞的模型,并希望這些模型能對大腦中的網格細胞如何工作生成更準确的預測。
"深度學習模型将給我們帶來關于大腦的洞見,但這隻會發生在你向模型注入了大量生物學知識之後。" 科納說," 如果你使用正确的約束條件,那麼這些模型就可以給你一個類似大腦的解決方案。"
* 注
這項研究得到了海軍研究辦公室、國家科學基金會、西蒙斯基金會通過西蒙斯全球大腦合作項目,以及霍華德 · 休斯醫學研究所通過教師學者項目的資助。米克爾 · 科納得到了 MathWorks 科學獎學金的支持。
作者:Anne Trafton l 譯者:P l 校對:胡夏天