大數據模型如何捕捉個體行爲差異？

圖片來源 @視覺中國

文 | 追問 NextQuestion，編譯 | 趙詩彤

在心理學和神經科學研究中，收集反應時間是一種重要的研究手段，以檢驗構建的模型是否合理。基于受控實驗室環境的認知任務中收集的反應時間數據，人們建立了豐富的模型，但現有模型往往對數據生成過程做出了強烈的假設，難以實際驗證。

近年來，深度神經網絡模型和遞歸神經網絡模型在認知任務中得到應用，但僅限于對單個試次進行建模，無法高精度地捕捉個體間的行爲差異，而且訓練時目标是優化執行認知任務，無法捕捉表現出來的偏差。爲了解決這些限制，斯坦福大學心理系的研究人員構造了一種機器學習模型—— task-DyVA，将逐試次的動力學模型與循環神經網絡結合，模拟了人類在實時認知任務中的表現。這項成果發表在 Nature Human Behaviour 雜志上。

▷圖片來源：nature 官網

研究者們利用任務切換遊戲 "Ebb and Flow" 中的數據來訓練深度學習模型，以模仿人類的 " 任務切換 " 行爲，即把注意力從一個任務轉移到另一個任務。在遊戲中，受試者需根據刺激的顔色提示，在每個試次中報告移動的樹葉的朝向或運動方向。研究者利用一個動力系統框架，将真實觀察到的刺激序列和反應序列作爲模型的輸入與輸出，訓練得到一個生成模型，用來模拟在認知任務中成序列的人類行爲。模型中引入了隐藏層狀态變量，它的叠代代表着：所有内在的認知操作受到當前時間的刺激輸入和上一個時間點狀态變量的影響，具有循環神經網絡的特性，可以有效保證訓練學得的任務表征是由數據而非人爲的先驗假設來塑造。需要注意的是，輸入輸出的形式僅代表當前時刻的信息，而不提示當前試次的任務是否變化，但模型将通過刺激序列自己習得這一重要特征。

建立模型時使用的潛在變量，是無法直接觀測到的 " 隐藏 " 信息，通過觀察狀态變量在時間上的變化，可以了解任務計算進程的内在規律和機制，這對于深入理解任務本身和計算過程中的認知操作非常重要。

模型的效果與揭示的深層現象

本研究采用了深度神經網絡框架，通過對表現較好的參與者的數據進行模型訓練，來模拟認知任務中的行爲表現。研究者使用了三個行爲指标來評估模型的性能，包括平均反應時間、切換成本和一緻性效應。模型表現與參與者表現高度相關，并且成功地再現了早期研究中觀察到的刺激一緻性和任務保持 / 切換之間的交互作用。此外，研究者還觀察到增強模型中的噪聲項會影響任務的準确性，與真實世界中的不确定性增加時的任務表現一緻。研究表明，通過限制模型的底層框架，允許它自己處理真實數據并學習内部認知操作，可以很好地模拟出真實的行爲表現。此外，研究者還發現樣本量對模型效果沒有決定性影響，說明他們的方法适用于一般實驗中的數據集。

在經過精心設計和真實數據訓練驗證的基礎上，研究人員将關注點轉移到了潛在狀态變量的時間序列上。首先根據任務提示和刺激方向對試次進行分組，然後計算每組的平均潛在狀态軌迹。爲了可視化，研究人員将這些軌迹投影到它們的三個主成分（principal component，PC）上。這些 PC 解釋了大部分變化，并發現在模型的潛在空間中，不同任務要求劃分了不同子區域。進一步，通過使用線性判别分析方法，他們證明了模型所學習到的任務表示在潛在空間中的不同區域能夠可靠地代表不同的任務和刺激方向。

▷圖注：任務的潛在表達是按照層次結構進行組織的，每條曲線代表經過線性降維和平均後不同任務刺激和任務提示組合的潛在狀态軌迹。簡單來說，這個模型可以根據任務刺激和任務提示來預測大腦的活動狀态和行爲表現。

爲了更好地理解狀态變量的動态過程，研究人員使用長時間的靜态刺激作爲輸入，來探索神經網絡在 " 生成模式 " 下的表現。在這種模式下，神經網絡不再接收正确的輸出，而是根據給定的輸入生成自己的輸出。結果，研究人員發現每個模型都有一組穩定的固定點，這些點在潛在空間中對附近軌迹具有吸引作用。對于給定的任務提示，相同任務相關刺激方向的固定點對比不同任務的固定點對更爲接近，因此，模型訓練得到的固定點揭示了任務的分層表示。在全局上，每個任務與一個有限的吸引區域相關聯，根據活動任務提示引導潛在狀态。在每個任務區域内部，潛在狀态被拉向對應于正确響應方向的固定點。

研究者基于觀察到的分層表示結果，提出了兩個關于任務切換的預測。首先，研究者指出任務轉換時的反應時間會比同一任務下的更長。這是因爲任務轉換需要在潛在空間中移動到新的任務區域，并且該過程需要一定的時間。反應時間的增加取決于當前任務區域和目标任務區域之間的距離。其次，對不同個體來說，如果不同任務區域空間分離得越厲害，任務轉換成本（switch cost，sc）也相應增強。這是因爲在交替任務之間，潛在空間中的狀态需要被調整以适應新任務的要求，這個調整的過程會消耗一定的時間。特别地，如果年齡較大的個體在潛在空間中的任務表征相對較分離，那麽他們執行任務轉換的成本可能會更高，因爲他們需要更長的時間來轉換任務。

爲了驗證這兩個假設，研究者采用了人工生成的數據來訓練模型。具有較強任務轉換成本的個體的這一特征被消除，稱作 sc- 模型。而用原始數據訓練的模型稱作 sc+ 模型。結果表明，如果訓練出來的模型沒有任務轉換的代價，那麽模型中潛在的任務表示的分離程度也會降低。在沒有轉換成本的 sc- 模型中，轉換成本顯著降低，而平均反應時間和一緻性效應之間的差異相對較小（但是具有統計顯著性）。同時，相對于 sc+ 模型，sc- 模型中任務中心之間的距離顯著降低。因此，任務之間的距離是導緻模型内外較大轉換成本的原因，這正是層次化任務表示的結果。

研究人員還考慮了潛在表征的結構是否具有其他功能上的優勢。他們想知道增加分離度是否能夠提高模型的魯棒性，即減少噪聲幹擾使得潛在狀态更不容易進入錯誤的響應區域。爲了測試這個想法，研究人員改變了 sc+ 與 sc- 這兩個任務區域分離度不同的模型中刺激噪聲的大小，評估其對兩類模型精度的影響。結果表明，相對于 sc- 模型，sc+ 模型對于噪聲刺激的魯棒性更強，即在處理噪聲刺激時，sc+ 模型的性能受到的影響較小。

此外，研究人員發現，模型的魯棒性與參與者執行任務時表現出的 " 幹擾效應 "（即 Stroop 效應）之間存在顯著的正相關關系。幹擾效應是指在執行任務時，與任務無關的幹擾信息對任務執行的影響。研究使用模型的魯棒性和幹擾效應的數據，證明了分離的任務表征可以提高魯棒性，并建立了兩種不同定義下認知穩定性之間的聯系。因此潛在表征的結構不僅可以解釋切換成本的計算原理，還可以提高模型的魯棒性和認知穩定性。

模型研究行爲實驗的未來

認知任務模型作爲行爲研究中的重要手段，目前的模型具有許多不足之處，研究者提出了一個新的建模框架—— task-DyVA，該框架可以精确重現參與者個體反應時間效應的可解釋的動力學模型。

作者指出，相較其他用神經網絡模型解釋神經和行爲數據的方法，本模型的優點在于，task-DyVA 的訓練目的不是爲了達到最優表現，而是爲了盡可能複現人類真實表現；并且以亞秒級時間精度處理傳入信息，從而能對反應時間進行建模。

另外，作者用模型解釋了任務切換成本的原理，與前人提出的吸引子模型一緻，但在他們的模型中并沒有先驗的假設不同情境下吸引子的排斥效應，而是模型自己從真實數據中學習到了這一點，更加驗證了這一理論的有效性。作者還指出他們的模型爲未來直接檢驗神經活動數據與任務切換成本的關系提供了可能。

最後作者強調，該模型可以推廣到一切測量了反應時長的意識任務中，并且對于小數據集依舊适用——雖然這樣的推廣需要進一步的統計驗證——未來可以用于推導出解釋大腦如何動态産生行爲的生成模型。

更多精彩内容，關注钛媒體微信号（ID：taimeiti），或者下載钛媒體 App