從物理學到人工智能：用哈密頓力學提升AI推理能力

以下文章來源于大噬元獸，作者 FlerkenS

第二期華夏基石數智時代領導力特訓營熱招中！

報名即送十月管理論壇名額一個！價值 12800 元！

作者 | FlerkenS

來源 | 大噬元獸，管理智慧

咨詢合作 | 13699120588

10 月 8 日瑞典皇家科學院宣布，将 2024 年諾貝爾物理學獎授予美國普林斯頓大學的約翰 · 霍普菲爾德（John J. Hopfield）和加拿大多倫多大學的傑弗裏 · 辛頓（Geoffrey E. Hinton），以表彰他們 " 爲推動利用人工神經網絡進行機器學習作出的基礎性發現和發明 "。這一消息不僅引起了物理學界的關注，也引發了 AI 領域的廣泛讨論，有人在諾貝爾獎官推頒獎信息下提問：從物理學到機器學習和人工智能？所以我們确實生活在模拟中？時至今日，物理學與人工智能之間的關系日益緊密，人工智能開始加速推進物理學的研究，而在應用物理學的方法和原理來理解和優化 AI 系統方面，通過将物理學中的概念引入 AI 領域，我們能夠更加深入地理解 AI 系統的内部工作機制，并提升其性能。

同日 arXiv 發表的《Optimizing AI Reasoning: A Hamiltonian Dynamics Approach to Multi-Hop Question Answering》一文提出了一種創新的方法，通過借鑒漢密爾頓動力學的原理，來分析和改進 AI 系統中的多跳推理過程。研究的目的是探索如何利用物理學中的哈密頓力學框架，來更好地理解 AI 推理的動态過程，從而改進多跳問答任務的性能。這種方法不僅提供了新的理論視角，還爲開發更高效、更穩定的 AI 推理算法提供了實踐依據。

漢密爾頓動力學是經典力學中的一個重要分支，主要用于描述保守力系統的運動規律。在 AI 推理中，研究者将推理過程類比爲機械系統的運動，通過定義哈密頓量來表示推理鏈的總能量。哈密爾頓量包括兩個部分：動能和勢能。動能表示認知狀态變化的成本，勢能表示當前推理狀态與問題相關性的程度。通過這種方式，研究者能夠分析推理鏈的能量分布，發現有效和無效推理鏈之間的差異，從而優化 AI 推理算法。

論文的作者 Javier Mar í n 是人工智能領域的專家，他緻力于将物理學的理論方法應用于 AI 系統的優化中。Mar í n 博士的研究興趣包括機器學習、自然語言處理和解釋性 AI 等多個方向。他在多跳問答任務中的研究成果，不僅爲學術界提供了新的理論視角，也爲實際應用中的 AI 系統優化提供了有力的支持。

多跳推理的物理學靈感

現代物理學與人工智能的結合已經成爲當今科技創新的重要方向。物理學提供了描述自然世界的基本原理和方法，而這些原理和方法同樣可以應用于理解和優化人工智能系統。通過将物理學的概念引入 AI 領域，我們能夠更深入地理解 AI 系統的内部工作機制，并找到提高其性能的新方法。論文中提出的利用漢密爾頓動力學來分析和改進多跳問答系統的研究，正是這一跨學科結合的典型範例。

物理學方法對推理過程的啓示主要體現在對複雜系統行爲的描述和理解上。物理學中的許多方法，如哈密頓動力學和微分幾何，提供了一種分析系統動态演化的工具。哈密頓動力學尤其擅長處理保守系統，通過定義能量函數來描述系統的時間演化。這種方法可以幫助我們理解推理過程中的能量分布和轉化規律。

在多跳問答任務中，推理過程往往涉及多個步驟，每一步都需要在語義空間中進行跳躍和關聯。通過将每一個推理步驟映射到嵌入空間中的一個點，我們可以将推理過程視爲一個在高維空間中的軌迹。漢密爾頓動力學提供了一種描述這種軌迹的方法，即通過定義推理鏈的哈密頓量，将推理過程的動态演化描述爲能量的平衡與轉化。

在這篇論文中，研究者借鑒了物理學中哈密爾頓力學的方法，提出了一種新的框架來分析和優化 AI 推理過程。他通過定義推理狀态的動能和勢能，将推理鏈的總能量表示爲哈密頓量，并通過計算每一步的能量變化來分析推理軌迹的特征。動能表示認知狀态變化的成本，勢能表示當前推理狀态與問題相關性的程度。這種方法不僅提供了一種新的理論視角，還爲開發更高效、更穩定的 AI 推理算法提供了實踐依據。

在嵌入空間中的推理動态分析中，研究者通過計算推理鏈的哈密頓能量，發現有效推理鏈的總能量較低且穩定，而無效鏈的能量範圍更廣，往往達到更高的值。這表明，有效的推理過程通過更高效地平衡動能和勢能，實現了較低的總能量。這一發現爲優化 AI 推理算法提供了新的思路，即通過引導 AI 系統朝向能量較低、軌迹更平滑的方向，提高其認知過程的質量和效率。

軌迹的曲率和撓率分析也提供了對推理過程 " 形狀 " 的重要見解，有效推理鏈表現出較低的曲率和撓率，表明推理路徑更直接和集中；而無效鏈則表現出更高的曲率和撓率，可能表明更複雜或不連貫的推理路徑。通過這種幾何分析，研究者能夠更好地理解推理過程中的複雜動态，并找到優化 AI 推理過程的新方法。物理學方法對推理過程的啓示在于提供了一種描述和分析複雜系統動态演化的工具，通過将這些工具應用于 AI 推理過程，我們能夠更深入地理解推理的本質，并找到提高 AI 推理性能的新方法。

推理系統的新框架

在論文中研究者提出了一種新的框架，将 AI 推理過程與經典物理學中的哈密頓動力學聯系起來。首先他們定義了推理狀态空間，即每一步推理都被表示爲嵌入空間中的一個點。這些點是從預訓練語言模型（如 BERT）的嵌入中得出的，捕捉了每個推理步驟的語義内容，推理狀态被定義爲一個向量，其中包含了當前步驟的所有必要信息。

圖 1：推理空間中的規範變換

爲了描述推理鏈的能量分布，研究者引入了哈密頓量的概念。哈密頓量包含兩個主要組成部分：動能和勢能。動能表示認知狀态變化的成本，可以通過推理狀态向量之間的變化量計算得出；勢能表示當前推理狀态與整體問題相關性的程度，可以通過當前狀态與問題嵌入之間的餘弦相似度計算得出。哈密頓量（H）則是動能（T）和勢能（V）之差：

H ( ϕ ,p ) =T ( p ) − V ( ϕ )

其中，ϕ 代表當前的推理狀态，p 代表推理變化。通過這種定義，哈密頓量能夠量化推理過程中的能量轉化和分布情況。

哈密頓能量計算步驟

1. 将推理鏈中的每個事實和問題嵌入到高維空間，使用嵌入函數表示。

2. 計算相鄰推理狀态之間的差值 pi= ϕ i+1 − ϕ i，即動量。

3. 計算動能 T ( p ) =1/2 ∥ p ∥ 2 和勢能 V ( ϕ ) = − cos ⁡ ( ϕ , ϕ g ) ，其中 ϕ g 是目标狀态的嵌入。

4. 計算總哈密頓能量 H=T − V。

通過這些步驟，研究者能夠分析整個推理過程中能量的分布和變化情況，爲優化推理鏈提供數據支持。

推理軌迹的幾何分析

圖 2：二維哈密頓系統中聚焦和多概念推理的相圖

在分析推理軌迹時，研究者采用了微分幾何的方法，通過計算推理鏈的曲率和撓率，進一步理解推理過程的動态特性。軌迹的曲率反映了推理方向的變化率，曲率較高表明推理方向快速變化，可能代表瞬間的洞察力或多元想法的融合；而較低的曲率則表明推理過程更爲線性和集中。

圖 3：用 Frenet 框架場表示曲率。

研究者還使用了 Frenet-Serret 框架來分析推理鏈的幾何屬性。該框架通過計算推理鏈的切向量、法向量和副法向量，描述了推理過程中的旋轉和扭曲情況。這種分析不僅揭示了推理路徑的 " 彎曲度 "，還展示了推理路徑在高維概念空間中的 " 扭曲 " 情況。

圖 4：使用 Frenet 框架的曲線中的速度、加速度和軌迹角。

通過這些幾何分析方法，研究者能夠更深入地理解推理過程中的複雜動态，找到有效和無效推理鏈之間的差異。這些發現爲優化 AI 推理過程提供了新的理論基礎和實踐指導。通過引導 AI 系統朝向更平滑和能量更低的軌迹，可能會提高推理的質量和效率，從而開發出更爲智能和可靠的 AI 系統。

數據集與方法

在優化人工智能推理的研究中，選取合适的數據集和模型至關重要。這篇論文選擇了 OpenBookQA 數據集，并采用了 BERT 模型來實現和驗證研究方法。

OpenBookQA 數據集

OpenBookQA 數據集由 Mihaylov 等人于 2018 年提出，旨在評估 AI 系統在需要結合特定文本語料庫信息與常識知識的問題上的應答能力。與傳統的問答數據集不同，OpenBookQA 模拟了開放書考試的情境，提供了一系列基礎事實，并要求 AI 系統将這些事實與常識知識結合起來回答問題。數據集主要涉及基礎科學主題，适合評估 AI 系統的事實記憶和推理能力。

圖 5：OBQA 數據集中有效鏈和無效鏈中哈密頓能量的分布。

OpenBookQA 數據集包含 5957 道多項選擇題，其中訓練集有 4957 道，測試集有 500 道。每個問題有四個選項，隻有一個是正确答案。與其他數據集相比，OpenBookQA 沒有提供問題的解釋或推理鏈，這使其成爲評估在其他數據集上開發的解釋生成模型的理想測試平台。

BERT 模型的應用與實現

爲了分析和構建推理鏈，研究者選擇了基于 BERT（雙向編碼器表示轉換器）的模型。BERT 由 Devlin 等人于 2018 年開發，是一種變壓器方法，專門用于自然語言處理任務。研究者選擇 BERT 是因爲其在多個 NLP 任務中的優異表現，如問答和自然語言推斷。本文中的 BERT 模型經過優化，專門用于識别有效的推理鏈。

圖 6：使用 Frenet 框架在 PCA 空間中推理軌迹：有效鏈與無效鏈。

系統接收一個問題、一個答案和建議的推理鏈，随後生成反映鏈有效性的分數。模型架構包括一個 BERT-base-uncased 模型作爲主要編碼器，以及 BERT 之上的一個專門層用于二分類（有效 / 無效鏈）。輸入格式将問題、答案和推理鏈句子結合起來，用 [ SEP ] 标記分隔。

關鍵概念的具體化

研究者通過将每一步推理過程中的事實和問題映射到高維嵌入空間中，将推理系統的關鍵概念具體化。具體化的步驟如下：

1. 位置（ϕ）：用推理鏈中每個事實或問題的 BERT 嵌入表示。

2. 動量（p）：計算爲鏈中相鄰嵌入之間的差值。

3. 動能（T）：定義爲動量的平方大小，表示從一個推理狀态過渡到另一個狀态的 " 成本 "。

4. 勢能（V）：用當前狀态與問題嵌入之間的餘弦相似度計算，表示當前推理步驟與整個問題的相關性。

5. 哈密頓能量（H）：計算爲 T − V，平衡推理的進展及其相關性。

通過這些具體化步驟，研究者能夠分析推理鏈的能量分布，發現有效推理鏈和無效推理鏈之間的差異，從而爲優化 AI 推理算法提供數據支持。這種方法不僅提供了一種新的理論視角，還爲開發更高效、更穩定的 AI 推理算法提供了實踐依據。最終研究結果表明，通過引導 AI 系統朝向能量較低、軌迹更平滑的方向，可以提高推理的質量和效率，從而開發出更爲智能和可靠的 AI 系統。

研究結果

在這篇論文中，研究者通過應用哈密頓動力學框架對 AI 推理過程進行了詳細分析，從多個角度揭示了有效推理鏈和無效推理鏈之間的差異。

研究表明，有效的推理鏈在哈密頓能量特征上表現出更低且更穩定的狀态。這一發現與理論預期一緻，即有效推理過程能夠更高效地平衡認知狀态變化的 " 動能 " 和語義相關性的 " 勢能 "。通過分析，研究者發現無效的推理鏈具有更廣泛的能量範圍，通常達到更高的能量值。這表明無效的推理可能涉及較不穩定或更高能耗的認知轉變。

在對推理軌迹的分析中，研究者借助微分幾何方法，發現有效推理鏈往往表現出更平滑的軌迹和較低的曲率，表明推理路徑更加直接和集中。相反，無效鏈則表現出更高的曲率和撓率，可能表明其路徑更爲複雜或不連貫。這一發現進一步支持了前述的能量分析結果，即有效推理能夠保持較高的效率和穩定性。

研究者通過借鑒物理學中的守恒定律，發現有效的推理過程似乎遵循某些類似于物理系統中的不變性或對稱性。例如，有效推理鏈中類似角動量的量更一緻地守恒，這表明有效認知過程可能遵循某些基本原則。通過将推理軌迹轉換爲行動 - 角度變量，研究者發現推理過程中的 " 行動 "（類似于能量）在很大程度上保持不變，而 " 角度 "（概念空間中的方向）則變化更自由。這一觀察與直覺一緻，即有效推理在探索不同認知方向時，能夠保持一緻的參與度或複雜性水平。

在幾何屬性的統計分析中，研究者對有效和無效推理鏈的多個幾何特征進行了比較，進一步驗證了上述結論。例如，通過對軌迹長度和平滑度的分析，研究者發現軌迹長度本身并不能顯著區分有效性，但軌迹的平滑度卻能夠較好地反映推理的有效性。具體來說，有效推理鏈的軌迹平滑度較高，表明推理過程更加連貫和集中，而無效鏈則顯示出更多的變異性和不規則性。此外，通過分析推理鏈的熵值和自由能，研究者發現有效鏈往往表現出較低的熵值和更穩定的自由能分布，這進一步支持了有效推理能夠更高效地利用認知資源的觀點。

讨論

關鍵發現的解釋

在這項研究中，研究者通過應用漢密爾頓動力學和微分幾何的方法，對多跳推理任務進行了深入分析，揭示了一些重要發現。首先，分析顯示有效的推理鏈在哈密頓能量特征上表現出較低且更穩定的狀态。這一發現符合理論預期，即有效推理過程能夠更高效地平衡認知狀态變化的 " 動能 " 和語義相關性的 " 勢能 "。動能代表了認知狀态變化的成本，而勢能則表示當前推理狀态與問題相關性的程度。有效的推理通過優化這兩者的平衡，從而實現了較低的總能量水平。

軌迹分析方面，有效推理鏈往往表現出更平滑的軌迹和較低的曲率，這表明推理路徑更直接和集中。相反，無效鏈則表現出更高的曲率和撓率，可能表明推理路徑更爲複雜或不連貫。這一發現支持了前述的能量分析結果，進一步驗證了有效推理鏈在能量利用上的高效性和穩定性。

研究者還發現，有效推理鏈中的某些量（如角動量）更一緻地守恒，這表明有效認知過程可能遵循某些不變性或對稱性，類似于物理系統中的守恒定律。通過将推理軌迹轉換爲行動 - 角度變量，研究者發現，推理過程中的 " 行動 "（類似于能量）在很大程度上保持不變，而 " 角度 "（概念空間中的方向）則變化更爲自由。這一觀察進一步表明，盡管推理的方向可以多樣化，但有效推理能夠保持一定的參與度和複雜性水平。

對 AI 與認知科學的意義

這項研究的發現不僅在理論上對理解 AI 推理過程提供了新的視角，也在實踐上爲優化 AI 推理算法提供了指導。這種方法通過将推理過程映射到一個類似物理的空間中，提供了一種更直觀的方式來理解 AI 系統如何得出結論。通過分析有效和無效推理鏈的能量分布和軌迹特征，研究者能夠識别出優化 AI 系統推理過程的方法。

這種方法還有助于提高 AI 系統的可解釋性。通過展示推理過程中的能量變化和軌迹特征，我們可以更清楚地了解 AI 系統的決策過程，從而提高其透明度和可信度。尤其是在多跳問答任務中，這種方法有助于提高 AI 系統在複雜問題上的推理能力。

從更廣泛的角度看，論文提出的哈密頓動力學框架可以爲人類認知過程的建模和理解提供新思路。雖然人類認知和人工智能系統之間存在差異，但這種方法揭示了兩者在能量利用和推理路徑上的相似之處。通過這種跨學科的結合，我們可以更深入地理解人類推理的本質，并将這些見解應用于開發更智能、更高效的 AI 系統。

此外，這種幾何分析方法還可以用于識别和減輕 AI 系統中的偏見。異常的軌迹模式或高能量軌迹可能表明潛在的問題推理過程，需要進一步調查和改進。通過這種方式，研究者不僅可以提高 AI 系統的性能，還可以增強其公平性和可靠性。

總的來說，這篇論文的研究爲理解和優化 AI 推理過程提供了一個全新的視角。通過結合物理學和幾何學的方法，研究者成功揭示了有效推理鏈的特征，爲開發更智能和可靠的 AI 系統奠定了基礎。這一方法的潛在應用不僅限于 AI 領域，還可能對認知科學和人類智能研究産生深遠影響。（END）

參考資料：https://arxiv.org/abs/2410.04415

第二期華夏基石數智時代領導力特訓營熱招中！

報名即送十月管理論壇名額一個！價值 12800 元！