陶哲軒點贊轉發,《美國數學學會通報》用一整期特刊介紹了AI 給數學帶來的改變。
這些文章讀起來很有趣,盡管使我自己即将發表的一篇文章顯得多餘……這個領域發展太快了!
作者陣容非常豪華,包括菲爾茲獎得主Akshay Venkatesh、華裔數學家鄭樂隽、計算機科學家Ernest Davis等多位知名學者。
其中鄭樂隽表示,如果最終機器能做得比人類更好,那很好,她将樂意退出數學領域去彈鋼琴。
他們提出的觀點包括:
AI 的數學能力不完全反映人類的認知過程,依賴于訓練數據中的模式,而不是真正理解問題的本質。
合成數學如合成拓撲學和合成微分幾何學,提供了一種全新的數學實踐方式,允許數學家專注于更深層次的概念和問題。
交互式證明系統與軟件工程中的" 規範驅動開發 ",可以降低數學家的認知負荷、促進數學家之間的合作。
形式化證明技術可能改變數學證明的本質、颠覆數學家的工作方式。
數學屆不應被科技公司主導的議程所綁架。
在開篇,編委會寫道:
純粹的數學家習慣于享有很大程度的研究自主和智力自由,這是一種脆弱而寶貴的遺産,可能會因機器的盲目使用而被掃除。
另一方面,對同一技術進行深思熟慮和深思熟慮的方法可能會極大地豐富我們的學科。
學科應該如何發展是由我們自己決定的,因此我們邀請數學界認真思考和讨論專刊中提出的問題,并聆聽其他領域同行對這些問題進行了深入思考。
現在,是數學家們了解并推動這場辯論,并決定學科未來方向的時候了。
AI 能自動證明定理嗎?
計算機已經在數學中發揮了重要作用,尤其是在計算效率方面的提升,但是否能夠幫助人類進行數學推理?有一天它們是否會自主進行推理?
數學家Kevin Buzzard概述了神經網絡、計算機定理證明器和大型語言模型的最新發展。
Kevin Buzzard 現任英國倫敦帝國理工學院數學教授,他專門研究算術幾何和朗蘭茲綱領。
回顧整個計算工具的曆史,最早 Computer 一詞還指人類作爲 " 計算員 ",他們的成就不應被低估。
17 世紀早期,蘇格蘭數學家 John Napier 構造了第一個對數表,他提出如果有更多 " 計算員 " 來幫忙,就可以進一步推進這一工作。
另一個代表性成果是 Felkel 和 Vega 在 18 世紀 70 年代發表的整數因式分解表,這使研究素數分布成爲可能,最終導緻了素數定理的證明。
早期電子計算機出現後,機器在高速計算方面已經遠超人類,Computer 一詞的含義也發生了變化。
如劍橋大學在 1957 年購買了 EDSAC II 計算機,用于海洋學計算,爲現代闆塊構造理論奠定基礎。
這個階段計算機還隻是一個工具,即使目前的計算機也難以像人類一樣進行數學推理和定理證明。
神經網絡可以用于搜索定理、猜測新定理和尋找反例,如發現了拓撲學中關于結點和邊的關系的新定理,以及在表示論中發現了關于 Kazhdan-Lusztig 多項式的新結果,但對于證明深奧複雜的定理還有局限性。
自動定理證明系統(ATP)可以自動證明一些複雜的定理,如羅賓斯猜想。但 ATP 生成的證明往往過于冗長,難以被人類理解。
交互式定理證明系統(ITP)可以用于驗證定理的正确性,幫助發現和修正數學文獻中的錯誤,如數學家 Peter Scholze 在液體張量實驗(Liquid Tensor Experiment)中承認自己無法掌握所有涉及的數學對象和概念,最終在 Lean 系統幫助下完成。
大模型如 ChatGPT雖然可以生成相關數學内容,但容易産生錯誤。Buzzard 建議大模型與 ITP 等系統結合使用,通過大模型生成初步證明,然後由 ITP 進行驗證,從而提高可靠性。
Buzzard 認爲,這些新興技術可以幫助數學家突破認知障礙,探索更加複雜和更加新穎的數學領域,并最終改變數學家的工作方式,使他們能夠将更多時間和精力投入到數學思維和理解上。
另外三篇文章,從不同角度探讨了這些新興技術如何幫助數學家應對日益增長的複雜性,并開拓新的數學領域。
數學的形式化轉向
邏輯學家Jeremy Avigad讨論了自 20 世紀初以來,數學定義和證明可以在具有精确語法和使用規則的形式系統中表示。
Jeremy Avigad 任卡内基梅隆大學哲學和數學教授,在數理邏輯和基礎、形式驗證和交互式定理證明以及數學哲學和曆史領域做出了貢獻。
他認爲這種轉向可能改變數學的本質,依賴機器驗證的證明可能減少了數學家對直觀理解和洞察的重視,從而可能影響數學發現的過程和數學思想的發展。
純數學中的抽象邊界和規範驅動開發
數學家Johan Commelin和Adam Topaz探讨了抽象邊界(Abstraction Boundaries)如何在交互式定理證明器的幫助下,幫助控制數學研究中的複雜性。
Johan Commelin 任荷蘭烏得勒支大學助理教授,Adam Topaz 阿爾伯塔大學助理教授,兩人研究興趣的交點是代數幾何,共同參與了液體張量試驗。
△左:Johan Commelin,右:Adam Topaz
抽象邊界是指在數學研究和定理證明過程中,将數學對象的實現細節與其外在屬性和行爲進行形式化區分的界限。這種界限使得數學家可以在不依賴具體實現細節的情況下,使用和推理這些數學對象。
抽象邊界的概念在軟件工程中非常常見,例如通過 C 語言的頭文件、面向對象編程中的公共方法或者函數式編程中的 typeclass 來實現。
基于抽象邊界的" 規範驅動開發 "方法,不僅降低了認知負荷,還促進了數學家之間的合作,使得工作可以輕松地分配給具有不同專長的合作者。
奇異新世界:定理證明助手和合成基礎
數學家Michael Shulman認爲,現有的計算機程序如 Lean 證明助手,能夠驗證數學證明的正确性,但它們專門的證明語言對許多數學家來說是一道門檻。
Michael Shulman 任聖地亞哥大學副教授,研究領域是範疇論和代數拓撲。
現有的計算機證明助手能夠驗證數學證明的正确性,但它們專門的證明語言對許多數學家來說是一道門檻。大模型有潛力降低這一門檻,使數學家能夠以更熟悉的語言與證明助手進行交互。
這可能允許數學家使用由模型支持的證明助手探索根本上全新的數學領域,現有的證明助手已經在同倫類型論(homotopy type theory)等領域發揮了這一作用。
當前的人工智能可以做嚴肅的數學嗎?
紐約大學計算機科學家Ernest Davis指出,當前 AI 在解決文字描述的數學問題上,無法可靠地結合基礎數學和常識推理。
AI 通過三種主要方法嘗試解決數學問題,但每種方法都有其優勢和局限。
直接生成答案,适用于簡單數學問題。
生成可執行代碼,已在實踐中取得成功。
翻譯成邏輯規範,對于複雜問題仍存在挑戰。
他認爲 AI 在解決數學奧林匹克問題時可能會依賴于訓練數據中的模式,而不是真正理解問題的本質,這與人類通過直觀和邏輯推理解決問題的方式有顯著差異。
AI 真正解決數學問題需要三類知識:基礎數學、語言理解和世界常識。例如理解硬币的價值和物理特性。常識在解決問題時經常被忽視,但實際上是至關重要的。
基準測試集是評估 AI 系統性能的重要工具,但它們可能無法全面覆蓋 AI 的所有能力。
但同時他也指出,盡管 AI 在處理基礎問題時存在局限,但這可能不會影響其進行高級數學研究的能力。
一方面,高級數學研究可能不需要與解決基礎問題相同的常識推理能力。
另一方面,在棋類遊戲上,即使 AI 無法理解棋局的基本概念,在棋局分析和策略制定上的能力能遠超人類棋手。
數學家如何看待 AI?關于自動化與數學研究的一些想法
菲爾茲獎得主Akshay Venkatesh探讨了數學自動化對數學研究的影響。他指出,機器可能大大增強數學解決問題的能力,但也會徹底改變數學的核心問題和價值觀,使其難以被人類所認知。
他分析了當前數學界決定 " 什麽是重要 "的機制,如期刊、獎項、數學理論在應用領域得到認可、教育體系、聘用和資助過程等,都不足以解釋數學界相對較高的共識水平。
他認爲 " 證明 " 這種特殊的學術交流方式能引發一緻同意,類似于自由市場中信息傳播的機制。
AI 會導緻當前數學界對 " 重要性 " 的判斷發生劇變。
機器如何使數學更包容
數學家鄭樂隽(Eugenia Cheng)認爲,技術已經在改變人們研究數學的方式,可以利用這些技術使數學更加包容,而不是使數學家變得多餘。
鄭樂隽在謝菲爾德大學任教,除了範疇論研究和本科教學之外,她的目标是消除世界上的 " 數學恐懼症 "。
她分析了技術如何影響數學教學、提出問題、協作、傳播以及研究:
教學:标準的 " 粉筆和黑闆 " 式講授變得沒有必要,她開始采用交互性更強的教學方式。同時對于學生來說,記憶現在已經無關緊要,應當将大腦留給更有趣的事情
提出問題:技術使得任何人都可以在網上提問并獲得答複,但繼承和放大了數學界的精英主義和競争性。
協作:技術大大便利了遠程協作,使地理位置不再是障礙。電子白闆等工具也大大增強了協作的便利性。
傳播:互聯網使論文傳播變得普及,不再局限于有限的紙質期刊。這讓論文發表過程更加公開透明,論文質量而非發表渠道成爲關鍵。
研究:通過智能手機可以随時随地展開研究,不受地點限制。搜索引擎等也讓她不必記住所有事實,可以随時查閱。
總的來說,鄭樂隽認爲技術可以使數學變得更加包容,隻要數學家善用這些技術,而不是固步自封。
同時她也提出,如果最終機器能做得比人類更好,那很好,她将樂意退出數學領域去彈鋼琴。
機器時代下的證明
數論學家Andrew Granville關注證明的本質以及計算機證明與人類證明之間的關系。
他認爲,純數學中的 " 客觀性 " 并非如我們所想那樣牢不可破。
定義和概念的困難:現代數學中很多概念沒有單一明确的定義,存在多種可能的定義和闡釋。這就難以談 " 客觀 "。
公理系統的局限性:根據哥德爾不完備性定理,即使采用一緻的公理系統,也無法證明所有關于整數的正确語句。這說明 " 客觀的 " 數學基礎是有局限性的。
曆史演變的影響:不同時代數學家對 " 數學證明 " 的理解和标準有所不同,這體現了客觀性标準的變遷。
他探讨了計算機自動證明可能同時帶來的挑戰和機遇。計算機證明可以幫助确認人類直觀證明的正确性,提高可信度。但計算機證明可能會取代人類,成爲 " 黑箱 " 證明。但這種證明可能缺乏人類應有的可理解性和适應性。
Granville 希望未來的計算機證明能夠吸收人類證明的優點,在形式化的基礎上保持足夠的靈活性和易理解性。
自動化迫使數學家反思自己的價值觀
哥倫比亞大學數學家Michael Harris強調數學需要吸收其他學科、尤其是人文社科的經驗。
他建議經常反思學科的價值追求和物質基礎,有助于數學家在面對自動化等挑戰時,更好地捍衛數學的核心價值。
此外,他還警示數學界不應被科技公司主導的議程所綁架,科技公司的價值取向與數學家的價值取向并不完全一緻,數學家應保持獨立思考的勇氣,而不是被動接受來自産業的價值導向。
更多精彩内容 7 月發布
特刊的第二部分将于 2024 年 7 月發布,内容将包括:
自動化與哲學:
形式化所引發的許多問題并不新鮮。McLarty 的文章描述,龐加萊在一個多世紀前就在讨論 " 推理機器 "。龐加萊已經關注到形式化證明與數學實踐之間的關系,這一主題在 de Toffolli 的文章中得到了進一步的探讨。
技術改變思維
DeDeo 的文章檢驗了自動證明對數學家認知過程的潛在影響。
深度學習與數學的互動
Bengio 和 Malkin 的文章考慮了進行數學研究對機器學習帶來的特定挑戰。Fraser 和 Poggio 的文章則提出了與深度學習數學基礎相關的問題。
敬請期待~
期刊地址:
https://www.ams.org/journals/bull/2024-61-02/
參考鏈接:
[ 1 ] https://mathstodon.xyz/@tao/112221953164171331