ChatGPT,已經成爲天才數學家陶哲軒的研究助手了!
不止 ChatGPT,他還直接在網上宣布:
多種 AI 工具都會納入自己的工作流。
最近這些日子,陶哲軒對 AI 可是青眼有加,甚至在網上隻談論一個話題:AI,特别是大語言模型在數學研究中的應用。
期間,各種 ChatGPT 的 " 隐藏功能 " 都被陶哲軒挖了出來:
大到尋找公式、輔助證明定理;小到改寫論文語句、查詢小語種數學名詞的發音。
而爲何突然對 AI 協助工作這麽關注?陶哲軒用自己的老本行數學對 AI 做了個類比:
傳統的計算機軟件就像是數學中的标準函數,比較死闆;
AI 工具更像是數學中的概率函數,會更加靈活。
對這個類比,中科院計算所研究員包雲崗直接稱贊很形象。
也有網友表示:
AI 生成的内容有時候真的會有 " 神來之筆 ",幫助人們更好地工作。
不過也有網友對陶哲軒用 ChatGPT 協助搞數學研究接受無能,畢竟之前很長一段時間大衆對 ChatGPT 的吐槽都集中在數學能力上。
于是,在陶宣稱 ChatGPT 在數學中可以完成一些半成品工作時,有人直接在評論區發問:
你是認真的嗎?我可是(你的)超級粉絲。
那話說回來,一個 " 數學菜雞 "ChatGPT 在一個大數學家手裏究竟能有什麽用處?
一起來看~
ChatGPT 對搞學術的來說 " 剛剛好 "
總的來講,陶哲軒大概的意思就是:
ChatGPT 數學能力雖然不咋滴,但對做學術研究的人來說是個發散思維的好工具。
(對普通人來說有點不太專業,但對搞數學的學術人員來說剛剛好)
那這個剛剛好的尺度 ChatGPT 是如何拿捏的?
陶哲軒直接給出了他用 ChatGPT 求解數學題的幾個示例:
剛開始,他直接把同事詢問的問題逐字逐句抛給了 ChatGPT。
ChatGPT 也有模有樣地回答了起來,期間還提到了一個高度相關的術語:對數矩生成函數,甚至在給出的答案中還讨論了一個具體的例子。
這術語,這舉例…乍一看,甚至騙過了陶哲軒的 " 法眼 ",不過在檢查一遍之後,陶發現:
答案是錯的!
Emmmmm,按理說一般人的邏輯到這裏就該結束了——得出結論:ChatGPT 的數學能力不太行。
但陶哲軒還沒有止步,他仔細分析了 ChatGPT 給出的解答過程,發現并不是完全錯誤的,還是有可取之處。
比如說,ChatGPT 在解答過程中用的是 lmgf 公式,而在克拉默定理給出的标準答案中用到的是 lmgf 公式的 Legendre 變換。
雖然不是正确的解題思路,但也很接近正确答案了。
(有點意思)緊接着他又用兒子幫忙做的 ChatGPT 手機短信版再試了一個數學問題:
我該如何證明有無窮多個素數?
雖然給出的證明的是意料中的不完全正确,但陶發現 ChatGPT 給出的論證思路是可以被固定下來的,并且這個思路他之前還從未見過。
這一通試用下來,直接打開了陶哲軒的思路。
既然 ChatGPT 在具體數學問題上給出的答案是不完全正确的,那不如索性發揮發揮它生成答案部分正确的特性:
在處理數學問題時,可以讓 ChatGPT 這類大語言模型做一些半成品的語義搜索工作。
也就是說,ChatGPT 不用提供确切的答案,隻用生成一些可能的提示(類似于幫你找靈感 balabala)。
這樣一來,依據 ChatGPT 生成的提示 + 傳統搜索引擎搜索,就能很輕松找到答案了。
随後,陶哲軒還具體上手演示了一把。
首先要有技巧地抛出一個問題,假設陶想找庫默爾定理但記不起來這個定理的名字,他是這樣來問的:
我正在找一個關于(balabala)的公式,它是一個經典的理論但我想不起名字,你能給我解答嗎?
最終 ChatGPT 給出的答案是 Legendre 公式(一個相關的結果),然後根據這個答案用傳統的搜索引擎就可以輕松找到庫默爾定理。
話說回來,既然都隻是用作數學研究中的一個工具,爲啥在陶哲軒眼中 AI 會更合适,而傳統搜索引擎就不太行呢?
AI" 思維邏輯 " 更發散
陶直接從傳統計算機軟件和 AI 工具的内部運行邏輯分析了一通。
先來說傳統的計算機軟件,它的運行邏輯類似于函數 : →,這是一個很标準的數學概念。
具體來說,若輸入的在給定域中,軟件就能夠可靠地給出範圍中的單個輸出 ( ) ,若輸入不在給定域中,則就不能給出結果或者說亂給一些結果。
而AI 工具,就不會像傳統計算機軟件那樣死闆,它運行的邏輯不是基于經典函數,而是類似于概率 kernel μ : → Pr ( ) 。
輸入,AI 會從一個概率分布 μ ₓ中采樣,然後随機輸出。而這個概率分布,集中在完美結果 ( ) 附近。
不過這樣也會導緻一些随機偏差和不準确結果的産生。
但整體比較下來,AI 工具還是具有一定的優勢。
一方面它更加靈活,可以比傳統的軟件工具更優雅地處理嘈雜或格式不好的輸入。
另一方面,在一定程度上 AI 的 " 思維方式 " 也會更加發散。
在宣布把 AI 工具納入自己的工作流之後,陶哲軒還在 mathstodon 上不斷更新用 AI 工作的帖子。
比如說用 AI 寫郵件:
或者發現了 ChatGPT 在處理數學問題時的亮點:能夠識别不同語言的數學概念音譯版。
AI 半自動證明定理,審稿人難了
陶哲軒對 AI 的觀察,也在學術圈引起了一場讨論。
他指出,閱讀 AI 寫的論文和人寫的論文體驗完全不同。
閱讀人寫的論文,通常能在上下文和風格上捕捉到一些線索,通過這些線索可以快速分離出論文的 " 肉 ",加快閱讀速度。
AI 生成的數學論文,文字看起來都很有說服力,必須一行一行仔細看才能發現其中的缺陷。
紐約大學教授馬庫斯将其解讀爲:同行評議從此更難了。
不過網友中也有人認爲,讓審稿人必須一行一行仔細看,而不是依賴于膚淺的格式信号,也算得上一件好事。
還有人腦洞大開,想知道 AI 能否提出一些全新的數學猜想。
AI 能不能提出猜想不知道,但是 AI 自動、半自動證明定理已經是現實,并且走向實用化了。
還是陶哲軒,2 月份他在加州大學洛杉矶分校的 IPAM(純數學與應用數學研究所)組織了一場機器學習輔助證明主題研讨會,會上展示了很多這方面的前沿成果。
IBM 研究員 Jason Rute 展示了一種受 AlphaGo 啓發的方法,将定理證明類比成圍棋,下一個步驟相當于下一手棋,得證相當于獲勝。
谷歌科學家吳宇懷則分享了大語言模型在自動形式化(Autoformalization)上的進展。
而陶哲軒本人對 AI 的興趣也不止于此,用機器學習解決實際問題也在他的涉獵範圍之中。
剛剛在澳大利亞的一場講座上,他還分享了如何用數學結合機器學習預測火災變化。
參考鏈接:
[ 1 ] https://mathstodon.xyz/@tao/109945628011027107
[ 2 ] http://www.ipam.ucla.edu/programs/workshops/machine-assisted-proofs/
[ 3 ] https://twitter.com/GaryMarcus/status/1632191991021965313