鵝妹子嘤,天才數學家陶哲軒搞數學研究,已經離不開普通人手裏的 " 數學菜雞 "GPT了!
就在他最新解決的一個數學難題下面,陶哲軒明确指出自己 " 使用了 GPT-4",後者給他提出了一種可行的解決方法。
借助 GPT-4,他不僅成功地突破了這一難題,還将答案分享在了 MathOverflow 上:
它給我提供了最終的解題思路,接下來我隻需要繼續計算就行。
爲了給更多數學家分享用 GPT-4 工作的便利性,陶哲軒還将自己的聊天記錄 po 了出來,裏面完整地記載了他和 GPT-4 的對話。
可以看見,在這份聊天記錄中,他把 GPT-4 稱呼爲 " 專業數學合作者 ",而不僅僅是一個普通的數學助手。
這個身份屬實不一般了,不知道之後陶哲軒寫論文的時候會不會把 GPT-4 列爲共同作者(手動狗頭)。
不僅如此,戳對話記錄底部的 "continue this conversation" 按鈕,還能一鍵把對話記錄導入自己的 ChatGPT 中,突然闖入人類大師和 AI 的交談。
陶哲軒解決了什麽新問題?
陶哲軒研究的問題,是一個兩天前在數學網站 MathOverflow 上更新的提問。
這個名叫 " 優雅的遞歸之 A301897" 問題,具體長這樣:
其中,A301897 是一個被整數數列網站 OEIS 收錄的數列:
這個數列中有一系列來自長度爲 n 的排列 b 的數,它們有一個共同點,就是滿足 Diaconis-Graham 不等式且等号成立。
Diaconis-Graham 不等式由戴康尼斯(Persi Diaconis)和葛立恒(沒錯,就是 " 最大數 " 之父 Ronald Graham)于 1977 年共同提出,屬于概率統計方面的研究。
顯然,這一大段提問中不僅夾雜着大量專業數學公式,而且還涉及需要跳轉的網頁資料。
作爲數學公認不太好的 " 數學菜雞 ",GPT-4 真的能像一名專業數學家那樣快速讀懂公式、給出解決問題的專業建議嗎?
事實上,相比直接把問題複制粘貼給 GPT-4,陶哲軒做了三件事:
首先,做一些提示工程,明确 GPT-4 的 " 身份 " 和 " 目标 "。其中身份是 " 一個擅長給技巧性建議的數學合作專家 ",目标是 " 提供一些建議 " 而非解決問題。
然後,相比直接把大段公式複制進 GPT-4 提問欄(确實可以這樣做),陶哲軒選擇将問題描述轉成Markdown 格式。
最後,涉及需要 GPT-4 自己查找資料的内容,陶哲軒将它轉變成一個引用注釋,并在結尾給出網址。
完整的提問過程長這樣:
也就是說,相比讓 GPT-4 直接化身數學家去 " 解決問題 ",陶哲軒隻是把它當成一個提供靈感來源的 " 專家 ",給自己建議一些研究的方向。
GPT-4 很快給出了 8 個具體的建議:
1、理解問題:在深入證明之前,确保你理解了問題中的每一項。如果你不熟悉 Diaconis-Graham 不等式,研究一下它,了解表達式 a ( n ) 和 R ( n, q ) 中的每一項代表什麽。
2、簡化表達:有時候,複雜的表達可以被簡化。例如,你可能想看看表達式中 a ( n ) 的二項式系數是否可以簡化,或者是否可以用更簡單的方式計算總和。
3、歸納法:由于 R ( n, q ) 是遞歸定義的,因此證明猜想的一種自然方法是使用數學歸納法。你可能想要證明,如果這個猜想對 n 成立,那麽它對 n+1 也成立。
4、生成函數:另一種方法是使用生成函數。嘗試找到 a ( n ) 和 R ( n, 0 ) 的生成函數,然後證明它們是相等的。這有時可以把一個複雜的組合問題變成一個更簡單的代數問題。
5、漸近分析:正如你提到的,分析 a ( n ) 和 R ( n, 0 ) 的漸近行爲可能會對它們的關系有一些深入的了解。這有時可以用斯特林的階乘近似來實現,或者通過分析表達式中的主導項來實現。
6、數值證據:雖然不是證明,但收集數值證據有時可以讓我們了解如何證明一個猜想。因爲你有 PARI/GP 代碼,可以用數值來檢查猜想,你可能想讀一讀每個序列的前幾項,看看是否能發現任何模式。
7、尋找類似問題:有時,一個問題或猜想是一個已知問題的泛化或變體。在組合文獻中尋找類似的問題或定理,看看它們的證明是否可以适用于這個問題。
8、尋求反饋和合作:不要猶豫,從同事那裏尋求反饋,或者在 MathOverflow 這樣的論壇上發布你的部分結果。協作和同行評議通常是解決複雜數學問題的關鍵。
最終,陶哲軒使用建議 4,也就是生成函數的方法,成功解決了問題。
當然,解決問題的過程并不需要用到 GPT-4,采用 MAPLE 工作表 + 紙筆手動計算就能完成。陶哲軒也嘗試了漸進分析(建議 5)的方法,不過事實證明還是用生成函數更有效。
簡單來說,陶哲軒隻是用 GPT-4 給自己提供不同的解題思路,也就是 " 解題靈感 ",但具體怎麽解答,也就是更加數學的方法,他則不會交給 GPT-4 來完成。
至于 " 查資料 " 這種 GPT-4 的應用,陶哲軒也發揮到了極緻。
例如在思考問題時,他還會把自己的 " 靈光乍現 " 拿出來和 GPT-4 讨論一下,例如他覺得這個問題和卡特蘭數(Catalan numbers)有相似之處,希望 GPT-4 幫他查找一下對應的資料。
GPT-4 很快給出了對應的回答,這也促使陶哲軒對另一個問題産生了新的靈感。
簡單來說,陶哲軒在短短兩段與 GPT-4 的對話中,展示了數學家使用 GPT-4 的正确姿勢——找靈感和查資料。
這樣一來,即使 " 數學菜雞 " 如 GPT-4,也能成爲數學家的 AI 助理了。
大佬是怎麽玩兒 GPT 的
分享人類大師和 AI 的聊天記錄之餘,陶哲軒的乳齒象博文裏還附帶着一份貼心指南,是他使用 ChatGPT 和 GPT-4 的經驗之談。
根據他過去的實操經驗,最要緊的第一點:
不要試圖讓 AI 直接回答問題,因爲這幾乎肯定會得到一些看起來專業的廢話。
爲了避免 GPT 成爲廢話文學大王,行之有效的方案如下:
讓 AI 扮演合作者的角色,而後讓它提供策略建議。
Like this:
除此之外," 數學菜雞 "GPT,在大數學家手裏能有什麽用處?
陶哲軒大概的意思是醬嬸兒的:
ChatGPT 數學能力雖然不咋滴,但對做學術研究的人來說是個發散思維的好工具。
(對普通人來說有點不太專業,但對搞數學的學術人員來說剛剛好)
怎麽解釋用來 " 發散思維 " 這句話呢?
陶哲軒表達出來的觀點是,既然 ChatGPT 在具體數學問題上給出的答案是不完全正确的,那不如索性發揮發揮它生成答案部分正确的特性。
簡而言之,就是讓它幫你找靈感 balabalabla:
在處理數學問題時,可以讓 ChatGPT 這類大語言模型做一些半成品的語義搜索工作。
也就是說,ChatGPT 不用提供确切的答案,隻用生成一些可能的提示。
這樣一來,依據 GPT 生成的提示 + 傳統搜索引擎搜索,就能很輕松 get 答案。
而且他還自曝,在GPT-4 發布之前,他本人就從微軟那裏獲得了訪問資格。
也就是和微軟 154 頁《AGI 的火花》論文裏同款,未經過安全訓練但能力更強的滿血版。
從陶哲軒的反饋中可以看到,GPT-4 非常擅長在和人類對話時進行一些 cosplay,比如充當富有同情心的傾聽者、熱情洋溢的反饋者、富有創造力的靈感來源、翻譯者或教師,或者是魔鬼的代言人。
與此同時,對于 AI 在數學研究中的表現,陶哲軒給出的大膽卻又嚴謹的預言:
當與形式證明驗證器、互聯網搜索和數學符号包等工具整合時,2026 年的 AI,如果使用得當,将成爲數學研究中值得信賴的共同作者,而且在許多其他領域也是如此。
除了數學研究,GPT-4 已經是陶哲軒生活中的全方位小助手了。
他經常使用 GPT-4 回答一些随意、措辭含糊的問題,這些問題以前需要在搜索引擎裏精心調整關鍵詞才行。
還有位同事,因爲親戚拿到重症診斷而郁郁寡歡。爲此,陶哲軒讓大手一揮,讓 GPT-4 洋洋灑灑寫了封慰問信。
結果呢?同事眼含熱淚,被感動哭了。
最後說回陶哲軒用 GPT-4 解決數學難題這事兒上來。
在 MathOverflow 下,有的網友覺得他不應該用 GPT 來回答數學問題,感覺是個很敏感的話題。
但還是有人表示了資瓷,表示覺得真的是泰庫辣~
陶哲軒倒是毫不避諱地站出來表明了自己的立場,他倒不覺得有啥不好:
現在的擔憂,跟維基百科流行初期時大家讨論的重點也沒啥區别……
現在在維基百科上 get 初始線索,并且在引爲論點時附上鏈接,展現它是我論據的一部分,都是大夥兒習以爲常的事情。
并且陶哲軒看法還挺堅定,那就是" 相信大家以後也會覺得用 GPT 來支持研究,沒啥不妥當的呢 "~
加入陶哲軒和 GPT-4 的對話:
https://chat.openai.com/share/53aab67e-6974-413c-9e60-6366e41d8414
參考鏈接:
[ 1 ] https://mathoverflow.net/questions/449361/elegant-recursion-for-a301897
[ 2 ] https://mathstodon.xyz/@tao/110601051375142142
[ 3 ] https://finmath.stanford.edu/~cgates/PERSI/papers/77_04_spearmans.pdf