文 | 烏鴉智能說
這兩天,諾貝爾獎逐步公布,AI 成了最大赢家。
10 月 8 日,瑞典皇家科學院宣布,2024 年諾貝爾物理學獎授予美國科學家約翰 · 霍普菲爾德(John J. Hopfield)和英裔加拿大科學家傑弗裏 · 辛頓(Geoffrey E. Hinton),以表彰他們利用物理學工具,開發出了當今強大機器學習技術的基礎方法。
一天之後,瑞典皇家科學院又宣布,将 2024 年諾貝爾化學獎授予大衛 · 貝克(David Baker)、戴米斯 · 哈薩比斯(Demis Hassabis)和約翰 · 江珀(John M.Jumper),以表彰他們用 AI 在蛋白質設計和蛋白質結構預測領域作出的貢獻。
你可以簡單理解爲,諾獎評委們把諾貝爾物理學獎頒給了機器學習,而諾貝爾化學獎頒給了 AI 預測蛋白質結構和蛋白質設計。
爲什麽 AI 突然能拿下兩座諾貝爾大獎?AI 站上諾貝爾獎舞台背後,到底隐藏着一個什麽趨勢?
AI 連下兩座諾貝爾大獎
先說下諾貝爾物理學獎的獲得者霍普菲爾德和辛頓。
霍普菲爾德在 1982 年創造出聯想神經網絡,現在通稱爲霍普菲爾德網絡(Hopfield network),可以存儲并重現圖像和其他數據模式的關聯記憶技術。
簡單來說,霍普菲爾德網絡解決的問題是:人是如何進行聯想記憶的,也就是如何通過某一部分的記憶聯想起整個記憶。比如,你聽到一個人的名字,就能聯系他的長相。
而作爲深度學習領域的領軍人物,辛頓的最大貢獻在于,開發了一種新的神經網絡:玻爾茲曼機。
在我們大腦中,神經元之間會相互作用,有些神經元的決策是可以影響另一部分的神經元。借用知乎上産品二姐的比方:
有些神經元的決策是可以表現出來的,比如某些人看了《長安三萬裏》這部動畫片。但又有些神經元的表現是不可見的,比如某些人看《長安三萬裏》是因爲喜歡唐詩,有些人看是因爲喜歡追光動畫,還有些人是因爲陪喜歡的人一起看。
而玻爾茲曼機所要做的事,就是搞清楚這些可見和不可見神經元之間互相影響的關系。
玻爾茲曼機的出現,很大程度推動了機器學習的快速發展。特别是在深度學習發展早期,波爾茲曼機被用來預訓練深層神經網絡,幫助網絡在進行更複雜學習任務之前,找到合适的權重初始狀态。
說完物理學獎,再來說說諾貝爾化學獎。
其中,諾貝爾化學獎獲獎者之一的大衛 · 貝克,率先開發了設計和預測蛋白質三維結構的方法,創造出了全新的蛋白質,基于創新的軟件、算法解決醫學難題。
而戴米斯 · 哈薩比斯和約翰 · 江珀,則參與創造的 AI 蛋白質結構分析工具 AlphaFold,直接把蛋白質預測這事帶到了一個新紀元。
如果将生命體比作一個拼好的樂高積木,那蛋白核酸等大分子就像一個個獨立的樂高零件。在過去的五十年裏,理解每一個樂高零件的形狀就是結構生物學家的主要工作。
但這事并不容易,蛋白質是由 20 種不同的氨基酸按特定序列連接形成的多聚體,這些不同的氨基酸通常會折疊成某一個特定的形狀。所以,想要真正地理解蛋白質如何發揮作用,科學家們就必須準确地掌握蛋白質的空間結構。
蛋白質結構從簡單到複雜,總共分爲 4 級。一級結構比較容易确定,簡單的生物實驗如質譜法即可,但涉及到二級以上結構如何折疊的,結構生物學家往往需要利用 X 射線、核磁共振、電遊儀、冷凍電鏡來檢測。
這些方法耗時耗力、人工成本也極高,比如電泳儀隻能間接進行測量,實驗中還受較多因素幹擾,因而會影響對蛋白質結構的分析與理解。而能高分辨率解析的冷凍電鏡則極爲昂貴,一台約 1 億人民币左右。截至今年,我國的冷凍電鏡也隻有 60 多台。
AlphaFold 厲害的地方在于,通過深度學習模型來預測蛋白質更高結構,不僅非常快,而且相當準确,大大提高了蛋白質研究的效率。
2021 年,AlphaFold 就預測了 35 萬個蛋白質結構,這包括了 98.5% 的人類蛋白質,并将這些蛋白質結構放到了 AlphaFold-EBI 數據庫中。到了 2022 年,這個數據庫中的蛋白質數超過了 2 億,幾乎包含了地球上所有可能存在的蛋白質。
可以說,AlphaFold 幾乎一個人把預測蛋白質結構這事給做了,這對人類探索自身的生命密碼尤其重要。
知識的盡頭是 AI
雖然機器學習拿下諾貝爾物理學獎這事有很大争議,但另一個已成的事實是,AI 已經幾乎滲透到所有的學科,并産生了不可忽視的影響。
原因很簡單,AI 的學習效率比人強太多。在之前很長時間裏,辛頓一直認爲,人的智慧比 AI 更高。但這幾年,辛頓看法開始轉變,因爲他發現,AI 在知識傳播效率、學習機制、能源效率方面都比人強。
就拿知識傳播來說,當一個 AI 智能體掌握了某個知識,所有的 AI 智能體都能立刻學會這個知識。相反,人類隻能通過觀察和複制教師行爲來學習,這個過程時間更長且效率更低。
再說學習機制,人類的大腦裏有 100 萬億個連接,而 GPT 隻有一萬億個,數量遠遠低于人類。但一個 GPT 用 1700 多億的參數,居然就記住了人類所有的知識和文明,而且還可以進行抽象的思考。
這意味着,AI 比人類更擅長将大量知識放在 1 萬億的連接中。換句話說,AI 可能找到了比人類更好的學習方法。
在 AI 強大的學習能力之下,知識正在迅速貶值。OpenAI 早期投資人 Vinod Khosla 曾預測,未來幾乎所有的專業知識都将被 AI 免費化。
持有類似觀點的還有牛津大學教授 Nick Bostrom。他的觀點更極端,本科和博士課程将加速貶值,傳統 20-30 年以知識傳遞爲核心的人力資本投資将看不到任何回報。
但與此同時,跨學科知識的重要性可能被進一步提升,即使用計算機工具,以及與其他學科的理論,去幫助其它學科(物理,化學,材料,生物,醫藥)攻克學術難題。
也就是說,未來學好人工智能,很有可能會比拒絕人工智能的人,能更有效的工作,形成新的重要發現,甚至争奪各個方向的諾貝爾獎。
甚至有一天,一個拿 GPT-X 寫文章的人,或許也能夠獲得諾貝爾文學獎。