The following article is from AI 深度研究員 Author AI 工作坊
第二期華夏基石數智時代領導力特訓營熱招中!
報名即送十月管理論壇名額一個!價值 12800 元!
來源 | AI 工作坊,管理智慧
咨詢合作 | 13699120588
文章僅代表作者本人觀點,圖片來源于 pixabay
在一次近期的技術峰會上,Google DeepMind 首席執行官兼新晉諾貝爾化學獎獲得者 Demis Hassabis 接受泰晤士報的采訪。Hassabis 對人工智能的發展前景充滿信心,當然無可厚非也保持着謹慎的态度。
" 從現在開始,我們還需要兩到三個重大的創新,才能真正實現通用人工智能(AGI)。"Hassabis 表示," 這也是爲什麽我傾向于給出 10 年的時間框架。盡管我的一些同行認爲可能會更快,但我認爲 10 年是一個更爲合理的預估。"
Hassabis 回顧了人工智能的發展曆程,從 90 年代的 "AI 冬天 " 談起。那時,主流的 AI 系統是基于邏輯的專家系統,如著名的 " 深藍 " 戰勝國際象棋大師卡斯帕羅夫。然而,這些系統本質上是脆弱且有限的,無法學習或發現新事物,這也導緻了 AI 發展的停滞。2010 年,DeepMind 的成立标志着 AI 發展的新紀元。Hassabis 解釋道:" 我們的想法是結合深度學習和強化學習,構建一個自我學習的通用系統。同時,我們也利用了 GPU 等硬件加速技術,推動了 AI 的快速發展。"
未來的 AI 應用場景:" 想象一下,你隻需用相機指向某個物體,AI 就能理解你周圍的環境,識别物體,甚至記住重要物品的位置。未來的 AI 助理不僅能回答問題,還能在現實世界中執行任務,如幫你計劃假期、安排旅行、訂票等。" 爲了實現這一願景,Hassabis 強調了幾個關鍵的發展方向:" 我們需要提升 AI 的規劃、推理和行動能力,同時改進其記憶功能,使其能夠記住用戶的偏好,提供個性化服務。這些技術都還需要進一步的突破和發展。"
視頻時間軸
2:46 回顧 2010 年
3:40 專門的人工智能模型
7:41 多模态
11:37 Astra 和通用助手
14:48 邁向 AGI 的步驟
19:32 希望與炒作
22:39 未來願景
文稿整理
40 年 AI 發展曆程
泰晤士報記者:讓我們從你的故事開始吧。有趣的是,你大概在 2010 年左右開始了這個項目。在那之前,我們經曆了 40 年的 AI 冬天,人工智能并沒有發生太多進展。作爲一名科學記者,我并不經常考慮人工智能這一領域。那麽,你認爲當時爲什麽 DeepMind 會出現?時代精神對你有利嗎?
嘉賓 Demis Hassabis: 嗯,我實際上已經從事人工智能研究超過 30 年了。最開始我是在遊戲和模拟遊戲中制作 AI,然後我學習了計算機科學和神經科學。我一直在關注人工智能領域的發展。在 90 年代,正如你所說的 AI 冬天,那個時候的主流是邏輯系統,通常被稱爲專家系統。你們中的許多人可能還記得 Deep Blue 擊敗國際象棋大師卡斯帕羅夫的事件。這些所謂的 AI 系統其實并不智能,基本上是程序員和系統設計者通過預先編程的規則來解決問題。計算機隻是機械地執行這些預設的啓發式方法和規則,導緻它們非常脆弱,無法學習任何新的事物,當然也無法發現任何新事物。它們受限于設計者或程序員事先知道的東西。所以在整個 90 年代,在劍橋和麻省理工學院學習時,邏輯系統被廣泛認爲是人工智能的發展方向。我認爲這也是 AI 冬天出現的原因之一,因爲這些系統本質上是脆弱且有限的。
泰晤士報記者: 聽起來你對這些早期的系統持批判态度。那麽,DeepMind 的想法是如何在 2010 年萌芽的?
Demis Hassabis: 2010 年 DeepMind 的想法是,我們可以利用當時剛剛在學術界出現的深度學習技術,再加上強化學習——這是一種我們從大腦和多巴胺系統中了解到的學習機制。包括人類在内的動物正是通過強化學習來學習的。所以對我來說很明顯,我們需要構建一個自我學習的通用學習系統。這就是 DeepMind 的起源。此外,GPU 和硬件加速的技術也在那時興起,我很早就意識到可以利用 GPU 來處理計算任務。世界上的一切都可以通過矩陣運算來實現,而 GPU 正是爲此設計的。所以,我們很快地開始了這項工作,把所有這些新興的技術和概念整合起來,我們覺得這就像阿波羅計劃一樣,是一個重大的努力,我們也确實快速取得了進展。
泰晤士報記者: 當你在 2010 年有了這個願景時,你有想過 15 年後,你會站在這裏,向滿屋子的聽衆講述人工智能的巨大成就嗎?比如,我們已經解決了蛋白質折疊問題?
Demis Hassabis: 是的,這确實是我們早期的計劃。我們在 2010 年開始時,認爲大概需要 20 年才能實現通用人工智能(AGI)。當然,過程中有一些小插曲和意想不到的挑戰,但總體上我們一直朝着這個方向前進。蛋白質折疊是我一直想要解決的科學問題,它位列我的研究目标清單之首。我認爲這将是變革性的突破。
AlphaFold 獲得化學獎
泰晤士報記者: 聽起來非常令人興奮。我們稍後可以深入談談 AGI,因爲這的确是個引人入勝的話題。自從 ChatGPT 出現以來,我們作爲一個社會一直在熱議人工智能。但實際上,這與你一直在研究的人工智能有很大不同。到目前爲止,你的人工智能更多的是具體的應用,作爲一個觀察者,這顯得有些奇怪。你最開始做的事情,比如在電腦遊戲上表現出色,似乎有些 " 不務正業 "。雖然我不會說這些事情毫無意義,但它們更像是爲了娛樂,對吧?
Demis Hassabis: 是的,我們确實從遊戲開始。這部分是因爲我有制作遊戲和下棋的背景,非常認真地對待這些事。不過,我也看到遊戲與人工智能的關系源遠流長。從圖靈時代到人工智能的黎明,再到香農,許多偉大的人工智能先驅都從國際象棋程序入手。國際象棋被認爲是 AI 系統的試驗場,就像果蠅是生物學實驗中的典型研究對象一樣。對于我們來說,遊戲一直是一個測試場地。我們可以快速驗證算法的進展,并通過比賽結果來基準測試你所處的水平。比如,如果你能擊敗世界冠軍或最好的計算機,那就說明你的算法做得很好。但關鍵是,遊戲隻是一個手段,而不是最終目的。我們的目标一直是發展通用的人工智能,而不僅僅是擊敗圍棋或國際象棋的世界冠軍。我們希望這種通用性能夠擴展到其他領域,尤其是科學和商業應用。
我們在 AlphaGo 上的工作,以及後來的 AlphaFold,都是基于這種通用的深度強化學習系統。即便是今天,我們仍然在使用這些技術。當你看到 AlphaFold 解決了蛋白質折疊的問題時,真正讓人感興趣的不是具體的解決方案,而是結果本身。如果我們找到了一種治愈癌症的方法,沒人會在乎這個方法是如何實現的,大家隻關心它是否有效。所以,在研究這些問題時,我們會使用所有的通用技術作爲基線,然後根據具體領域的需求進行定制優化,這也是我們如何開發出像 AlphaFold 這樣的突破性項目的方式。但最終,DeepMind 的目标依然是我們最初設定的目标——那就是開發出一個通用的人工智能系統,這種系統能夠像人類一樣完成任何認知任務。正如艾倫 · 圖靈在 1950 年代所設想的通用圖靈機,它能夠計算任何可計算的事物,這也是人工智能的最初目标。
作爲一個領域,這就是 DeepMind 的目标。當然,最近你也看到了一些類似語言模型的技術,顯然 ChatGPT 已經在大衆市場上掀起了巨大的波瀾,幾乎每個人都知道它并且在使用它。然而,所有頂級實驗室,包括 Google 和 DeepMind,實際上都在研究語言模型。我們有自己的内部平台,叫做 Claude,Google 也有他們的系統,所有這些都基于 Transformers 架構——這是 Google Research 發明的架構。目前所有的模型都是基于這個架構的。這是一個激動人心的時刻,因爲語言顯然是一種通用的功能,這也是爲什麽大家對聊天機器人感到如此興奮。很有趣,也有點出乎意料,這項技術已經發展到如此強大,并且能夠擴展。因此,我認爲我們比以往任何時候都更接近構建一個通用系統。然而,現在你仍然需要專門的系統來完成某些特定領域中的頂尖任務,距離實現通用人工智能(General Intelligence)還有一定距離。
對我來說,像 LLM(大型語言模型)這種系統已經更接近于與人類互動的體驗,而這正是我對 GI 的理解。但我認爲,如今單用 LLM 這個詞已經不太合适了,因爲它們不僅僅是大型語言模型,它們是多模态的系統。比如,我們的 Gemini 模型從一開始就是多模态的,能夠處理各種輸入,包括視覺、音頻、視頻、代碼和文本。所以,我認爲這些多模态能力将是構建 GI 系統的關鍵組成部分,但它們本身可能還不足以完全實現 GI。我認爲,從現在開始,我們還需要兩到三個重大的創新,才能真正實現 GI。這也是爲什麽我傾向于給出 10 年的時間框架。盡管我的一些同事和競争對手認爲時間可能會更短,但我認爲 10 年是更合理的預估。
泰晤士報記者: 這也許反映了 DeepMind 内部的一些緊張關系。我記得在早期,你提到 DeepMind 類似于世界上資金最雄厚的大學實驗室之一,像是貝爾實驗室,或者其他偉大的商業研究機構之一。但如今,你們做的事情非常有實際意義。你提到了蛋白質折疊,你們也在研究天氣預報,還在國際數學奧林匹克競賽中獲得了銀牌。
Demis Hassabis: 我确信如果我自己去參加,可能會拿到金牌(笑)。但确實,我們的系統獲得了銀牌。我們現在正緻力于多個不同的領域,包括科學、數學和醫學,以及其他一些應用科學領域。此外,我們還在生産力和商業應用上投入了大量精力,比如聊天機器人、重新設計工作流程、處理電子郵件等。這些都處于非常初期的階段,但它們展現了巨大的潛力。我們現在做的事情正如你所提到的,類似于谷歌的引擎室。谷歌擁有 15 億用戶,而人工智能是推動這些服務和産品的核心技術。所以,我們現在所經曆的這段時間非常激動人心,技術已經非常成熟,可以應用于各種場景。我們在 DeepMind 開發的一些技術一直在推出新功能。這真的是件很棒的事情,因爲你現在需要的産品技術類型,實際上大約有 90% 類似于我們正在進行的 GI 研究。因此,很多東西已經融合在一起了。如果是在 5 年前或者 10 年前,如果你想把人工智能構建到一個産品中,你必須依賴邏輯網絡和專家系統,因爲通用系統和學習系統還不夠強大。
泰晤士報記者: 确實,那時候的 AI 系統非常有限,比如 Alexa 那樣的語音助手,它們還是基于舊的技術架構,這就是爲什麽它們看起來很脆弱,無法泛化,使用起來也不太便利。
Demis Hassabis: 沒錯。而基于這些學習系統的新一代助手将會更加強大,這讓人感到非常興奮。我認爲像 Gemini 這樣的多模态助手,或者我們自己未來的多模态助手 Astra,都是通向 HGI 系統的重要一步,因爲這些助手将推動研究走向那個方向。
谷歌文生視頻産品 Astra
泰晤士報記者: 哦,聽起來非常有趣。你提到有一個 Astra 工作的視頻可以展示給我們看嗎?
Demis Hassabis: 我們有一段 Astra 工作的視頻,不過我們現在可以先做一些測試,看看它的表現如何。告訴我,當你看到發出聲音的東西時,你會聯想到什麽?
【視頻展示】
泰晤士報記者: 哇,看起來真是不可思議。
Demis Hassabis: 你看,這就是我們所謂的 " 開始 " ——一個基本上通用的助手,它可以在日常生活中幫助你完成各種任務。我們可以在這裏暫停視頻,這樣你也能看到這個系統會有不同的外形尺寸,比如它可以在手機上顯示,或者像你知道的那樣,在智能眼鏡上顯示。想象一下如果五年前有人告訴你,未來的技術會發展到這種程度——你隻需要用相機指向某個物體,它就能夠理解你周圍的環境。這種技術的進步真是讓人感歎,它已經具備了某種概念性的理解,知道物體是什麽,甚至能從窗外的随機視角識别出我們所在的社區。比如,它還能夠記住你把某些重要物品放在哪裏。
泰晤士報記者: 這真的很實用,特别是在日常生活中。
Demis Hassabis: 對,一個個性化助手可以做很多事情,這就是我所說的 " 下一代通用助手 "。它可以伴随你出現在不同的設備上,無論是幫你玩遊戲、在桌面上工作,還是在手機上滑動屏幕。無論你在哪兒,都是同一個助手。
泰晤士報記者: 你認爲這與我們距離實現一般智能還有多遠?
Demis Hassabis: 我認爲這是通向一般智能(GI)的一步。有人可能會說,我們還有一些核心技術沒有突破,比如那些無法用現有方法解決的問題。我們現在可能完成了 70%,然後又到了 80%,甚至 90%,但還需要解決最後的難題。很多聊天工具還很被動,通常隻能問答。現有的系統仍然大多數是問答系統。這些系統在回答問題、做一些研究、總結文本方面非常有用,類似的任務它們都能勝任。但我們接下來想要的是更多基于代理的系統,能夠實現你給它設定的目标或任務。這顯然是一個有用的 AI 助理應該能夠做到的事情,比如幫你計劃假期、安排城市旅行、爲你訂票等。它們不僅要回答問題,還要能在現實世界中行動并執行任務。
所以我們需要具備 " 規劃、推理、行動 " 的能力。我們還需要更好的記憶功能,能夠記住你告訴它的内容,了解你的偏好,并根據這些信息爲你提供個性化服務。所有這些技術現在都需要進一步發展。我們在一些遊戲程序中已經具備了這些功能,比如 AlphaGo,它在圍棋這個狹窄領域中有規劃和推理能力,并且成爲了世界冠軍。現在,我們需要把這些技術應用到像 Gemini 這樣的多模态模型上。Gemini 基本上是一個能夠理解周圍世界的 " 世界模型 ",但我們需要解決的問題是,如何在現實世界的複雜環境中進行規劃,而不是像遊戲那樣的幹淨設置。
通用性 AI 助手
泰晤士報記者: 所以你認爲這會是下一個重大突破嗎?你們的助手系統是否也能夠達到像 AlphaGo 在棋局中那樣的水平?
Demis Hassabis:是的,确切地說,我們的目标是實現類似的水平,并将其應用到更廣泛的領域,比如蛋白質折疊、科學研究等。目前關于如何實現這一目标有兩種可能的途徑,這是我們内部和研究界正在進行的一個非常有趣的辯論。其中一件關鍵的事情是代理系統應該具備的能力之一是 " 工具使用 "。這些工具可以是軟件,也可以是硬件,比如機器人或其他物理世界中的設備。這些工具當然也可以是其他軟件,比如像計算器這樣的工具,它們也可以是其他人工智能系統。所以你可以想象一個通用的人工智能系統,比如說像 " 大腦 " 一樣,然後調用像 AlphaFold 或 AlphaGo 這樣的系統來玩圍棋或折疊蛋白質。因爲一切都是數字化的,所以你可以将這種能力整合到 Gemini 這樣的通用大腦中。
但這樣做需要權衡,因爲如果你把過多專門的信息融入到系統中,比如說加載了太多的國際象棋數據,這可能會導緻語言能力下降。所以你必須考慮是否要将某些任務拆分成工具,或者讓通用 AI 在特定情況下使用這些 AI 工具,還是要把它們直接集成到主系統中。對于某些任務,比如編碼和數學,直接集成到主系統中實際上能讓它在所有方面表現得更好。
泰晤士報記者: 聽起來很複雜,你提到了關于學習和兒童發展理論的研究,這似乎也與這一問題相關。
Demis Hassabis: 确實有許多關于學習和兒童發展的研究在探讨什麽樣的任務在主系統中表現得更好,而不是作爲外圍工具。我們依然是一個科研導向的組織。雖然我們有越來越多的産品應用組,但 Google DeepMind 的核心始終是基礎研究。Google 的其他部門也試圖保護我們的基礎研究,這樣我們可以從長遠的角度思考問題,而不僅僅是被産品路線圖所引導。
泰晤士報記者: 那你個人是如何跟上這些快速發展的研究領域的呢?
Demis Hassabis: 我盡量保持我的節奏。以前我總是在晚上工作,直到大約 18 個月前,我的習慣是把午夜到淩晨 3 點的時間保留給自己,用來思考、閱讀論文、提出想法。現在我的團隊大部分在加利福尼亞,所以很多時間被會議占用了,我不得不重新安排我的時間。
泰晤士報記者: 看起來你已經适應了這種改變。那麽,你如何看待未來?我記得你簽署了一封公開信,警告關于人工智能的潛在生存風險。
Demis Hassabis: 确實如此。我從很小的時候就相信人工智能會對世界産生巨大的積極影響。正是這種信念驅動了我這麽多年的努力。我相信人工智能可以治愈所有疾病,幫助應對氣候變化,發明新的材料和能源技術。它也能夠提高我們的生産力,自動處理繁瑣的日常事務,使我們的生活更加豐富。但是,人工智能系統也有風險。我們正在開發非常強大的新技術,而我從 AlphaGo 的開發中看到了它的力量。就像下棋一樣,AlphaZero 在早上開始時完全是随機的,到了午餐時間,它已經能夠擊敗世界冠軍,到了下午,它就已經比最好的硬編碼國際象棋計算機還要強,僅僅在八個小時内達到了這一水平。
泰晤士報記者: 這真是太令人驚訝了。
Demis Hassabis:這隻是一個遊戲,範圍很窄。但我不認爲有任何理由認爲這種能力不能擴展到更通用的系統,比如語言模型或世界模型。我相信,這種能力将在不久的将來被廣泛應用。這項技術将會非常強大,但必須謹慎處理。我認爲我們現在還不完全了解它的潛在風險,這也是我簽署那封公開信的原因之一。我隻是想讓大家更加重視這個問題。并不是說沒有什麽可擔心的,實際上确實存在一些未知的風險。我們需要時間來解決這些問題,我認爲我們還有時間,但 10 年的時間并不算多,尤其是對即将到來的變化來說。因此,我們需要做更多的研究,比如在可控性方面,了解這些系統在理論層面上的作用。我們需要弄清楚如何定義系統的目标和價值,以及如何确保這些系統遵守這些規則。這些都是當前新興技術中的未知數。
所以,我想說我是一個謹慎的樂觀主義者。我相信我們會解決這些問題,隻要我們采取行動,并且是全球性的行動,把所有最優秀的頭腦集中起來。我很高興看到英國和美國現在已經設立了人工智能安全研究所,我們是這方面的積極倡導者,也在測試最新的模型。但我們需要更多這樣的舉措,我隻是希望這真的能夠發生。我相信隻要有足夠的時間和足夠的聰明才智,我們能夠做到。我相信人類的智慧會幫助我們解決這個問題。但我們必須認識到其中的風險,我們不能偷工減料。我們需要以尊重和近乎敬畏的态度來對待這項技術,因爲它值得被這樣對待。
工作和人類價值
泰晤士報記者: 聽起來有些讓人不安。你提到國際象棋的例子很有意思,但如果我每天都靠國際象棋謀生,那這可能會讓我失去工作。你提到的系統是否會消除幾乎所有人類價值?
Demis Hassabis: 我不這麽認爲。我覺得接下來會出現一些非常重要的哲學讨論,比如我們如何重新分配資源和财富。我們可能進入一個稀缺性減少的時代,如果一個通用智能系統(GI)能夠充分發揮作用,那麽能源和資源就不應該再稀缺。這确實會改變經濟的動态。這就是我所說的長期發展方向。所以,我們現在需要開始考慮,如何爲此做準備。比如,我們要如何分配那些額外的财富和資源?是不是應該有某種形式的普遍基本收入?這些問題現在應該由經濟學家來研究和讨論。
泰晤士報記者: 太棒了,非常感謝你,Demis。很高興你能來這裏,非常感謝。
Demis Hassabis: 謝謝你,很高興和你聊這些。
原視頻鏈接:https://x.com/GoogleDeepMind/status/1846974292963066199
第二期華夏基石數智時代領導力特訓營熱招中!
報名即送十月管理論壇名額一個!價值 12800 元!
開班時間
10 月 25-27 日 中國 · 北京
報名條件
本課程适合有意提升數智化領導力的企業一把手及中高層領導者
報名方式
請聯系助教老師填寫報名表并提交。報名确認後,将收到課程入學通知書及相關資料。
課程費用
1.5 萬 / 人。課程費用包含學費、教材費及參訪交流等相關費用(不包含學員交通住宿等個人消費費用)。
證書頒發
課程結束後,完成全部學習任務的學員将獲得課程結業證書。
報名咨詢
富老師:13699120588 柳老師:15202171854
喜歡這篇文章
請爲我點贊和在看