來源 | 圖靈人工智能,管理智慧
咨詢合作 | 13699120588
文章僅代表作者本人觀點
谷歌 DeepMind CEO Demis Hassabis 說,将人工智能視爲普通技術是錯誤的,人工智能将具有 " 劃時代的意義 ",很快将治愈所有疾病、解決氣候和能源問題并豐富我們的生活,AGI 大概需要 10 年時間,因爲還需要 2 到 3 項重大創新,下一項就是基于代理的系統,能夠完成你給它的特定目标或任務。
谷歌 DeepMind 創始人、CEO Demis Hassabis 最近在《泰晤士報》和《泰晤士報商業版》的主辦的科技峰會上發表演講,Hassabis 回顧了 DeepMind 的創立,談了 AGI、AlphaFold 和 AI 的未來。
照例先給大家劃個重點(訪談全文附在文後):
Demis Hassabis 看見了什麽? Hassabis 已經在遊戲的微觀世界中看到了一點,并且理解得很清楚:從一個随機的系統 AlphaZero 開始 8 小時就可以訓練出超越最頂尖人類的國際象棋實體,雖然這隻是遊戲狹窄領域,但一定會擴展出世界模型。
DeepMind 的初心: Hassabis 30 年前就開始研究 AI 了!從遊戲 AI 到神經科學,他一直堅信 AI 的潛力。2010 年,他創立 DeepMind,因爲他看到了深度學習和強化學習的巨大潛力,以及 GPU 等硬件的快速發展。他想打造一個通用的、能自我學習的 AI 系統,這正是 DeepMind 的初心!
遊戲 AI,AGI 的 " 練兵場 ": DeepMind 早期專注于遊戲 AI,是因爲遊戲可以快速驗證算法的有效性,而且容易進行基準測試。但他們的目标不僅僅是赢得遊戲,而是開發通用的 AI 技術,并将其應用于其他領域,例如科學和商業。
AlphaFold:AI for Science 的典範: Hassabis 一直對用 AI 解決科學難題充滿熱情,而蛋白質折疊問題是他最想攻克的目标之一。AlphaFold 的成功(Hassabis 因 AlphaFold 獲得 2024 諾貝爾化學獎),證明了 AI 在科學領域的巨大潛力!
多模态模型,AGI 的關鍵: Hassabis 認爲,多模态模型是 AGI 系統的關鍵組成部分,例如 DeepMind 的 Gemini 模型,它可以處理文本、圖像、音頻、視頻和代碼等多種輸入。
通往 AGI 的道路:更強大的 Agent: 現在的聊天機器人大多是被動的問答系統,而未來的 AI 系統需要更主動、更智能,能夠像 AlphaGo 一樣進行規劃和推理,并在現實世界中采取行動。
AGI 時代,還有多遠? Hassabis 預計,我們距離 AGI 還有大約 10 年的時間。
DeepMind 的未來: DeepMind 将繼續以研究爲導向,同時也會加大産品研發的投入,與谷歌的其他部門合作,将 AI 技術應用于更多産品和服務中。
AGI 時代,人類将進入富足時代!Hassabis 認爲,AGI 将徹底改變經濟和社會,消除能源和資源的稀缺性,讓人類進入一個物質極大豐富的時代。我們需要提前思考如何分配這些财富,例如,是否應該實行全民基本收入制度。
訪談全文
注意 : 這是 Demis Hassabis10 月 1 日的訪談,此時距離 10 月 9 日他獲得 2024 年諾貝爾化學獎還有幾天時間,但是訪談視頻今天才放出來。
主持人: 我想,在座的各位幾乎都知道 DeepMind,也知道它現在在做什麽。讓我們先簡單回顧一下您的故事,因爲您在 2010 年左右創立了 DeepMind,而在此之前,人工智能經曆了 40 年的寒冬,作爲一名科學記者,我當時并沒有關注人工智能。DeepMind 爲何在那個時候出現?是有什麽有利因素嗎?
Demis Hassabis: 嗯,我研究人工智能實際上已經超過 30 年了,最初是做遊戲,爲遊戲設計人工智能,以及模拟遊戲。後來我學習了計算機科學和神經科學,并且一直在觀察人工智能領域的發展。在您提到的 90 年代的人工智能寒冬時期,都是邏輯系統,也就是所謂的專家系統。你們很多人可能還記得深藍在國際象棋比賽中擊敗了加裏 · 卡斯帕羅夫(俄羅斯國際象棋棋手,國際象棋特級大師,前國際象棋世界冠軍),這些都是預編程系統,實際上是程序員和系統設計者解決了問題,并将其封裝成規則。計算機、人工智能系統實際上根本不智能,它隻是在執行這些啓發式方法。這樣做的問題是,最終會得到脆弱的系統,它們無法學習新東西,當然也無法發現新東西,因爲它們顯然天生就受到設計者或程序員已知能力的限制。
所以對我來說,很明顯,在整個 90 年代,我在劍橋和麻省理工學院學習期間,這仍然是主流觀點,尤其是在那些地方,邏輯系統才是正道。我認爲這就是出現很多人工智能寒冬的原因,因爲它們天生就脆弱且局限。所以在 2010 年,DeepMind 的想法是,我們可以看到深度學習剛剛在學術界被發明出來。
強化學習是我們發現的東西,大腦中的多巴胺系統,動物和包括人類在内都使用強化學習來學習。
因此,對我來說,顯而易見的是,我們需要構建的是一個能夠自學且通用的學習系統,這就是 DeepMind 的起源。然後我們也看到了 GPU 和硬件加速等技術的進步。所以我使用了第一代 GPU,它是用于計算機圖形、計算機遊戲的,但它們是非常通用的,事實證明,世界上的一切都是矩陣乘法。我們很早就開始了,我們覺得這就像一個阿波羅計劃,需要付出巨大的努力才能将所有這些新奇的想法和成分整合在一起可以取得非常快的進展,結果也确實如此。
主持人: 這是您在普林斯頓時期預想的結果嗎?您是否想過 15 年後,我會在這裏與您對話,人工智能會成爲熱門話題,并且蛋白質折疊問題會被解決?
Demis Hassabis: 實際上,它大緻沿着我們計劃的路線發展,當然,過程中也有一些小插曲和意想不到的事情,但當我們在 2010 年開始時,我們認爲要達到通用人工智能大約需要 20 年的時間。我認爲我們可能距離這個目标還有 10 年左右的時間。從現在開始,大緻是那個時間線,用人工智能系統進行科學研究,在通往人工智能的道路上解決科學問題一直是我的主要熱情所在。蛋白質折疊一直是我最想解決的科學難題之一,如果我們能夠取得突破,它将帶來變革。
主持人: 好的,讓我們回到這一點,我認爲我們也應該談談人工智能,因爲有趣的是,自從 ChatGPT 出現以來,我們作爲一個社會一直在非常深入地讨論人工智能,它與您一直在做的人工智能是截然不同的,作爲一名觀察者,您的人工智能一直都非常具體,觀察它有點奇怪,你知道,它開始做一些毫無意義的事情。它非常擅長電腦遊戲。
Demis Hassabis: 我不會說它們毫無意義,但它們更多的是爲了好玩,也許你可以這麽說。我們從遊戲入手,部分原因是我的遊戲背景以及認真下棋等等。但我可以看到,遊戲與人工智能一直有着悠久的曆史。從圖靈和香農在人工智能領域的早期開始,所有這些偉大的,他們都是從象棋程序開始的。幾乎每個 AI 先驅都這樣做過。而且,它一直是我們的試驗場。你能用你的算法思想快速取得進展嗎?然後很容易衡量你的水平,如果你能擊敗世界冠軍或最好的計算機,那麽你就知道你做得很好。但關鍵是,它們始終是達到目的的手段,而不是目的本身。所以我們的想法是 :
不要僅僅爲了擊敗圍棋或國際象棋的冠軍,而是要以一種能夠推廣到其他領域的方式來做到這一點,包括科學和商業應用。這就是我們用深度強化學習和 AlphaGo 所做的,所有這些都是非常通用的系統,我們至今仍在使用。
現在,當你談到像 AlphaFold 或我們的科學程序,它們解決了蛋白質折疊等問題時,你真正感興趣的是解決方案本身。如果你找到了治療癌症的方法,你不會在乎它是如何做到的。你隻想要治療癌症的方法。所以你真的想全力以赴。所以你首先要做的就是把你所有的通用技術作爲基線。然後你再看領域本身,如果這個領域對社會或商業足夠有價值,那麽你就在上面添加定制的東西。這就是你如何得到像 AlphaFold 這樣的突破性程序。但最終,DeepMind 的目标,從我們創立之初到現在,仍然是實現通用人工智能,這意味着一個通用的系統,它能夠開箱即用地完成任何你能完成的認知任務。完全通用,就像阿蘭 · 圖靈在 50 年代所定義的那樣,能夠計算任何可計算的東西。這是人工智能作爲一個領域的最初目标,也是 DeepMind 的目标。
當然,你最近看到的是像這些語言模型之類的東西。實際上是 ChatGPT 進入了大衆市場,進入了公衆的視野。但實際上,所有頂級實驗室,包括谷歌和 DeepMind,都在研究語言模型。我們有自己的内部模型,叫做 Chinchilla,谷歌也有他們的模型。當然,它們都是基于 Transformer 架構的,這是谷歌研究院發明的,所有當前的模型都是基于它的。所以這是一個激動人心的時刻,因爲語言顯然是一種通用能力。這就是爲什麽每個人都對聊天機器人感到非常興奮的原因。而且非常有趣,而且有點出乎意料的是,這項技術能夠擴展到如此程度。我認爲我們比以往任何時候都更接近構建這些類型的通用系統。但目前你仍然需要專門的系統來在特定領域做到最高水平。
主持人: 大型語言模型更接近 AGI 嗎?我的意思是,它感覺更像是在與人互動,而這感覺就像 AGI。但它真的是嗎?
Demis Hassabis: 我認爲,多模态,現在甚至不應該說是大型語言模型,因爲它們不僅僅是大型語言模型。它們也是多模态的。例如,我們的 Gemini 模型從一開始就是多模态的。它們可以處理任何輸入。視覺、音頻、視頻、代碼,所有這些東西,以及文本。所以我認爲我的觀點是,這将成爲 AGI 系統的一個關鍵組成部分,但可能僅憑它本身還不夠。
我認爲從現在到我們實現 AGI,還需要兩到三個重大創新。這就是爲什麽我給出的時間表是超過 10 年的原因。其他人,我的一些同事和同行,以及我們的一些競争對手,他們的時間表比這要短得多。但我認爲 10 年左右是比較合适的。
主持人: 這與 DeepMind 内部的,我猜是内部的緊張關系是如何協調的呢?因爲我感覺,尤其是在早期,你們就像世界上資金最雄厚的大學實驗室之一。就像貝爾實驗室之類,一個偉大的商業研究機構。但現在你們正在做一些非常有用的事情,你們有一系列的,我的意思是,你提到了蛋白質折疊,但你們還有天氣預報。你們剛剛在國際數學奧林匹克競賽中獲得了一枚獎牌。對不起,我相信如果你自己去參加的話,你也能獲得金牌,但你們的系統獲得了一枚銀牌。你們正在做所有這些其他的事情。你們在背後也在做嗎?你們有團隊在思考嗎?但是現在我們需要繼續前進,制造 AGI?
Demis Hassabis: 是的,我們有一個很大的組織。正如你所說,我們最初的 DeepMind 模式有點像貝爾實驗室,它是世界上最好的工業實驗室之一,能夠發明未來,能夠長遠思考。我們真正展示了這種模式能夠做什麽。我認爲它在爲我們今天看到的各種技術奠定基礎方面非常有效。所以我認爲任何類型的深度技術初創公司都需要時間來發展其成熟的技術。
在過去的兩三年裏,我們已經到了一個非常激動人心的時刻,這項技術已經相當成熟。它已經準備好應用于各種領域。很明顯,有科學、數學、醫學,以及所有這些領域的進步。可以算是應用科學。如果你願意,但也有生産力和商業應用,比如聊天機器人或重新構想工作流程和電子郵件等等,這還處于萌芽階段,以及幫助編碼等等。我們顯然也緻力于所有這些工作,我們是谷歌的引擎。谷歌擁有令人難以置信的,我想是 150 億用戶,以及平台和産品,而人工智能是所有這些的核心,新的功能不斷湧現,來自我們 DeepMind 開發的一些技術。
這在某種程度上是很好的,因爲産品所需的技術類型實際上與你無論如何都會進行的 AGI 研究類型有 90% 的相似之處。這些東西已經有很多融合了,而在五年前或十年前,如果你想将人工智能融入産品中,你必須這樣做,因爲通用系統和學習系統還不夠好,你必須回到邏輯網絡,專家系統。像早期那一代的助手,例如,都仍然建立在那種舊的技術之上,這就是爲什麽它們很脆弱,它們不能泛化,最終它們也沒那麽有用,而建立在這些學習系統上的新一代助手将更加強大。而且,實際上,非常令人興奮,我實際上認爲像 Gemini 以及我們自己對未來多模式助手的設想,目前稱爲 Astra,它們是通往 AGI 系統的關鍵路徑,因爲它們實際上推動了朝着這個方向的研究。所以,這裏有一段 Astra 工作的視頻。
視頻來源:" 谷歌黑闆報 "
Demis Hassabis: 這隻是一個能夠在日常生活中幫助你的通用助手的開始。我聽到要把它做成員工。也會有不同的形式。你可以在手機上看到它,你可以在眼鏡上看到它。我無法形容這會有多麽神奇。如果我們回到五年前,你告訴我我們會走到今天這一步,你隻需用相機指向某個東西,它就能完全理解空間環境。這真是太不可思議了。就好像它有概念,它理解什麽是物體,甚至能認出我們所在的街區。僅僅是通過窗戶看到的周圍景色。像記住你把東西放在哪裏的記憶,這可能非常有用,就像一個助手一樣。個性化和所有這些東西都在這個我稱之爲下一代助手的産品中出現。我稱之爲通用助手,因爲我想象你把它随身攜帶在不同的設備上。它是同一個助手,無論它是和你玩遊戲,還是在你的桌面上幫助你工作,或者是在移動設備上陪你旅行。
主持人: 是這樣嗎?我認爲我理解對了。有些人會認爲這是通往通用智能的一步。如果沒有我們還沒有的秘密武器,那麽它本質上就是這個目标。它與我們目前使用的方法之間沒有無法彌合的差距。它隻是你達到了 70%,你達到了 80%,你達到了 90% 嗎?還是有什麽其他的東西需要解決?
Demis Hassabis: 嗯,我們肯定需要這些系統,我相信你們所有人都已經體驗過各種最先進的聊天機器人了。這些系統非常被動,它們是問答系統。它們對于回答問題,也許做一些研究,總結一些文本之類的事情很有用。
我們接下來想要的是更多基于代理的系統,能夠完成你給它的特定目标或任務。這當然是我使用助手,數字助手需要做的。你計劃一個假期,你在城市裏旅行,你告訴它幫你訂票。所以它們需要能夠在世界上行動,執行動作并進行規劃。所以我們需要規劃、推理、行動,我們需要更好的記憶,我們需要個性化,所以它需要了解你的喜好,記住你告訴它的内容和你喜歡的東西。所以所有這些技術都是需要的。
現在,我給出的簡略說法是 :
我們的一些遊戲程序,比如擊敗了圍棋世界冠軍的 AlphaGo,它有規劃和推理能力,盡管是在這個狹窄的遊戲領域。我們必須引入這些技術,并将它們應用于像 Gemini 這樣的多模态模型,它們基本上是世界模型,正如你剛才看到的,它理解它周圍的世界。但是如何在雜亂的現實世界中進行規劃,而不是像遊戲這樣的幹淨的環境呢?所以我認爲這是下一個需要取得的重大突破。
主持人: 那這個系統也能應用 AlphaGo 級别的遊戲和拉動某種方法嗎?
Demis Hassabis: 是的,沒錯。有兩種方式可以實現,這是我們内部以及學術界目前正在進行的非常有趣的辯論。你可以想象,你希望你的通用代理系統能夠做的一件重要的事情就是使用工具。這些工具可以是硬件,比如機器人或物理世界中的東西,但它們當然也可以是其他軟件,比如計算器,諸如此類。但它們也可以是其他人工智能系統。所以你可以擁有,你可以想象一個像大腦一樣的通用人工智能系統,然後調用像 AlphaFold 或 AlphaGo 這樣的東西來下圍棋或折疊蛋白質,或者因爲它是全數字化的,你可以想象将這種能力折疊到通用大腦中,折疊到 Gemini 中。但這需要權衡取舍,因爲這樣你是否會用專門的信息超載它,比如太多的棋局,然後這會讓它在語言方面變得更差。
這是一個開放的研究問題,你是想把它分離成一個工具,即使是一個通用人工智能可以在特定情況下使用的 AI 工具,還是你想把它上遊到主系統中。有些東西你想上遊到主系統中,比如編碼和數學,因爲事實證明,如果你把它放在主系統中,它實際上會讓一切變得更好。所以有點像你在學習理論和兒童發展理論等等,實際上是爲了思考哪些東西可能是通用的,并且最好放在主系統中而不是外圍工具中。
主持人: 你現在組織還有多少比例是一個科學組織?你還有多少比例在努力成爲貝爾實驗室?
Demis Hassabis: 我們永遠都會是一個以研究爲主導的組織。這就是我們現在在 Google DeepMind 所做的。但我們越來越多地擁有一個越來越大的産品應用團隊,與谷歌的其他部門進行互動。但我們仍然試圖讓我們的基礎研究稍微不受其影響,這樣它就可以根據我們自己的研究路線圖進行更長遠的、更具藍天意義的思考,而不僅僅是由産品路線圖所主導。
主持人: 您個人是如何跟上這一切的呢?
Demis Hassabis: 嗯,我努力,我的意思是,我曾經在 18 個月前說過,我會保留我的晚上時間,而且我是一個很自律的人。所以我把午夜到淩晨 3 點的時間留給思考、閱讀論文和提出想法,我仍然在倫敦。但現在我在加州有很多團隊。所以很多黃金思考時間都被與美國的電話會議占據了。想想如何騰出這些時間。
主持人: 我們可以把計時器放在這裏嗎,如果可以的話。否則,我們會讓你錯過你的飲料,而且我不确定我們還有多少時間。未來會怎樣?我認爲你是其中的一員,你是簽署了其中一封公開信的人之一,警告說,你知道,真正的生存風險,但這并沒有特别明确的定義。你對希望、炒作和末日持什麽立場?
Demis Hassabis: 我認爲這個等式的兩邊都有很多瘋狂的炒作。有一種現在被稱爲末日陣營的人,他們認爲肯定會出錯。然後還有那些波莉安娜陣營的人,他們認爲這隻是另一種技術 , 以前在移動互聯網時代就見過這種情況,它會像那樣發展壯大,但是我們作爲一個社會和作爲人類适應性很強,沒什麽特别的。
顯然這是錯的。我認爲,這比互聯網或移動設備之類的東西要重要得多。我認爲這是一個劃時代的定義。我一直這樣認爲,我想對更多人來說,這一點正變得越來越清晰,但我從我還是個孩子的時候就一直這樣認爲,這就是爲什麽我畢生緻力于此的原因。
我認爲它可以做到。它将産生難以置信的影響。當然,我做這一切的原因是因爲我認爲人工智能對世界将産生難以置信的積極影響。我認爲我們距離用人工智能治愈所有疾病的目标已經不遠了,通過材料科學和新能源以及我認爲人工智能可以發明的其他東西來幫助應對氣候變化,以及在我們的日常生活中,隻是提高生産力,豐富我們的日常生活,平凡的管理工作。我認爲,平凡的管理工作可以自動處理。我認爲這些都很棒,而且很快就會實現。
但是這些系統存在風險,它們是新技術的新系統,它們非常強大。
我已經在遊戲的微觀世界中看到了這一點,我理解得很清楚,比如下棋,你從一個随機的系統 AlphaZero 開始,到了早上喝咖啡休息的時候,它可以打敗我,然後到了午餐時間,它已經比世界冠軍更厲害了,然後到了下午,在大約 8 個小時内,它就比最好的國際象棋,高端的、硬編碼的國際象棋計算機更厲害了。
所以它是世界上有史以來最偉大的國際象棋實體,在 8 個小時内從随機變成了這樣。我實際上觀察了這個過程超過 8 個小時,這真是太不可思議了,當然,那隻是一個遊戲,而且範圍很窄。
但我認爲沒有理由認爲這種能力不能推廣到這些更通用的語言和世界模型系統中。所以它将非常強大,但必須謹慎處理。而且我認爲我們根本不知道。所以我簽署那封信的原因是我隻是想給那些認爲這裏沒什麽可看的,實際上有一些未知風險的波莉安娜主義者一些壓力。
我們需要定義,我認爲我們有時間,但十年時間對于即将到來的如此重大的事情來說并不長。所以我們需要對可控性等方面進行更多研究,從理論層面理解這些系統的作用。你知道,非常重要的事情,比如我們如何爲系統定義目标和價值觀,以及我們如何确保它們堅持這些目标和價值觀。這些都是當前新興技術的未知數。所以我想說我是一個謹慎的樂觀主義者。所以我認爲如果我們齊心協力,我們就能解決這個問題。我們在國際範圍内這樣做,讓所有最優秀的人才都參與進來。我們現在就開始行動。我很高興看到在英國和美國成立的人工智能安全研究所,我們将倡導這種情況的發生,并測試最新的模型。但我們需要更多這樣的機構。我隻是在鼓勵這種情況的發生。而且我認爲,如果有足夠的時間,有足夠的腦力 , 人類的聰明才智 , 我們會做好的。但風險是存在的,我們不能抄近路,我們需要認真對待它。我認爲應該懷着敬畏之心。我認爲這項技術值得我們去努力。
主持人: 你所說的有點吓人。我的意思是,如果你從國際象棋中發生的事情進行概括,國際象棋還好。但假設我每天去辦公室工作,靠下棋謀生,不是靠打敗其他人,而是因爲它對下棋有一些功利價值。你所說的系統可能會消除幾乎所有的人類價值。
Demis Hassabis: 我認爲即将出現一些重要的哲學讨論。它們很快就會出現。我們如何分配?我們應該生活在一個 AGI 運作的零和世界中。所以激進的富足。像能源之類的東西不應該短缺,因此資源和其他東西也不應該短缺。我認爲這确實改變了經濟的動态,我指的是長遠來看。所以我們現在需要開始思考這個問題,爲它做好準備。我們希望如何分配這些額外的富足和财富。無論是某種普遍基本供應還是其他類似的東西。我們需要現在就開始思考這個問題,經濟學家和像他們這樣的人。我覺得他們需要現在就開始研究這個問題。
主持人: 最後一個問題英國。我們在英國,美國正走向人工智能的中心。我們正在讨論英國是否需要更多計算能力,政府是否需要支持它。這是必需的嗎?我們有哪些可能會落後的方面?
Demis Hassabis: 我認爲這是一個巨大的增長領域,我認爲英國政府應該鼓勵它。我想說的是,更重要的是鼓勵國内投資,地方投資,規劃許可等等。我認爲這是一個建立新世界的絕佳機會。我認爲這是一個巨大的機遇。許多大公司都認爲英國是一個吸引人的研究和開展業務的地方。我們在這裏有一個很棒的生态系統。我們擁有一流的大學。這就是我們 DeepMind 在這裏的原因之一。我們在這裏有助于建立一個由英國優秀初創公司組成的生态系統,這些公司基于人工智能或與人工智能相鄰。所以我認爲政府隻需要釋放這種潛力,讓公司很容易在這裏投資和建設,包括大型數據中心。