新晉諾貝爾化學獎得主、DeepMind 創始人哈薩比斯的最新訪談來了~
聊了 DeepMind 的初衷以及正在做的事,聊了 AGI,還聊了 AI 的未來。
對于 AGI,此前奧特曼曾表示可能 5 年内到來,馬斯克也曾預測很快将實現,而哈薩比斯則認爲沒那麽快。
他認爲要達到 AGI,還需要約 10 年的時間,而且還需要實現兩三個重大創新才能 AGI。
而且将人工智能僅僅視爲另一種技術是錯誤的,這将比互聯網等帶來的影響要大得多,AI 将是 " 劃時代的定義性 " 技術。
……
哈薩比斯這次還明确表明 "DeepMind 的目标從開始到今天仍是達到 AGI"、"DeepMind 仍然是一家以研究爲主導的機構 "。
不過有意思的是,在被問到他個人是如何保持持續研究的?哈薩比斯回答道:
之前通常會在午夜到淩晨 3 點間閱讀思考,但現在很多原本用于思考的時間現在都用來處理電話會議了。所以,需要考慮如何重新規劃時間。
總之,網友們整個訪談看下來,那叫一個津津有味:
還有網友認真記筆記:
關鍵點:
AGI 仍然是 10 年後的事。
當前的 AI 炒作階段是關于讓 Agent 執行在線 / 離線任務的故事 .
這一切将如何發展,你将擁有一個主要的通用智能系統,它将調用多個擅長特定任務的 AI Agent 進行協作處理任務 .
個别網友的關注點那可就不一樣了,不在發言上,而在:
話不多說,量子位在不改變原意的基礎上對這次訪談的内容進行了翻譯整理,各位看官們請享用~
Q:你 2010 年左右開始創業,那時已有一些早期想法,但之前 AI 經曆了幾十年寒冬,人工智能似乎并未取得顯著進展。爲什麽那時你會選擇創立 DeepMind?
哈薩比斯:
實際上,我從事 AI 研究已經超過 30 年了。
首先是在遊戲領域,制作遊戲 AI 和模拟遊戲。然後我學習了計算機科學和神經科學。我一直在觀察 AI 領域的發展。
在 90 年代,就是你所說的 AI 寒冬期間,主要是邏輯系統,被稱爲專家系統。許多人可能還記得深藍擊敗國際象棋大師加裏 · 卡斯帕羅夫,這些都是預先編程的系統,程序員和系統設計師解決問題并将其規則化。
然而,計算機或 AI 系統實際上并不智能,它隻是機械地執行這些啓發式規則,問題在于這會導緻系統脆弱。它們無法學習新事物,當然也無法發現新事物,因爲它們的能力顯然受限于設計者或程序員已經知道的内容。
對我來說,在 90 年代,無論是在劍橋還是麻省理工學院,我所學習的地方,普遍都認爲邏輯系統是正确的方向。
我認爲這就是人工智能寒冬的原因之一,因爲它們本質上是脆弱且有限的。
所以到了 2010 年,随着深度學習在學術界誕生,我們看到了新的可能。我們還發現大腦中的多巴胺系統也使用了強化學習,動物包括人類都是通過強化學習來學習。
因此,我明白我們需要構建的是一個能夠自我學習并具有通用性的系統,這就是 DeepMind 的起源。
我們也看到了像 GPU 這樣的硬件正在加速發展。我在 GPU 最初用于計算機圖形和電腦遊戲時就開始使用它們,但它們非常通用。
事實證明,世界上所有東西都可以歸結爲矩陣乘法。
所以,我們很早就感覺到,将這些初生的想法和成分集合起來需要一種類似執行阿波羅計劃的努力,能夠迅速推動技術進步,最終也确實實現了這一點。
Q:這是你當初在 2010 年設想的未來嗎?你是否曾想象過,15 年後,會在這裏向衆多聽衆講述 AI 的重要性,并且已經解決了蛋白質折疊問題?
實際上,一切大緻按照我們的計劃進行。當然,途中有些小波折和意外。但當我們在 2010 年開始時,我們認爲大約需要 20 年的時間才能實現 AGI。
我認爲我們可能還有大約 10 年就能達到這個目标。
所以,大緻上是按照這個時間線進行的。而且,蛋白質折疊以及在通向 AGI 的過程中使用 AI 系統進行科學研究一直是我的熱情所在。
蛋白質折疊一直是我希望解決的科學問題列表中的首位,如果我們能找到突破,這将是革命性的。
Q:我們來談談 AGI。有趣的是,自 ChatGPT 出現以來,大家對 AI 的讨論非常激烈,這與你所做的 AI 完全不同。到目前爲止,作爲一個觀察者來看,你的 AI 都是非常具體的,看起來有點奇怪,你開始做一些看似無意義的事情,你在電腦遊戲上變得非常擅長……
我不會說它們毫無意義,但更多的是爲了娛樂,也許你可以這麽說。
我們從遊戲開始,部分原因是因爲我在制作遊戲和在象棋等方面的背景。
自圖靈時代以來,遊戲一直與 AI 發展密切相關,像香農這樣的偉人,他們從象棋程序開始,這幾乎是每個 AI 先驅所做的。
象棋被認爲是 AI 系統的訓練場。
你的算法想法能否快速取得進展?通過它很容易就能 benchmark 你的位置,你知道,如果你打敗了世界冠軍或最好的計算機,那你就做得很好。
但重點是,這些總是達到目的的手段,而不是目的本身。
所以,想法總是要發展,不僅僅是成爲圍棋或象棋的世界冠軍,而是以一種通用的方式進行,這種方式可以轉移到其他領域,包括科學和商業應用。
這就是我們使用深度強化學習所做的,也是我們與 AlphaGo 所做的。所有這些都是非常通用的系統和技術,我們今天仍在使用。
當涉及到像 AlphaFold 解決蛋白質折疊之類的問題時,你真正感興趣的是解決方案本身。
你知道,如果你有治療癌症的方法,你不在乎它是如何完成的,你隻想要治療癌症的方法。所以你真的會想盡一切辦法去嘗試。
所以最開始是以所擁有的所有通用技術作爲基線,然後觀察領域本身,如果這個領域對社會或商業來說足夠有價值,那麽你在上面添加定制的東西,這就是如何得到像 AlphaFold 這樣的突破性程序。
但最終,DeepMind 的目标從開始到今天仍是達到 AGI,這意味着一個通用系統,能夠開箱即用地完成人類能做的任何認知任務。
完全通用的圖靈機,正如艾倫 · 圖靈在 50 年代指定的,能夠計算任何可計算的東西。這是 AI 領域的最初目标,也是 DeepMind 的目标。
當然,你最近看到的是像這些語言模型這樣的東西。顯然,ChatGPT 觸及了每個人,實際上所有頂尖實驗室,包括谷歌和 DeepMind 都在研究語言模型。
我們有自己的内部模型,叫做 Chinchilla,谷歌也有他們的。當然,這一切都基于谷歌研究院發明的 Transformer 架構,所有當前的模型都基于此。
這是一個令人興奮的時期,因爲語言顯然是一種通用能力。
所以這就是每個人都對聊天機器人感到非常興奮的原因,這種技術能夠擴展到如此廣的程度,真是既有趣又出人意料。
我認爲我們比以往任何時候都更接近于構建這種通用系統,但目前仍然需要專門的系統來在特定領域達到最高水平。
Q:LLM 是否更接近于 AGI?我的感覺是,它更像是與人類互動。但實際上是這樣嗎?
我認爲現在甚至連 " 大語言模型(LLMs)" 這個詞都不夠準确了,因爲它們不僅僅是大語言模型,還是多模态的。
例如,我們的模型 Gemini 從一開始就是多模态的。因此,它可以處理任何輸入,比如視覺、音頻、視頻、代碼以及文本。
我認爲這将是 AGI 系統的一個關鍵組成部分,但可能本身還不夠。我認爲從現在到我們實現 AGI 還需要兩到三個重大創新。
這也是爲什麽我提出 10 年的時間框架,一些同行、競争對手的時間線比這更短,但我認爲 10 年大緻合适。
Q:現在你們正在進行一些非常實用的項目,比如我們提到的蛋白質折疊和天氣預報。你們最近在國際數學奧林匹克競賽中獲得了銀牌,如果努力的話,或許還能獲得金牌。
你們還在開展其它多種活動,但我想知道,你們是否也在幕後考慮如何繼續推動 AGI 的發展?你們是否有團隊在緻力于這一目标?
我們确實是一個大型組織,正如你所說,我們最初是以貝爾實驗室的模式建立的,這是世界上最優秀的工業實驗室之一,能夠發明未來并進行長期規劃。
我們已經展示了這種模式的效力,特别是在爲現今你所見的技術奠定基礎方面。
所以我認爲任何深科技初創公司,都需要時間來發展和成熟其技術。我們現在處于一個非常激動人心的時刻,在過去的兩三年中,這些技術已經相當成熟,準備應用于各種事物。
這不僅包括科學、數學和醫學等領域的進步,也包括生産力和商業應用,例如聊天機器人或是重新設計的工作流程和電子郵件系統。
這些都還處于初期階段,我們也在所有這些方面進行工作。
我認爲谷歌擁有超十五億用戶的服務和産品,AI 是所有這些事物的核心,新功能不斷加入,這些都源自我們在 DeepMind 開發的技術。
從某種意義上說這很棒,因爲針對産品的技術需求與我們朝向 AGI 所做的研究大約 90% 相似,這些領域已經大幅融合。
如果是五年或十年前,如果你想在産品中構建 AI,你必須回到邏輯網絡、專家系統,因爲通用系統和學習系統還不夠好。就像 Alexa 時代的助手,仍然基于那種舊技術,它們脆弱且不具有普适性,最終并不那麽有用。
而新一代助手會更加有能力,所以這實際上非常令人興奮。
我實際上看到像 Gemini 以及我們自己對未來多模型助手的設想,比如 Astra 項目,在通往 AGI 系統的關鍵路徑上,它們實際上推動了朝那個方向的研究。
我們有一個展示Astra的視頻:
這隻是一個基本的全能助手的開始,它可以在你的日常生活中幫助你。還會有不同的形式,你可以在手機上看,你可以在眼鏡等設備上看,我無法告訴你這會有多麽驚人。
如果我們回到五年前,你告訴我我們會達到現在這個地步,你隻需要用相機指向某物,它就能完全理解你周圍的空間環境,這相當不可思議。
它有點像是已經掌握了概念,并且理解什麽是物體,甚至能通過窗外随機的一瞥認出我們所在的位置。像記憶這樣的功能,它能記住你把東西放在哪裏,這對助手來說也非常有用,還有個性化,所有這些都是我所說的下一代助手的一部分,我稱之爲通用助手。
因爲我想象你會帶着它到處走,使用不同的設備,無論它是在和你玩遊戲,還是在你的桌面上幫助你工作,或者在移動設備上随你一起旅行,都是同一個助手。
Q:一些人可能認爲當前的進展是向 AGI 邁進的一步,而另一些人則認爲現在的方法存在本質的局限,這種局限是目前的方法無法克服的。
你認爲這種進展是正在逐步接近目标,還是存在其他更複雜的問題需要解決?
我們确實需要這些系統,我相信你們都體驗過各種先進的聊天機器人。
這些系統目前還比較被動,主要是問答系統。雖然它們在回答問題、進行基本研究或文本總結方面頗有用處。
我們接下來想要的是更多基于 Agent 的系統,能夠完成你指派的具體任務。這正是一個高效的數字助手應該提供的功能,例如規劃假期、安排城市行程、購買活動門票等。
因此,這些系統需要能夠在現實世界中進行行動、執行計劃和推理。我們需要更好的規劃能力、推理、行動執行能力,更強的記憶力,以及更精準的個性化,使系統能夠理解用戶的偏好并記住用戶的指示和喜好,所有這些技術都是必需的。
我們的一些遊戲程序,比如在圍棋上擊敗世界冠軍的 AlphaGo,就包含了規劃和推理,雖然這些都是在遊戲這一狹窄領域内。我們必須将這些技術現在應用到像 Gemini 這樣的模型上,正如你所見,它能理解其周圍的世界。
但如何在遊戲之外的混亂的現實世界中進行規劃,我認爲這是需要實現的下一個重大突破。
Q:那個助手也能達到像 AlphaGo 那樣的國際象棋水平嗎?
是的。
所以,确切地說,目前研究界正在進行一場非常有趣的讨論,關于這個問題有兩種可能的解決方式。
你可以想象,你的通用 Agent 系統能夠使用工具,這些工具可能是物理硬件如機器人,或者是軟件,比如計算器,甚至是其它 AI 系統。
例如,你可以設想一個通用 AI 系統,類似于人類大腦,它可以調用 AlphaFold 或 AlphaGo 來折疊蛋白質或下圍棋。由于這些功能都是數字化的,你也可以考慮将這些能力集成到一個通用大腦系統中,如 Gemini。
但這樣做需要權衡,因爲這可能導緻系統過載特定信息,例如過多的棋局信息可能會削弱其在語言處理方面的能力。
這是一個開放的研究問題:是将這些工具保留爲獨立的 AI 工具,供通用 AI 在特定情境下使用,還是将它們整合到主系統中?
對于一些功能,如編程和數學,整合到主系統可能更有益,因爲這可以提升系統的整體性能。因此,我們也在研究學習理論、小孩子的發展等,來深入理解哪些功能最适合作爲通用工具集成在主系統中。
Q:你們是否仍在努力追求成爲類似貝爾實驗室那樣的研究機構?
我們仍然是一家以研究爲主導的機構,這就是我們在 Google DeepMind 的工作方式。
但是,我們逐漸擁有越來越大的産品供應組,與谷歌的其它部分進行交互。盡管如此,我們仍然嘗試保護我們的基礎研究,使其能夠根據我們自己的研究路線圖進行更長遠和更開放的思考,而不僅僅是被産品路線圖所引導。
Q:你個人是如何跟上這些的?
我之前常常把晚上的時間留給自己,我一直試圖保持這樣的習慣,作爲一個夜貓子,我通常會在午夜到淩晨 3 點之間思考、閱讀研究論文和産生新想法。
但随着時間的推移,盡管我仍然在倫敦,但我在加利福尼亞有了更多的團隊。因此,很多原本用于思考的時間現在都用來處理電話會議了。所以,我需要考慮如何重新規劃這段時間。
Q:我知道你是簽署了關于真實存在性風險警告的公開信的人之一,雖然這種風險沒有具體定義。你對希望與災難論持何種态度?
我認爲這個問題的兩端都存在很多瘋狂的炒作。
一邊是現在所謂的 " 災難陣營 ",人們認爲事情肯定會出錯。另一邊是 "Pollyanna 陣營 ",他們認爲這隻是另一種技術。
我們在移動互聯網的發展中已經見過這種情況。作爲一個社會,作爲人類,我們具有極強的适應能力,這些變化似乎并不特别。
然而,我堅信這種看法是錯誤的。我認爲這将比互聯網或移動互聯網等技術的影響要大得多,這是一個劃時代的定義。
我認爲越來越多的人開始意識到這一點,我從小就有這種想法,這也是我爲什麽一生都在從事這一領域工作。我相信這将帶來巨大的影響。
當然,我之所以全身心投入,是因爲我相信 AI 将對世界産生極其正面的影響。借助 AI,我們即将能夠治愈所有疾病,通過材料科學和新能源幫助解決氣候問題,以及在我們日常生活中提高生産力,豐富我們的生活,并自動處理日常任務。
我認爲這些都是令人驚奇的,而且即将到來。
但這些系統存在風險,這些是新系統,是新技術,它們非常強大。我在遊戲的微觀世界中見證了這一點。
比如下棋,你從一個早上還是随機的系統 AlphaZero 開始,到上午的咖啡休息時間,它就已經變得比我強了。到了午餐時間,它已經比世界冠軍還要強。然後到了下午,在八小時内,它已經超越了世界上最好的固定編程的國際象棋計算機。
在八小時内從随機狀态變成世界上最棒的國際象棋實體,我實際上觀察了那個過程,這是相當不可思議的。
當然,那隻是一個遊戲,範圍很窄,但我看不出爲什麽那種能力不能被推廣到更通用的系統、語言和世界模型等領域。
因此,它将非常強大,但必須小心處理。
我認爲我們現在還不知道。所以我簽署那封信的原因是我想對那種 " 這裏沒什麽可看的 " 的 Pollyanna 主義提出一些反對意見,實際上存在一些未知的風險,我們需要定義它們,我認爲我們還有時間,但對于這樣重大的事情來說,十年并不是很長的時間。
因此,我們需要在可控性、在理論層面上理解這些系統的行爲等方面進行更多的研究,還有非常重要的事情,比如如何爲這些系統定義目标和價值觀,以及如何确保它們堅持這些目标和價值觀。
這些都是當前新興技術中的未知數。
所以我會說我是一個謹慎的樂觀主義者。我認爲如果我們能團結起來,國際上合作,集中最好的智力,現在就開始行動,我們将能解決這個問題。
因此,我隻是在鼓勵這種事情發生。我相信,隻要有足夠的時間和智力,我們可以做對。但是,存在風險,我們不能走捷徑。我們需要以應有的尊重和敬畏來對待這項技術。
因爲我們正處于這項技術的風口浪尖。
Q:你所說的讓我有些不安。你描述的系統,似乎有可能在很大程度上取代人類的價值。
我不這麽認爲。我認爲即将出現一些重要的哲學讨論。這些讨論很快就會展開。比如,我們應該如何擴散?
如果 AGI 起作用,我們應該處于一個極大豐富的時代,像能源這樣的資源不應該存在短缺的情況。所以我認爲這确實會改變經濟的動态。
我說的是長遠來看。因此,我們現在需要開始思考這個問題,爲此做準備。比如,我們想如何分配那額外的豐富和财富,我們現在就需要開始考慮這些問題。
參考鏈接:
[ 1 ] https://x.com/GoogleDeepMind/status/1846974292963066199
[ 2 ] https://x.com/tsarnick/status/1846994737527771642