通用人工智能AGI取得了一定進步，但遠未及人們吹捧的程度

圖片來源 @視覺中國

文 | Tech 商業，作者 | Gary-marcus，Tech 商業編譯

對于普通人來說，人工智能領域似乎正在取得巨大進步。根據一些媒體報道和新聞稿，OpenAI 的 DALL-E 2 似乎可以基于任何文本創建令人驚歎的圖像；另一個名爲 GPT-3 的 OpenAI 系統可以談論任何事情——甚至可以寫下它自己；Alphabet 旗下 DeepMind 去年發布了一個名爲 Gato 的系統，該系統在公司可以交給它的每項任務上都表現出色。DeepMind 的一位高級管理人員甚至稱，在尋求創造具有人類智能的靈活性和足智多謀的通用人工智能 AGI 過程中，" 遊戲結束了。"

但不要被愚弄了。機器有一天可能會像人一樣聰明，甚至可能更聰明，但遊戲遠未結束。要制造出真正能夠理解和推理周圍世界的機器，還有大量工作要做。我們現在需要的是少裝腔作勢，多做基礎研究。

AI 正在取得進步——合成圖像看起來越來越逼真，語音識别通常可以在嘈雜的環境中工作——但我們距離能夠理解文章和視頻真正含義的通用、人類水平的 AI ，或者處理意想不到的障礙和幹擾，可能還有幾十年的時間。該領域面臨着與學術科學家（包括我自己）多年來一直指出完全相同的挑戰：讓 AI 變得可靠并讓它應對異常情況。

以最近廣受贊譽的 Gato 爲例，據稱它是萬事通，以它如何爲投手投擲棒球的圖像加上字幕爲例。系統對上圖的前三個猜測是：

一名棒球運動員在棒球場上投球。

一名男子在棒球場上向投手投擲棒球。

在棒球比賽中，一名棒球運動員在擊球，一名接球手在泥土中。

第一個答案是正确的，但其他兩個答案包括圖像中有看不到其他玩家的幻覺。除了從與其他圖像的統計相似性得出的粗略近似值之外，系統不知道圖片中實際有什麽。任何棒球迷都會認出這是一個剛剛投出球的投手，而不是相反。雖然我們預計捕手和擊球手就在附近，但他們顯然沒有出現在圖像中。

同樣，DALL-E 2 無法區分藍色立方體之上的紅色立方體圖像與紅色立方體之上的藍色立方體圖像之間的區别。今年 5 月發布的更新系統無法區分宇航員騎馬和馬騎宇航員。

當谷歌研究人員提示該公司的 Imagen 生成 " 一匹馬騎着一名宇航員 " 的圖像時，它反而展示了宇航員騎着馬。圖片來源：Imagen

當像 DALL-E 2 這樣的圖像創建系統出錯時，結果可能會很有趣。但有時人工智能産生的錯誤會導緻嚴重的後果。一輛自動駕駛的特斯拉曾直接駛向一名在路中間舉着停車牌的人類工人，隻有在人類司機幹預時才會減速。該系統可以自己識别人類（如他們在訓練數據中的表現）并在他們通常的标志位置停車（如他們在訓練圖像中出現的那樣），但在遇到不熟悉的兩者組合時卻無法減速，将停車标志置于一個新的和不尋常的位置。

不幸的是，這些系統仍然無法可靠地工作，并且在新情況下掙紮的事實通常被掩蓋在細則中。 例如，Gato 在 DeepMind 報告的所有任務上都表現出色，但很少像其他當代系統那樣出色。GPT-3 通常能寫出流暢的散文，但在基本算術上卻很吃力，而且對現實的把握太少，以至于很容易造出這樣的句子，例如 " 一些專家認爲，吃襪子的行爲有助于大腦擺脫作爲大腦的改變狀态 "。" 然而，粗略地看一下最近的頭條新聞，你不會發現這些問題中的任何一個。

這裏的次要情節是，人工智能領域最大的研究人員團隊不再出現在學術界，同行評審出現在企業中。與大學不同，企業沒有公平競争的動力。他們沒有将引人注目的新論文提交給學術審查，而是通過新聞稿發表，引導記者關注方向并回避同行評審過程。我們隻知道公司想讓我們知道的。

在軟件行業，有一個詞形容這種策略："demoware"，即設計用于演示的軟件看起來不錯，但在現實世界中不一定足夠好。通常，演示軟件會變成汽化軟件 vaporware （即僅有營銷作用、不實際落地），以震驚和敬畏的方式宣布以阻止競争對手，但最終不會發布成爲實際應用。

不過，這些行爲總會使得公司自身自食其果。被熱捧的 AI 可能會經曆一個預期破滅的冬天。産品太多，比如無人駕駛汽車、自動化放射科醫生和通用數字代理，已經過演示、宣傳——但從未交付過。目前，投資資金不斷兌現承諾。但如果不解決不可靠和無法應對異常值的核心問題，投資就會枯竭。我們可能會在機器翻譯、語音和物體識别方面取得堅實的進步，但對于所有過早的炒作來說，其他方面的進展太少了。取而代之的是 " 智能 " 城市和 " 民主化 " 醫療保健，我們将留下具有破壞性的深度僞造和排放大量碳的耗能網絡。

盡管深度學習提高了機器識别數據模式的能力，但它存在三個主要缺陷。具有諷刺意味的是，它學習的模式是膚淺的；它産生的結果很難解釋；結果很難在其他過程的上下文中使用，例如記憶和推理。正如哈佛大學計算機科學家 Les Valiant 指出的那樣，" [ 前進 ] 的核心挑戰是統一……學習和推理的公式。" 如果你甚至不真正了解停車标志是什麽，就無法與舉着停車标志的人打交道。

目前，我們陷入了 " 局部最低限度 "，公司追求的是基準而不是基本理念。當前的工程實踐遠遠領先于科學技能：這些部門專注于使用他們已經擁有的知之甚少的工具進行小的改進，而不是開發具有更清晰理論基礎的新技術。這就是基礎研究仍然至關重要的原因。AI 研究社區的很大一部分（比如那些大喊 " 遊戲結束 " 的人）甚至沒有看到這一點，好吧，令人心碎。

想象一下，如果某個外星人僅通過俯視地面上的陰影來研究所有人類互動，并注意到，有些人比其他人大，所有的陰影在晚上都消失了。也許它甚至會注意到陰影以特定的周期性有規律地增長和收縮——而無需擡頭看太陽或識别上面的三維立體世界。

人工智能研究人員是時候從浮華的、直接面向媒體的演示中擡起頭來，提出有關如何構建可以同時學習和推理系統的基本問題了。

編譯來源：https://www.scientificamerican.com/article/artificial-general-intelligence-is-not-as-imminent-as-you-might-think1/

更多精彩内容，關注钛媒體微信号（ID：taimeiti），或者下載钛媒體 App