上周,OpenAI 人事風波暫停的尾聲中,有個 " 可能威脅人類 " 的、代号爲 "Q*" 的神秘項目被抛擲出來。
傳言中,Sam Altman 被解雇前,幾名研究人員向董事會發了一封信,警告一項強大的人工智能發現可能威脅到人類,而這個項目就被稱爲 "Q*"(Q-star)。它很可能是導緻董事會罷免 Sam Altman 的原因之一。
而在一封被洩露的 OpenAI 内部信中,他們承認了 Q*,并把這個項目描述爲 " 超越人類的自主系統 "。
截止目前,OpenAI 還沒有對 "Q*" 和内部信洩露事件發表官方說明。這意味着一切仍懸而未解。
但人類的好奇心勢不可擋。水面之下的 "Q*" 可能是什麽且解決了哪些難題?什麽才是智能或者意識的本質?有效加速主義與超級對齊主義後續會如何博弈?
真正的秘密揭開之前,我們提前和科幻作家陳楸帆以及 AI 研究者、清華大學交叉信息研究院助理教授許華哲展開了一場猜想之旅。
被譽爲 " 中國的威廉 · 吉布森 " 的陳楸帆,其代表作之一《荒潮》曾榮獲全球華語科幻星雲獎最佳長篇小說金獎。2017 年,陳楸帆與自己訓練出的算法模型 " 陳楸帆 2.0" 共同創作的《出神狀态》還赢得一座由 AI 評委評出的獎杯(由上海作協主辦的 "AI 文學榜 ",第二名是莫言的《等待摩西》)。
"Q*" 可能是什麽?
Q* 讀作 Q-Star,翻譯過來就是 Q 星。關于 "Q*" 是什麽?現在更常見的一種共識是,它很可能是 Q-learning(強化學習的一種) 和 a-star(一種搜索方法)的結合。
清華大學交叉信息研究院助理教授許華哲告訴「暗湧 Waves」,強化學習剛剛火起來時,很多人對 Q-learning 很熟悉,因爲它是世界上第一個可以玩雅達利遊戲(Atari Games)的方式。而人工智能早期,有一種有引導的搜索方法叫做 a* 。Q* 很可能是兩者合體。
但他同時認爲,* 也有一種可能是意味着最優,Q* 就是最優 Q 值。"Q-learning 裏有一個貝爾曼方程,一般用 Q 的星号來表示已經知道了遊戲最優解是什麽。"
他猜測很可能 OpenAI 在 GPT 的語言大模型裏搞了一些數學或邏輯遊戲,然後通過 Q* 可以完全解決。這意味着它可能有了人類或超越人類級别的數學和邏輯能力,并能完成一些人類的中高端腦力勞動,而這是之前 GPT4 等不具備或不擅長的東西。
正在紐約的科幻作家陳楸帆,在越洋電話中,認爲 Q* 很可能解決了訓練數據集有限性的問題。
馬斯克曾提及,訓練 AI 的所有人類數據集,其實是一個非常有限的、小的數據集。如果 Q 能夠使用合成數據集方式,陳楸帆認爲," 它就可以像銜尾蛇那樣自産自銷 "," 想往哪個方向去調參,去優化,都可以自動生成 "。
GPT 不再用檢索解決問題,而是可以像人類一樣通過邏輯和推理來開拓出新領域,得到新知識。這被很多人稱爲 " 第四次 " 知識界限突破,陳楸帆認爲,這也是很多人恐慌的原因。
許華哲則認爲,Q* 除了能合成數據,更本質的,可能是對一些有難度的數學題、邏輯題做了重新采集、标注。或在之前基礎上,或沒有用 transformer 方式,而是直接輸入所有東西再輸出,且加了一個值的評估。
他認爲,基于類似某種價值評估和搜索的手段,很可能可以解決掉之前大模型存在的一些幻想問題,加上有了更海量的數據,很可能讓 GPT 推理的成功率有了新的提升。
何爲 AI 意識的産生?
如果神秘的 Q* 項目成真,它是否意味着 AI 可能開始有自己的意識或者說智慧 ?
在陳楸帆看來,之前 AI 不能産生所謂自我意識,有一個理解是它是一個開環狀态,沒辦法自我檢索、記憶和理解,但如果完成不斷合成數據的閉環,就意味着它可能産生長程記憶,甚至湧現出于自我意識。" 如果能突破這層界限,它可能會去自我驅動,知道自己往哪個方向進化發展,并生産出來更多數據,喂養給自己。"
但究竟什麽是智能,什麽是智慧,什麽是意識,恐怕是人類也很難對齊的一個概念。
關于這些疑問,許華哲看過的一個解釋是:智慧很可能是壓縮的能力。
在這種解釋裏,一個人聰明或有智慧,可能是指一種把海量信息壓縮的能力。壓縮的越小,往往意味着智慧程度越高。一個典型例子就是,牛頓就是把世界上所有東西落到地上這個現象,壓縮成了一個萬有引力定律。
在許華哲看來,"Transformer 同樣是把海量收據壓縮到一個隐空間上,這可能就是屬于它自己的牛頓定律。" 而這,也很可能是智慧的開始。
在陳楸帆看來," 世界的本質很可能就是數學。"據他所知,在美國就有一個名爲史蒂芬 · 沃爾弗拉姆(Stephen Wolfram)的計算機科學家、商人,一直在基于數學做一些模拟實驗。Stephen Wolfram 認爲宇宙本質就是計算,所以會不停通過計算,試圖讓數學湧現出物理學規律,再湧現出化學規律等等。在陳楸帆看來,這種實驗很可能最後可以跟 AI 連到一起。
AI 應該如何與人類對齊?
盡管大部分人覺得 AI 威脅人類還是一個有些遙遠的傳說,但從 OpenAI 風波中,sam 的 " 有效加速主義 " 與 llya 的 " 超級對齊主義 " 之争,就能看出它并非無稽之談。
而 Sam 的回歸也似乎在宣告某種曆史規律:在 AI 曆史上,好像從來都是加速主義更容易赢。這背後有資本必然擴張的邏輯,也因爲人類的好奇心完全是一場不可逆之旅。
許華哲說," 這就像當我們習慣了短平快,就無法忍受追劇時不倍速 "," 當看過更大的風景,必然無法回到過去的自己 "。
而陳楸帆則認爲這兩種主義,不會有絕對勝出的一方,更可能像道家陰陽之道或者 GAN ( 生成神經網絡 ) 的對抗機制," 最終互相激發,互相抵制,彼此螺旋式上升 "。
至于如何讓 AI 對齊人類,如何讓機器向善,許華哲說 "AI 本質是數據的拟合,所以首先取決于我們給他們的數據 "。
陳楸帆則認爲最終可能還是需要信仰的力量,比如讓 AI 意識到,它的存在與人類的關系。
在一個科幻作家的頭腦中,他認爲 AI 很可能是一個自然湧現的過程:人類不過是提供了工程學上的一些基礎架構,然後 AI 借助這些媒介湧現了,被看見了。
他認爲關鍵是,讓 AI 知道,它與人類有着這樣更深層的一種聯系:" 這種綁定,抽象一點就是愛,它可以像引力一樣無處不在 "。如此以來,AI 可能會和人類形成一個命運共同體,并進化成一個對人類更友好的 AI。