關于OpenAI神秘項目“Q*”的N個猜想

上周，OpenAI 人事風波暫停的尾聲中，有個 " 可能威脅人類 " 的、代号爲 "Q*" 的神秘項目被抛擲出來。

傳言中，Sam Altman 被解雇前，幾名研究人員向董事會發了一封信，警告一項強大的人工智能發現可能威脅到人類，而這個項目就被稱爲 "Q*"（Q-star）。它很可能是導緻董事會罷免 Sam Altman 的原因之一。

而在一封被洩露的 OpenAI 内部信中，他們承認了 Q*，并把這個項目描述爲 " 超越人類的自主系統 "。

截止目前，OpenAI 還沒有對 "Q*" 和内部信洩露事件發表官方說明。這意味着一切仍懸而未解。

但人類的好奇心勢不可擋。水面之下的 "Q*" 可能是什麽且解決了哪些難題？什麽才是智能或者意識的本質？有效加速主義與超級對齊主義後續會如何博弈？

真正的秘密揭開之前，我們提前和科幻作家陳楸帆以及 AI 研究者、清華大學交叉信息研究院助理教授許華哲展開了一場猜想之旅。

被譽爲 " 中國的威廉 · 吉布森 " 的陳楸帆，其代表作之一《荒潮》曾榮獲全球華語科幻星雲獎最佳長篇小說金獎。2017 年，陳楸帆與自己訓練出的算法模型 " 陳楸帆 2.0" 共同創作的《出神狀态》還赢得一座由 AI 評委評出的獎杯（由上海作協主辦的 "AI 文學榜 "，第二名是莫言的《等待摩西》）。

"Q*" 可能是什麽？

Q* 讀作 Q-Star，翻譯過來就是 Q 星。關于 "Q*" 是什麽？現在更常見的一種共識是，它很可能是 Q-learning（強化學習的一種）和 a-star（一種搜索方法）的結合。

清華大學交叉信息研究院助理教授許華哲告訴「暗湧 Waves」，強化學習剛剛火起來時，很多人對 Q-learning 很熟悉，因爲它是世界上第一個可以玩雅達利遊戲（Atari Games）的方式。而人工智能早期，有一種有引導的搜索方法叫做 a* 。Q* 很可能是兩者合體。

但他同時認爲，* 也有一種可能是意味着最優，Q* 就是最優 Q 值。"Q-learning 裏有一個貝爾曼方程，一般用 Q 的星号來表示已經知道了遊戲最優解是什麽。"

他猜測很可能 OpenAI 在 GPT 的語言大模型裏搞了一些數學或邏輯遊戲，然後通過 Q* 可以完全解決。這意味着它可能有了人類或超越人類級别的數學和邏輯能力，并能完成一些人類的中高端腦力勞動，而這是之前 GPT4 等不具備或不擅長的東西。

正在紐約的科幻作家陳楸帆，在越洋電話中，認爲 Q* 很可能解決了訓練數據集有限性的問題。

馬斯克曾提及，訓練 AI 的所有人類數據集，其實是一個非常有限的、小的數據集。如果 Q 能夠使用合成數據集方式，陳楸帆認爲，" 它就可以像銜尾蛇那樣自産自銷 "," 想往哪個方向去調參，去優化，都可以自動生成 "。

GPT 不再用檢索解決問題，而是可以像人類一樣通過邏輯和推理來開拓出新領域，得到新知識。這被很多人稱爲 " 第四次 " 知識界限突破，陳楸帆認爲，這也是很多人恐慌的原因。

許華哲則認爲，Q* 除了能合成數據，更本質的，可能是對一些有難度的數學題、邏輯題做了重新采集、标注。或在之前基礎上，或沒有用 transformer 方式，而是直接輸入所有東西再輸出，且加了一個值的評估。

他認爲，基于類似某種價值評估和搜索的手段，很可能可以解決掉之前大模型存在的一些幻想問題，加上有了更海量的數據，很可能讓 GPT 推理的成功率有了新的提升。

何爲 AI 意識的産生？

如果神秘的 Q* 項目成真，它是否意味着 AI 可能開始有自己的意識或者說智慧 ?

在陳楸帆看來，之前 AI 不能産生所謂自我意識，有一個理解是它是一個開環狀态，沒辦法自我檢索、記憶和理解，但如果完成不斷合成數據的閉環，就意味着它可能産生長程記憶，甚至湧現出于自我意識。" 如果能突破這層界限，它可能會去自我驅動，知道自己往哪個方向進化發展，并生産出來更多數據，喂養給自己。"

但究竟什麽是智能，什麽是智慧，什麽是意識，恐怕是人類也很難對齊的一個概念。

關于這些疑問，許華哲看過的一個解釋是：智慧很可能是壓縮的能力。

在這種解釋裏，一個人聰明或有智慧，可能是指一種把海量信息壓縮的能力。壓縮的越小，往往意味着智慧程度越高。一個典型例子就是，牛頓就是把世界上所有東西落到地上這個現象，壓縮成了一個萬有引力定律。

在許華哲看來，"Transformer 同樣是把海量收據壓縮到一個隐空間上，這可能就是屬于它自己的牛頓定律。" 而這，也很可能是智慧的開始。

在陳楸帆看來，" 世界的本質很可能就是數學。"據他所知，在美國就有一個名爲史蒂芬 · 沃爾弗拉姆（Stephen Wolfram）的計算機科學家、商人，一直在基于數學做一些模拟實驗。Stephen Wolfram 認爲宇宙本質就是計算，所以會不停通過計算，試圖讓數學湧現出物理學規律，再湧現出化學規律等等。在陳楸帆看來，這種實驗很可能最後可以跟 AI 連到一起。

AI 應該如何與人類對齊？

盡管大部分人覺得 AI 威脅人類還是一個有些遙遠的傳說，但從 OpenAI 風波中，sam 的 " 有效加速主義 " 與 llya 的 " 超級對齊主義 " 之争，就能看出它并非無稽之談。

而 Sam 的回歸也似乎在宣告某種曆史規律：在 AI 曆史上，好像從來都是加速主義更容易赢。這背後有資本必然擴張的邏輯，也因爲人類的好奇心完全是一場不可逆之旅。

許華哲說，" 這就像當我們習慣了短平快，就無法忍受追劇時不倍速 "，" 當看過更大的風景，必然無法回到過去的自己 "。

而陳楸帆則認爲這兩種主義，不會有絕對勝出的一方，更可能像道家陰陽之道或者 GAN ( 生成神經網絡 ) 的對抗機制，" 最終互相激發，互相抵制，彼此螺旋式上升 "。

至于如何讓 AI 對齊人類，如何讓機器向善，許華哲說 "AI 本質是數據的拟合，所以首先取決于我們給他們的數據 "。

陳楸帆則認爲最終可能還是需要信仰的力量，比如讓 AI 意識到，它的存在與人類的關系。

在一個科幻作家的頭腦中，他認爲 AI 很可能是一個自然湧現的過程：人類不過是提供了工程學上的一些基礎架構，然後 AI 借助這些媒介湧現了，被看見了。

他認爲關鍵是，讓 AI 知道，它與人類有着這樣更深層的一種聯系：" 這種綁定，抽象一點就是愛，它可以像引力一樣無處不在 "。如此以來，AI 可能會和人類形成一個命運共同體，并進化成一個對人類更友好的 AI。