原标題:在混亂中的 OpenAI
薩姆 · 奧特曼的震驚周末始于一年前,即 ChatGPT 的發布
作者:凱倫 · 豪和查理 · 沃澤爾
要真正理解過去 48 小時發生的事件—— OpenAI 首席執行官薩姆 · 奧特曼的出人意料的罷免,他可謂生成式人工智能革命的領軍人物,緊接着有報道稱該公司正試圖将他召回——我們必須明白,OpenAI 并不是一家技術公司。至少,它不像互聯網時代的其他劃時代公司那樣,比如 Meta、谷歌和微軟。
OpenAI 成立于 2015 年,最初是一個非盈利機構,緻力于創造能夠惠及 " 全人類 " 的人工通用智能(AGI)。
根據公司的說法,AGI 将足夠先進,能夠在 " 大多數具有經濟價值的工作 " 上超越任何人——這正是需要負責任管理的強大技術。
在這種構想中,OpenAI 将更像是一個研究機構或智囊團。公司的憲章直截了當地指出,OpenAI 的 " 首要法定責任是對人類負責 ",而不是對投資者或甚至是員工負責。
這種模式并沒有持續太久。
2019 年,OpenAI 推出了一個 " 限制利潤 " 的子公司,這使它能夠籌集資金、吸引頂尖人才,并最終制造商業産品。但非盈利的董事會仍然保持着完全的控制權。
這些公司細節是 OpenAI 迅速崛起和奧特曼令人震驚的隕落的核心故事。
上周五,奧特曼被 OpenAI 董事會解雇,是公司兩個意識形态極端之間權力鬥争的高潮——一個群體源自矽谷的技術樂觀主義,對快速商業化充滿活力;另一個群體深陷對人工智能對人類構成的存在風險的恐懼中,必須極其謹慎地加以控制。多年來,這兩方設法共存,雖然途中有些颠簸。
這種微妙的平衡在一年前幾乎就在這一天被打破了,這要歸功于當前和前任員工所說的,使 OpenAI 走向全球知名的正是那個原因:ChatGPT。
從外界看來,ChatGPT 似乎是有史以來最成功的産品發布之一。它的增長速度超過了曆史上任何其他消費者應用,似乎單槍匹馬地重新定義了數百萬人對自動化的威脅和承諾的理解。但它使 OpenAI 朝着完全相反的方向發展,加劇并惡化了已經存在的意識形态裂痕。
ChatGPT 加速了爲了利潤而創造産品的競賽,同時給公司的基礎設施和專注于評估和緩解技術風險的員工帶來了前所未有的壓力。
這加劇了 OpenAI 内部派系之間已經緊張的關系——奧特曼在 2019 年的一封員工郵件中将其稱爲 " 部落 "。
《大西洋月刊》與 OpenAI 的 10 名現任和前任員工的對話中,揭示了公司發生的一場變革,這導緻領導層之間出現了無法持續的分裂。(我們同意不透露任何員工的姓名——他們都告訴我們,他們擔心坦率地向媒體透露 OpenAI 内部情況會帶來後果。)
他們的描述共同描繪了這樣一個畫面:随着時間的推移,盈利部門商業化的壓力日益增加,與公司的既定使命發生了沖突,直到 ChatGPT 和其他緊随其後的産品發布使一切達到了頂點。
" 在 ChatGPT 之後,賺取收入和利潤的道路變得清晰," 一位消息人士告訴我們。" 你再也無法爲作爲一個理想主義研究實驗室的身份辯護了。這裏有客戶正在等待服務。"
我們仍然不确切知道奧特曼爲何被解雇,也不清楚他是否會回到原來的職位。今天下午,奧特曼訪問了位于舊金山的 OpenAI 總部,讨論可能的協議,但他沒有回應我們的置評請求。
董事會在上周五宣布,一項 " 審慎的審查過程 " 發現他在與董事會的溝通中 " 并不總是坦率 ",這導緻董事會對他擔任 OpenAI 首席執行官的能力失去信心。随後,一份由首席運營官發給員工的内部備忘錄(一位 OpenAI 發言人證實了此事)指出,解雇是由于奧特曼與董事會之間的 " 溝通斷裂 ",而不是由于 " 不法行爲或與我們的财務、商業、安全或安全 / 隐私實踐有關的任何事項 "。但沒有給出具體的詳細信息。我們所知道的是,過去一年在 OpenAI 是混亂的,主要由公司方向上的明顯分歧所定義。
2022 年秋天,在 ChatGPT 發布之前,OpenAI 的所有員工都在爲其迄今爲止最強大的大型語言模型 GPT-4 的發布做準備。團隊們忙于完善這項技術,它能夠流暢地寫作和編碼,并根據文本生成圖像。
他們努力準備支持産品所需的基礎設施,并完善将決定 OpenAI 允許和不允許的用戶行爲的政策。
在這一切中,OpenAI 内部開始流傳有關其競争對手 Anthropic 正在開發自己的聊天機器人的傳聞。這場競争是私人的:Anthropic 是在一群員工于 2020 年離開 OpenAI 後成立的,據報道,這是因爲他們對公司産品發布速度的擔憂。
據三位當時在公司的人士稱,OpenAI 的領導層在 11 月告訴員工,他們需要在幾周内推出一個聊天機器人。爲了完成這一任務,他們指示員工發布一個現有模型,GPT-3.5,并配備了一個基于聊天的界面。領導層小心地将這一努力描述爲不是一次産品發布,而是一個 " 低調的研究預覽 "。通過将 GPT-3.5 交到人們手中,奧特曼和其他高管表示,OpenAI 可以收集更多關于人們如何使用和與 AI 互動的數據,這将有助于公司指導 GPT-4 的開發。
這種方法也符合公司更廣泛的部署策略,逐漸向世界發布技術,讓人們逐漸适應它們。包括奧特曼在内的一些高管開始重複同樣的話:OpenAI 需要讓 " 數據飛輪 " 轉起來。
一些員工對于匆忙推出這種新的對話模型表示不安。公司在爲 GPT-4 的準備工作中已經力不從心,而且并不具備處理可能改變風險格局的聊天機器人的能力。
就在幾個月前,OpenAI 剛剛上線了一種新的流量監控工具,用于跟蹤基本的用戶行爲。公司仍在完善該工具的功能這将進而指導公司如何減輕技術可能帶來的危險和濫用。
其他員工則認爲,将 GPT-3.5 變成一個聊天機器人可能不會帶來太大的挑戰,因爲該模型本身已經經過了充分的測試和完善。
公司繼續推進,并于 11 月 30 日發布了 ChatGPT。
這被認爲是一個無關緊要的事件,以至于沒有進行任何重大的公司範圍内的發布通知。許多沒有直接參與的員工,包括那些在安全功能方面的員工,甚至沒有意識到這一事件的發生。
據一位員工說,一些知情的人甚至開始了一個賭注池,賭注是在第一周内可能有多少人使用這個工具。最高的猜測是 10 萬用戶。
OpenAI 的總裁在推特上宣布,這個工具在最初五天内達到了 100 萬用戶。在 OpenAI 内部," 低調研究預覽 " 這一說法立即成爲了一個熱門梗;員工們将其制成了筆記本電腦貼紙。
ChatGPT 的飛速成功給公司帶來了巨大的壓力。來自研究團隊的計算能力被重新分配,以處理流量激增。
随着流量的持續激增,OpenAI 的服務器多次崩潰;流量監控工具也屢屢失效。即使在工具在線的時候,員工也因其功能有限而難以詳細了解用戶行爲。
公司内的安全團隊推動放慢進程。這些團隊努力完善 ChatGPT,拒絕某些類型的濫用請求,并對其他查詢作出更合适的回答。但他們在構建諸如自動禁止重複濫用 ChatGPT 的用戶的功能時遇到了困難。
與此相反,公司的産品部門希望借助這股勢頭,加大商業化力度。公司雇傭了數百名員工,以積極擴大公司的産品供應。2 月,OpenAI 發布了付費版本的 ChatGPT;3 月,公司迅速推出了 API 工具(應用程序編程接口),幫助企業将 ChatGPT 集成到他們的産品中。兩周後,它最終推出了 GPT-4。
據當時在公司的三名員工說,一系列新産品使情況變得更糟。
流量監控工具的功能嚴重滞後,對來自哪些産品的流量有限的可見性,這些産品是通過新的 API 工具将 ChatGPT 和 GPT-4 集成進來的,這使得理解和阻止濫用變得更加困難。
與此同時,API 平台上的欺詐行爲激增,因爲用戶大規模創建賬戶,允許他們利用每個新賬戶附帶的 20 美元按需付費服務信用額進行套現。阻止欺詐成爲遏制收入損失和防止用戶通過創建新賬戶來規避濫用執法的首要任務:原本人手就不足的信任與安全工作人員被重新分配,從其他濫用領域轉移到這個問題上。
在不斷增長的壓力下,一些員工出現了心理健康問題。溝通不暢。同事們隻有在 Slack 上注意到同事消失後,才發現他們已經被解雇。
GPT-4 的發布也讓專注于更上遊人工智能安全挑戰的對齊團隊感到沮喪,比如開發各種技術來使模型遵循用戶指令,防止它發出有毒言論或 " 幻覺 " ——即自信地将錯誤信息作爲事實呈現。
該團隊的許多成員,包括越來越多對更高級人工智能模型的存在風險感到恐懼的成員,對 GPT-4 發布和廣泛集成到其他産品的速度感到不安。
他們認爲自己所做的人工智能安全工作還不夠。
緊張情緒在高層爆發。随着奧特曼和 OpenAI 總裁格雷格 · 布羅克曼鼓勵更多的商業化,公司首席科學家伊利亞 · 蘇茨克弗對 OpenAI 是否能夠維持其創立非盈利組織的使命——創建有益的 AGI ——越來越感到擔憂。
根據人工智能先驅傑弗裏 · 辛頓的說法,辛頓是蘇茨克弗在多倫多大學的博士導師,并且多年來一直與他保持密切聯系,OpenAI 的大型語言模型在過去幾年中的快速進步使蘇茨克弗更加确信 AGI 的到來指日可待,因此更加專注于預防其可能的危險。(蘇茨克弗沒有回應置評請求。)
預見到這種全能技術的到來,蘇茨克弗開始表現得像一個精神領袖,三名與他共事的員工告訴我們。他不斷、熱情地重複的口頭禅是 " 感受 AGI",這是指公司即将實現其終極目标的想法。
在 OpenAI 2022 年的假日派對上,該派對在加州科學院舉行,蘇茨克弗帶領員工高喊:" 感受 AGI!感受 AGI!"這個短語本身非常受歡迎,以至于 OpenAI 的員工在 Slack 中創建了一個特殊的 " 感受 AGI" 反應表情符号。
随着蘇茨克弗對 OpenAI 技術的力量越來越有信心,他也越來越與公司内部關注存在風險的派系結盟。
據兩位了解今年領導層外出活動的人士透露,蘇茨克弗委托當地藝術家制作了一個木制雕像,意在代表一種 " 不對齊 " 的人工智能——即不符合人類目标的人工智能。他将其點燃,象征着 OpenAI 對其創立原則的承諾。
7 月,OpenAI 宣布成立所謂的超級對齊團隊,由蘇茨克弗共同領導研究。OpenAI 将擴大對齊團隊的研究,以開發更多上遊人工智能安全技術,并爲本世紀可能到來的 AGI 做準備,公司将爲此專門分配 20% 的現有計算芯片。
與此同時,公司的其他部分繼續推出新産品。
在超級對齊團隊成立後不久,OpenAI 發布了強大的圖像生成器 DALL-E 3。然後,在本月早些時候,公司舉辦了其首次 " 開發者大會 ",在大會上,奧特曼推出了 GPTs,這是可以無需編碼即可構建的 ChatGPT 定制版本。
這些再次遇到了重大問題:根據公司的更新,OpenAI 經曆了一系列停機,包括 ChatGPT 及其 API 的大規模停機。開發者大會結束後三天,據 CNBC 報道,微軟因安全擔憂暫時限制員工訪問 ChatGPT。
在這一切中,奧特曼繼續前進。
在被解雇前的幾天裏,他一直在爲 OpenAI 的持續進步制造熱潮。他告訴《金融時報》,公司已經開始研發 GPT-5,幾天後又暗示在亞太經合組織峰會上有驚人的事情即将發生。" 就在過去的幾周裏,我有幸在房間裏,當我們推開無知的面紗,将發現的前沿向前推進時," 他說。" 能夠做到這一點是我職業生涯中的榮耀。"
據報道,奧特曼還在尋求從軟銀和中東投資者那裏籌集數十億美元,以建立一家芯片公司,與英偉達和其他半導體制造商競争,以及降低 OpenAI 的成本。
在一年的時間裏,奧特曼幫助 OpenAI 從一個混合研究公司轉變爲一個全面增長模式的矽谷科技公司。
在這種情況下,不難理解緊張情緒爲何會爆發。
OpenAI 的憲章将原則置于利潤、股東和任何個人之上。公司的部分創始人正是蘇茨克弗現在代表的那個派系——那些對人工智能潛在風險感到恐懼的人,他們的信念有時似乎植根于科幻領域——這也構成了 OpenAI 現任董事會的一部分。
但奧特曼也将 OpenAI 的商業産品和籌資努力定位爲實現公司最終目标的手段。他告訴員工,公司的模型仍處于早期開發階段,OpenAI 應該商業化并産生足夠的收入,以确保能夠在對齊和安全問題上無限制地投入資金;據報道,ChatGPT 正朝着每年産生超過 10 億美元的速度發展。
從一個角度看,奧特曼的解雇可以被視爲 OpenAI 不尋常結構中的一個驚人實驗。
現在,這個實驗可能正在解體我們所熟悉的公司,并随之改變人工智能的發展方向。如果奧特曼在投資者的壓力和現任員工的強烈反對下返回公司,這一舉動将是對奧特曼權力的巨大集中。
這将表明,盡管有其憲章和崇高的信條,OpenAI 可能畢竟隻是一家傳統的科技公司。
另一方面,無論奧特曼留下還是離開,都無法解決人工智能發展中存在的一個危險缺陷。過去 24 小時,科技行業屏息以待,等待着看奧特曼和 OpenAI 的命運。
盡管奧特曼和其他人對監管表示口頭支持,并說他們歡迎全世界的反饋,但這個動蕩的周末展示了在可能是我們時代最重要的技術進步上,實際上有多少人能發表意見。
人工智能的未來正被富有的技術樂觀主義者、狂熱的末日論者和數十億美元的公司之間的意識形态鬥争所決定。
OpenAI 的命運可能懸而未決,但公司的自負——它的名稱所代表的開放性——顯示了其局限性。
看來,未來将在閉門之後被決定。