過去的一年,ChatGPT 成爲維基百科上受訪最多的詞條,是獲取上億用戶最快的消費者産品。它開啓了人工智能的新時代,産品功能快速叠代升級,一步一步都具有标志性意義。
那麽,在 OpenAI 内部,是一個什麽樣的團隊在建造這個産品?什麽樣的文化,讓 ChatGPT 團隊能在如此激烈的競争中保持領先?
像 OpenAI 所有的員工一樣,Evan Morikawa 在 Linkedin 上的頭銜是 OpenAI 的技術員工成員(Member of Technical Staff),他實際上負責的應用工程(Applied Engineering)團隊,構建了 ChatGPT 産品。
需要了解的是,ChatGPT 隻是 OpenAI 的産品之一—— OpenAI 還推出了諸如 DALL · E 3(圖像生成)、GPT-4(大型語言模型)和 OpenAI API(供開發者和公司将 AI 整合到業務中使用)等産品。
打造和擴展這些産品的工程、産品和設計部門被稱爲 "Applied"。研究訓練大型模型,然後 Applied 在這些模型上構建産品,如 ChatGPT 和 API。
Applied 小組在公司内成立較晚。OpenAI 成立于 2015 年,而 Applied 則始于 2020 年夏季。當時 OpenAI 剛剛完成對 GPT-3 的訓練,成立這個團隊是爲了構建和擴展 GPT-3 的 API。
就在 OpenAI 發動董事會 " 政變 " 事件的前夕,他接受了科技博主 Gergely Orosz 的采訪,介紹了 OpenAI 的文化。
下面是經過整理的他的自述:
我于 2020 年 10 月加入 OpenAI。那時 OpenAI 總共有大約 150 名員工,而 Applied 團隊隻有幾個人。當時幾乎每個在 OpenAI 工作的人都是研究員。我沒有機器學習博士學位,但對于 OpenAI 正在構建 API 和工程團隊感到興奮。
在 OpenAI,我最初單獨爲 GPT-3 API 編寫代碼。幾個月後,也就是 2021 年 1 月,我開始管理 Applied Engineering 團隊。那時,我的團隊大約有 6 個人。時至今日,兩年半過去了,Applied Engineering 團隊已經發展到了 130 名工程師,我管理其中的一半左右。還有 20 個人是項目經理和設計師,整個 Applied 團隊大約有 150 人。
從 2020 年 10 月起,OpenAI 的規模已經從大約 150 人增長到今天的約 700 人(最近達到了近 800 人——編者)。而且我們還在繼續招聘。
OpenAI 是如何以如此之快的速度推出新功能的呢?我感覺每隔幾個月就會推出一個重大的新功能。對于一個外部人來說,僅僅跟上就已經很難了!
一方面,這絕對是我職業生涯中速度最快的地方;另一方面,這并不是魔法。我認爲關鍵有如下幾點:
将 ChatGPT 設置爲像一個小型獨立創業公司一樣運營
與研究的緊密集成
長期的産品和研究思考
解耦和漸進的發布
高人才密度
好習慣的日積月累
像小型獨立創業公司一樣運營
ChatGPT 看起來、感覺起來,以及行爲上都像僅一年的初創公司,但 OpenAI 本身已經成立了将近 8 年。OpenAI 内的 Applied 組成立了 3 年。ChatGPT 是 Applied 内的一個産品團隊,大約一年前開始的。
我和其他 Applied 領導層希望,ChatGPT 團隊感覺就像是他們自己的獨立創業公司。在實踐中,這個目标随着團隊的成長而發生變化。
在 2022 年夏季,我們開始開發後來成爲 ChatGPT 的産品。那時,Applied 有大約 30 名工程師,幾個 PM 和設計師,并在運營如下産品:
GPT-3 和 Codex 的 API
模型的微調
嵌入式 API
DALL · E 2
所有這些産品都使用相同的代碼庫,運行在相同的計算集群上,并使用相同的構建管道。在 Applied 内,我們按功能組建,工程師是一個統一的團隊。
這些都随着 ChatGPT 而改變。
一些 Applied 的工程師、設計師、研究人員和布洛克曼(OpenAI 總裁)一起找了一個房間,開始迅速叠代産品想法。
我們爲這個初創的 ChatGPT 小組提供了一個獨立的代碼庫和一個新的算力集群。開發環境看起來像創業公司或個人項目的初期階段。
我們給予這個小小的 ChatGPT 子團隊的目标是創造一個處于早期階段的氛圍,朝着産品适應市場(PMF)不斷叠代。我們需要形成節奏、速度和自主性。團隊的每個成員都在現場工作,我們重新安排了座位,讓人們相互靠近。
随着 ChatGPT 團隊的壯大,我們确保其垂直整合。這意味着工程、産品、設計和關鍵研究人員始終緊密合作。在 2023 年 5 月,Peter Deng 加入,領導 ChatGPT 工程、産品和設計,形成了一個緊密的團隊。
我們之所以知道要這樣設置 ChatGPT 團隊,是因爲在 Applied 團隊開始開發第一個 OpenAI API 版本時,我們已經創建了類似的結構。三年前,我們也是從一小撮工程師開始,有一個全新的代碼庫、新的集群和綠地開發。我們也像初創公司一樣運作,尋找産品市場适應。
這種 " 分形創業公司 " 的方法,感覺對任何新産品類别都是個好模式。我預計對我們正在考慮的新的想法,将繼續用這一模式應迅速叠代。
與研究的緊密集成
在大多數科技公司中,工程團隊的經典三駕馬車通常被稱爲 EPD:
工程
産品
設計
這些團隊通常彼此密切合作,跨功能團隊通常包括工程、産品和設計的成員。
研究與産品團隊的集成至關重要。與 "EPD" 相比,我更喜歡将我們在工程中緊密合作的團隊稱爲 "DERP":
設計
工程
研究
産品
在 OpenAI,許多産品問題實際上是研究問題。例如,考慮這些問題,它們可能被視爲功能請求:
ChatGPT 如何生成更簡潔的輸出?
ChatGPT 如何提供更準确的答案?
ChatGPT 如何連接到其他數據源?
盡管這些問題可能感覺像是産品問題,但實際上它們在很大程度上依賴于研究。例如:如何調整或微調底層模型以實現期望的目标,我們可以采取哪些其他方法來實現這些結果?
研究人員與産品工程的整合并非總是顯而易見的。在 OpenAI,研究和應用是獨立的組織結構。在研究組織内,有各種不同的研究團隊,例如:
預訓練團隊:該團隊訓練 GPT-4 模型;
後訓練團隊:他們對 GPT-4 進行微調;
超級對齊團隊:對齊 GPT-4;
多模态團隊:使 GPT-4 能夠看、聽和說;
…… 還有其他幾個。
研究人員往往具有重要的學術或行業背景。他們閱讀大量學術論文以保持前沿狀态。他們還采用各種想法并運行大量實驗來改進我們的模型。他們都是親自動手的;研究人員完成大量工程工作并編寫大量代碼!
我們本可以選擇一種方法,把模型被 " 扔過牆 ",即研究訓練一個模型,然後交給 Applied 部門推廣。然而,我們總是希望避免一種文化,即研究僅專注于進行實驗,而産品則隻想商業化和賺錢。
爲了防止這種情況發生,像 ChatGPT 這樣的産品團隊由軟件工程師、設計師、産品經理和研究人員共同工作。在 ChatGPT 的情況下,大多數研究人員來自我們稱之爲 Post Training(訓練後)的研究團隊。這些研究人員是最新微調技術和強化學習(RL)方法(如 Proximal Policy Optimization。OpenAI 提出的一種強化學習算法——編者)的專家。這些技術對于不斷改進 ChatGPT 中的底層模型是必不可少的。由于這些研究人員是産品團隊的一部分,并且正在進行自己的 A/B 實驗,因此研究與工程之間的反饋循環非常緊密。
與研究的緊密結合,是我們爲什麽能夠如此快速地推出新想法的原因。我們是如何在如此短的時間内推出浏覽、代碼執行、插件等 ChatGPT 功能的呢?這是因爲緊密的整合!所有這些都始于研究思想,并且由于進行研究的團隊與工程團隊緊密結合,它們迅速部署到生産環境!此外,在研究和應用中都有一種擺弄和原型設計的文化。許多這些原型非常迅速地進入了實際産品中。
長期産品和研究思維
OpenAI 的使命是确保通用人工智能(AGI)使全人類受益。我們所說的 AGI,指的是在大多數經濟上有價值的工作中超越人類的高度自治系統。這一使命在 OpenAI 章程文件中有所體現。章程文件更詳細地反映了 OpenAI 的戰略,例如詳細說明了對長期安全性的關注。
我們的章程和使命幾乎在每次全員會議上都會被提及。在具體産品讨論中,我們總是善于用這種說法提出我們的使命," 這些選項中哪一個感覺更接近 AGI"。它不僅有助于決定要構建什麽,也決定了很多不構建的東西,因爲專注于使命。
清晰的焦點總是推動速度的因素。我确信我們的使命有助于保持這種關注,并爲許多新想法鋪平了道路。
另一件非常有用的事情,是我們組織研究倡議:
并行的研究計劃有助于我們更快地推出産品。研究團隊不斷思考創建更強大模型的統一方式。例如,多模态一直是一個與文本模型并行的研究。研究還要确保各種并行的工作不是零和的,也不是與其他研究無關的。我們不希望構建大量的小模型;我們希望朝着通用人工智能邁進。
并行的多個研究計劃加速了我們的推進。例如,我們能夠在相對短的時間内推出了 GPT-4、GPT-4V、文本到語音和語音到文本。這在很大程度上要歸功于研究團隊内部的并行努力。
非耦合和漸進式發布
我們盡力避免采用 " 一次性全部 " 的發布模式。這不僅因爲早期和經常發布是一種經過驗證的産品策略,也是因爲漸進式發布是我們安全策略的基本原則之一。
在公司内部,AI 安全是一個重要話題。安全問題在我們的工作中非常核心,以至于安全顧慮可以超越發布和增長目标。我們的核心原則之一是逐漸從現實世界中學習。關于這個主題,我們在《我們的 AI 安全方法》中有更多的文檔。
我們在安全方面采取了多種方法,比如:
紅隊測試:由一組安全專家組成的 " 紅隊 " 扮演攻擊者的角色,測試和評估安全措施的有效性;
對齊研究:研究和開發确保 AI 系統以符合人類價值觀行事,不會不經意地造成傷害的技術;
政策工作:加強 AI 技術和服務的安全性和信任性,總結治理實踐,與全球各地的政策制定者合作。
除了這些工作,我們還觀察到,漸進地、有控制地與現實世界接觸是識别和解決安全問題的最重要方法之一。
我們的産品逐漸推出,并進行監控。我們的産品發布必須經過這樣一個階段,與精選的 API 客戶進行監控試驗,然後進行漸進式的推廣。
也許有趣的是,盡管外界看到 ChatGPT 突然爆紅,但在 OpenAI 内部,我們花了多年時間在更受控制的環境中熟悉這些模型!
ChatGPT 的發布本意是收集有關對話模型的反饋,沒想到這一版本引爆了一輪病毒性的媒體傳播。
高人才密度
OpenAI 的 CEO Sam Altman 一直非常注重高才密度。所謂的 " 高才密度 " 是指平均技能水平和績效遠遠超過大多數公司的标準,因此在 OpenAI,卓越就是工作的标準。
高級團隊可以非常快速地推出産品。由于專注于高才密度,我們在 Applied 内部招聘時故意偏向招聘資深的工程師。我們還盡量保持團隊的規模較小。事實證明,小規模的高級團隊可以非常快速地推出産品!
這樣就更容易授權和信任他們作出正确的決策。我對自發決策很有信心,通常認爲它們會基本指向正确的方向。我們進行内部審查并記錄我們的想法,但并非是一種強制性的方式。
在招聘 Applied 團隊時,将 Y Combinator 創始人類型與在大型科技公司大型項目開發經驗的人融合在一起非常成功。我們需要同時滿足兩個方面的需求:
在 ChatGPT 中進行敏捷的早期叠代。前 Y Combinator 創始人在最早期階段很善于折騰,在這方面表現出色。
大規模擴展我們複雜分布式系統的工程技能。曾經深入參與大規模系統擴展的工程師在這方面經驗豐富。
我們并不害怕 " 買 " 而不是 " 造 "。了解創業生态系統最新工具的人是必不可少的,但也要了解在我們的用例中這些工具何時可能失效。在可能的情況下,購買這些工具而不是自己建造它們,有助于保持團隊的規模小而靈活。
然而,我們不能總是依賴購買或使用現有工具。我們認爲對業務至關重要的任何事情,我們都會投資自己。此外,随着規模的擴大,我們可能會超越一些工具,有些人經曆過這些痛苦,這些經驗對我們來說至關重要。
謙卑感是我們普遍使用 " 技術人員成員 "(member of technical staff)頭銜的主要原因之一。在 OpenAI,每個人都有 " 技術人員成員 " 的頭銜,不管他們的經驗或專業知識如何。這有幾個原因。我們這裏沒有空間容忍不善于團隊合作的 " 獨行俠 ",我們也不想吸引那些追求構建不必要複雜的東西來獲得下一個花哨頭銜的人。
我們希望每個人都能良好溝通,爲我們的使命作出最好的決策。隻要我們能夠堅守這一點,我們将保持更高的專注度和更快的推進速度。
我們将安全性置于速度之上。在招聘時,我們會非常重視對 AI 安全性的思考深度。我們不希望速度把安全性置于次要地位。在使命的背景下,對正念的重視非常重要。
日常習慣的累積效應
關于爲什麽我們能夠如此快速地推出産品,還有一個小節需要注意:我們的工作風格中有一個長尾的小事項,所有這些小事項都會積累起來:
星期一至星期三在辦公室工作。每個人都在星期一、星期二、星期三來我們舊金山總部上班。這種面對面的方式有助于我們遇到意想不到的情況時仍能執行下去。
我記得在 ChatGPT 的早期,我們構建的東西每天都在發生變化。例如,我們正在構建的模型是不斷調整的結果,因爲我們的研究人員不斷地對其進行微調。
令人驚訝的是,大量的進展是在肩膀上的即興輕拍或參與聽到的談話中取得的。當然,我們定期進行同步會議,我們也能在計劃的協作點之上取得即興進展。
我們還進行了大量的即興白闆讨論。我們會在午餐桌上獲得很多想法——真的!即興社交互動在我們的團隊迅速擴張時,成爲了主要的入職機會。如果沒有即興的面對面互動,過去兩年内入職大約 120 人将會更加困難。
星期四和星期五是一些員工的無會議日。在這些日子裏,辦公室的人員較少。很多人決定在這些日子裏不開會,而是更專注于工作。
協調這些日子對我們的生産力至關重要。通過這種協調,我們團隊每周的辦公室的時間,在前三天就達到了關鍵的份量 (critical mass)。
這種節奏相當緊張。使命、産品的影響力和技術推動人們努力工作。但我應該指出,這并不一定意味着工作時間非常長。這不是一個在守着辦公桌直到淩晨 2 點的地方。每個人都相互支持,我們對過度勞累保持警惕。
我們偏向于聘請更高級别的人,正如我之前提到的。這也意味着有很多帶孩子的父母。每個人都非常認真地花時間和家人在一起。這些額外的承諾确實迫使人們保持高度的專注,優先考慮和時間的靈活性,包括我自己!
未來之路
我們面臨着許多挑戰,以保持我們的速度,比如:
壯大的團隊。更大的團隊将增加溝通開銷和協調難度;
更成熟的産品。我們構建的産品正在變得更加成熟,這種演變使得進行全面的産品更改更加困難;
AI 安全挑戰。這些挑戰将變得更加嚴峻,不僅對我們而言,對整個行業也是如此。我們可能需要調整我們的部署策略以适應這些挑戰。
我們期望盡量保持我們目前的原則。堅定的使命、整合的研究團隊和高人才密度應該始終有助于我們。
對于我的團隊、公司和人工智能的潛力,我持謹慎樂觀的态度。我們自己工具的力量會讓生産力得到提升,感受到這一點非常重要。我認爲迄今爲止我們所看到的隻是可能性的冰山一角。