再次炸天的OpenAI，大模型生态初現

圖片來源 @視覺中國

文 | 光錐智能，作者 | 郝鑫，編輯 | 劉雨琦

不出意外地，OpenAI 的首屆開發者大會，讓人特别意外。

一夜醒來，大模型圈一隻腳踏入了 Agent 的世界，另一隻腳則踏入 GPT Store 生态的河流中。

美東時間 11 月 6 日，OpenAI 開發者大會正式開啓，創始人兼 CEO 山姆 · 奧特曼站在台上，45 分鍾的密集輸出，再次展示了什麽叫 " 遙遙領先 "。

我們先簡單回顧一下這場發布會的所有重點，其實無非就是三件事：

一是技術能力：GPT-4 Turbo 升級了 6 大新能力，包括 128K 的上下文長度、更強的控制能力，模型的知識升級、多模态能力（語音和 CV）、模型微調定制和更高速率的限制，性能升級的同時，還對 API 調用的價格進行了下調；

二是可複制的能力：從原來的 GPT 到 GPTs，用戶可以打造專屬于自己的 GPT 助手，企業可通過 OpenAI 提供的全套工具鏈 "all tools" 在企業内部建設有價值的工具，同時也可以深入讓 GPTs 進化爲一個個 Agents，爲智能體做準備；

三則是生态能力：企業不僅可以打造 GPTs，更能将其上架在市場内，即 GPT Store，可分享給其他用戶使用，以及獲得分成，類 App Store 的商業生态由此爲出發點。

正如網易有道 CEO 周楓所言，" 這次模型上主要是性能和成本的優化，而在應用和生态方面，做了很多 LangChain（開發工具鏈），LlamaIndex（開發數據框架）這些項目類似的工作，最終就是要實現以智能體作爲 AI App 的願景。"

總之，OpenAI 提供的生态能力解決了當下大模型發展的幾個重要難點，而在此之上，大模型的應用層将迎來進一步爆發。

" 很興奮，還有很多信息在消化。"

OpenAI 發布之後，光錐智能在與多位國内知名大模型創業者交流中，也感受到了大家對行業前景的期待，"OpenAI 的多模态能力開放，對開發者是很大的利好，可以做的事情的邊界得到進一步拓展，我預計會有很多新的玩法出現。" 月之暗面創始人楊植麟對光錐智能稱。

這 45 分鍾，爲大模型火箭的二級爆發，再次添加燃料。

讓大模型，飛入尋常百姓家

" 有需求，打造生态，找落地。"OpenAI 首屆開發者大會結束後，某家國内大模型明星公司 CEO 對光錐智能發表了極爲簡短，卻信息量極大的點評。

市場對 ChatGPT 的需求，無疑是巨大的。在發布會的開始，奧特曼報告了 OpenAI 平台和産品的一些數據，截至目前，已經有大約 200 萬開發人員在其 API 上構建各種各樣的應用，超過 92% 的全球 500 強企業正使用其産品，ChatGPT 的周活躍用戶達到大約一億。

自 GPT3.5 問世到現在，每一次的升級都引領着大模型的下一個技術方向，不過，這次 OpenAI GPT-4 升級後的 Turbo 版本更像是查漏補缺。

首先是更長的上下文本長度，GPT-4Turbo 上下文任務長度擴展至 128K，相當于一本書的 300 多頁，是 GPT-4 支持的 8K 上下文的 16 倍。不僅如此，奧特曼還強調在擴展文本長度的同時，還應該保持模型的準确性。

其次是彌補 OpenAI 一直以來的短闆——安全可控和知識庫更新速度。針對前者，推出了名爲 Json Mode 的新功能，确保開發人員更容易調用 API，提升對模型輸入和輸出的控制；即将推出 "Copyright Shield"（版權保護）功能，若其企業和 API 用戶面臨版權侵權訴訟，OpenAI 将爲其承擔相應費用。針對後者，OpenAI 平台支持用戶導入文檔、數據庫來更新大模型的認知，同時還将新升級後的 GPT-4Turbo 認知理解更新到了 2023 年 4 月。

最後，此次更新中，OpenAI 的多模态能力開放進入到了一個全新的階段。上一個時期，OpenAI 用了一年多的時間，實現了 ChatGP 能說、能看、能聽，而現在才到了多模态能力釋放的節點。DALL-E3、文生語音模型 TTS（text-to-speech）、Whisper V3 都将通過 API 的形式開放給開發者使用。

能力升級之後，爲了讓更多的開發者用起來，還做了一個大降價。

奧特曼表示，不斷有開發者來向其抱怨，GPT-4 定價太貴，也正是基于此，OpenAI 這回幹脆來了個大模型降價促銷。

降價後的 GPT-4Turbo 輸入 token 價格是 GPT-4 的三分之一，輸出 token 價格是原來的二分之一；GPT-3.5Turbo 4K 精調版本輸入 token 價格是此前的三分之一，輸出 token 價格是原來的二分之一；GPT-3.5Turbo 16K 精調版本輸入 token 價格是之前的四分之一。

正如奧特曼所言開發者的需求是驅動 OpenAI 降價的根本原因，這背後還有技術、商業等多重因素。

從技術降本看，根據外媒爆料，OpenAI 此次可能将 Stateless API 變爲 Stateful API，奧特曼此前曾表示，基于 Stateful API，用戶不用再 " 重複一遍一遍地爲同樣的曆史對話付費 "，理論上 Stateful API 形式可将大模型應用的開銷削減爲原來的二十分之一。

在商業上，OpenAI 也一直在尋找突破點，從 API、ChatGPT 個人版再到企業版，一直在探索商業化。但其對手卻未給喘息的機會，微軟、Salesforce、開源生态主導者 Meta 都在以更具性價比的方式，背後 " 偷襲 "OpenAI，商業化的緊迫感與日俱增。

OpenAI 降價的背後，也代表着國外大模型已經進入到了普惠化、追求高性價比的新時期。

對初創企業、開發者而言是落地的機會，對 OpenAI 這類公司也是挑戰，由降價而帶來的或許是技術能力、資源分配、算力等多方面的挑戰。

" 在綜合考量後，我們優先考慮了價格，但速度卻不能同時兼得，這将是接下來研究的重點 "，奧特曼道。

據多名使用 GPT-4 開發工具的技術人員稱，GPT-4 速率限制已經開始加倍。

" 算力應該還好，OpenAI 儲備足夠多 "，楊植麟對此發表了意見。

爲創業者提供 " 築夢 " 工具

光錐智能在與多位大模型創業者交流過程中發現，很多創業者不是缺乏好點子和創業想法，而是受困于數據、算力、工具、部署、訓練、推理等一個個的技術難題。

比如，知乎上一位基于大模型開發的對話解謎小遊戲的開發者，就因爲遊戲用戶數量遠超預期，導緻算力不足而被迫關閉了整個遊戲，留給玩家的隻有一片遺憾和不舍。

同樣在國内，創業者們不是不知道 Agent 是未來的創業方向，而是心有餘力不足。一位 Agent 創業者告訴光錐智能，" 數據清洗、長文本記憶、代碼編寫、運行測試、部署落地、成本等等九九八十一難，關關難過，關關卡死每一個創業公司 "。

據光錐智能了解，無論國内外，Agent 離落地還差得很遠，目前比較确定的場景可能是 Code Agent。原因在于，編碼本身就屬于大模型訓練推理和 Agent 執行任務的一環，距離最近，改造也越容易。

而現在，OpenAI 發布的 all tools 工具、assistant API（助手 API）則有希望使上述這些問題迎刃而解。

assistant API 是 OpenAI 專門爲 AI Agent 開發者量身打造的工具助手，涵蓋了長線程（Threading）、知識庫（Retrieval ) 、代碼解釋器（Code interpreter）、函數調用（Function calling）幾項工具。

持久且無限長的線程，允許開發人員将線程狀态管理移交給 OpenAI 并解決上下文窗口約束；支持檢索功能，利用模型之外的知識來增強，例如專有領域數據、産品信息或用戶提供的文檔；支持代碼解釋器功能，與 ChatGPT Plus 中一樣，可以在沙盒執行環境中編寫和運行 Python 代碼，生成圖形和圖表，并處理具有多種數據和格式的文件；函數調用功能也迎來更新，現在可以一次性調用多個函數，并把響應合并到消息輸出中。

總而言之，這些新功能精準切中了開發者們卡脖子的痛點，在 OpenAI 打造的全流程工具鏈上開發運行，将降低研發的門檻，縮短研發、測試周期，同時節省人力成本。

" 我們對 OpenAI 又愛又恨，一方面它升級的工具有可能一瞬間讓我們的業務跑通，但另一方面，我們也得時刻警惕被 OpenAI 取而代之 "，一位 Agent 創業者道。

讓我們聚焦這次發布會的主角—— "Agent"。奧特曼給 Agent 下的定義爲，人們利用工具、AI 來建立更個人化和定制化的分身，這些分身可以代表個人做很多事情。用戶隻需詢問計算機所想要的東西，Agent 分身就能替你完成所有任務。

光錐智能梳理 OpenAI 做 Agent 思路後發現，Agent 不是憑空而來，一切都基于 GPT 的大模型，在大模型基礎上先是長出了 GPT 的分身 "GPTs"，而後才是 "AI Agent"。

" 在 OpenAI，我們一直笃定漸進的、叠代的部署是解決安全問題的最佳方式，即人工智能的安全挑戰。我們認爲謹慎對待面向未來 Agent 尤爲重要，這需要大量的技術工作以及關于社會的深思熟慮，所以我們正在邁出通往未來的一小步—— GPTs"，奧特曼表示道。

OpenAI 通向未來 Agent 之路已初現雛形，正如其所言，" 這還隻是通向 AI Agents 邁出的第一步 "，未來也許是多模态、多智能體。

初建大模型生态

技術的叠代固然讓人興奮，工具的推出也讓開發者們更加方便快捷，但更重要的是，OpenAI 憑借一己之力，讓大模型的商業化進一步落地。

早在今年 5 月，OpenAI 開放插件系統後，首批上線了 70 個大模型相關的應用，包括猜詞、翻譯、查找股票數據等等工具，彼時便有人預測到，大模型的 App Store 來了，但後期應用逐漸增加，卻并沒有跑出 " 爆款級 " 應用。

有投資人認爲：現在的 GPT Store 很像剛剛面世時的小程序，處于能力逐步補齊中，此次升級便是逐漸走向成熟的象征，下一個微信或者抖音，很有可能在此誕生。

此次發布會中，OpenAI 重新梳理了應用商店的體系，小幅調整了頁面布局，将 ChatGPT 變成了與第三方應用并列的應用層級，并将開發範圍擴大到了一個全新的範疇，按照奧特曼的說法，每一個 GPT 像是爲 ChatGPT 的一個特殊目的，而量身定制的版本。

但讓人更爲興奮的是，參考蘋果 App Store，用戶可在 GPT Store 中搜索下載 GPT 應用，商店也将推薦生産力、教育和好玩等類别的優質産品，OpenAI 也明确了創建者可根據自有 GPT 的适用人數進行分成。這意味着，基于大模型的應用有了 " 容器 "，開發者找到了買賣的 " 市場 "。

舉個簡單的例子：大模型本身一塊塊地皮，工具箱是錘子釘子，不同的開發者将蓋不同房子，GPT Store 則是一個房地産市場，也就是說，蓋出來房子不僅能自用，還能租出去和賣出去。

有了商業化的 " 交易場 "，創業者們就有了正反饋，這使得創業不再隻靠激情和夢想，而是擁有了現實收益的可能。

這或許也正是大模型創業者所言的 " 找落地 "，上半年的 AI 創業離不開兩個字 " 燒錢 "，5000 萬的融資金額對大模型創業而言簡直是 " 滄海一瓢 "，投資人不敢出手，創業者們也講不出新故事。

在現場，OpenAI 的工作人員展示了 OpenAI 搭建的一款旅遊 GPT 的用法：它不僅能列出巴黎旅遊建議，還能在地圖上将計劃中提到的地點按類别标記起來，而這完全可以對用戶收費或者進行會員制。

雖然，這并不代表每一個登陸了 GPT Store 的應用都能賺到錢，但至少有一個窗口可以獲得第一批種子用戶，從而反哺産品進步，形成增長飛輪。

參考移動互聯網應用爆發的年代，每一個細分領域創業者都能挖掘出無數的需求形成應用，這或許也正是創業者們爲之興奮的原因。

這時，才按下了所有 APP 重新做一遍的啓動鍵。

" 我們相信，AI 會以一種前所未見的規模，予以個體和機構新的能力。這也将把整個人類提升到我們前所未見的規模 "，奧特曼在結尾時提到。

顯然，OpenAI 想做的，還有更多。基礎設施已經初步搭建完畢，剩下的，就是等時間和生态的其他角色，來開花結果。