圖片來源:OpenAI 發布會截圖
文 | 極客公園 GeekPark,作者 | Li Yuan、宛辰,編輯 | 靖宇
對于 AI 行業從業者來說,剛剛可能是一夜未眠。
北京時間 11 月 7 日淩晨,美國人工智能公司 OpenAI 的開發者大會正式開啓,創始人 Sam Altman 在台上和同事,隻用 45 分鍾時間,就「轟」出了團隊最新的成果 GPT-4 Turbo,後者不僅更快、有更長的上下文、而且更好的控制。
同時,OpenAI 下調 API 的價格近 3 倍,降到了 1000 輸入 / 美分,讓在場開發者歡呼不已。
當然,更重要的是,OpenAI 推出了「GPTs」——讓人們能用自然語言構建定制化 GPT,然後,你猜到了——可以把 GPT 上傳到即将發布的「GPT Store」!
如果說 GPT-4 Turbo 是更好用的「iPhone」,GPT Store 則可能是讓 OpenAI 成爲「蘋果」一樣的巨頭的重要一步。
當競争對手們依然在「AI 煉丹」時,OpenAI 已經開始構建起一個看起來相當宏偉的生态了。
GPT-4 Turbo,更快,更省錢
發布會一開始,Sam Altman 就宣布了 GPT-4 的一次大升級,推出了 GPT-4 Turbo,同步在 ChatGPT 和 API 版本推出。
Sam Altman 表示團隊一直在征求開發者的建議,對開發者關注的問題做了六大升級,分别是更長的上下文長度、更強的控制、模型的知識升級、多模态、模型微調定制和更高的速率限制。
其中前四條主要關于新模型的性能的提升,而後兩點則主要針對企業開發者的痛點。在提升性能的同時,OpenAI 還宣布了 API 價格的下調,可謂「加量不加價」了。
Sam Altman 公布 GPT 的六大升級|OpenAI
六大升級中,第一,就是上下文長度。
OpenAI 原本提供的最長的上下文長度爲 32k,而此次,GPT-4 Turbo 直接将上下文長度提升至 128k,一舉超過了競争對手 Anthropic 的 100k 上下文長度。
128k 的上下文大概是什麽概念?大概約等于 300 頁标準大小的書所涵蓋的文字量。除了能夠容納更長上下文外,Sam 還表示,新模型還能夠在更長的上下文中,保持更連貫和準确。
第二,是爲開發者提供了幾項更強的控制手段,以更好地進行 API 和函數調用。
首先,新模型提供了一個 JSON Mode,可以保證模型以特定 JSON 方式提供回答,調用 API 時也更加方便。
另外,新模型還允許同時調用多個函數,同時引入了 seed parameter,在需要的時候,可以确保模型能夠返回固定輸出。接下來幾周,模型還将增加新功能,讓開發者能看到 log probs。
第三,則是模型内部和外部知識庫的升級。
ChatGPT 橫空出世大概一年後,GPT 的知識庫終于更新到了 2023 年 4 月。Sam Altman 承諾未來還将繼續更新其知識庫,不使其落伍。「對于 GPT 的知識停留在 2021 年,我們和你們一樣,甚至比你們更惱火。」Sam Altman 表示。
GPT 内部知識庫終于升級到了 2023 年 4 月|OpenAI
除了内部知識庫的升級,GPT-4 Turbo 也升級了外部知識庫的更新方式,現在可以上傳外部數據庫或文件,來爲 GPT-4 Turbo 提供外部知識庫的支持。
第四,或許是最不讓人意外的,多模态。
新模型支持了 OpenAI 的視覺模型 DALL · E 3,還支持了新的文本到語音模型——開發者可以從六種預設聲音中選擇所需的聲音。
多模态成爲 GPT 的内置功能|OpenAI
GPT-4 Turbo 現在可以以圖生圖了。同時,在圖像問題上,目前 OpenAI 推出了防止濫用的安全系統。OpenAI 還表示,它将爲所有客戶提供牽涉到的版權問題的法律費用。
在語音系統中,OpenAI 表示,目前的語音模型遠超市場上的同類,并宣布了開源語音識别模型 Whisper V3。
第五,模型微調與定制。
8 月,OpenAI 曾經發布過 GPT-3.5 Turbo 的微調服務。當時,有早期測試表明,經過微調的 GPT-3.5 Turbo 版本在某些任務中甚至可以超越 GPT-4,不過定價相對較高。
而此次,Sam 宣布 GPT-3.5 Turbo 16k 的版本目前也可以進行微調的定制了,且價格将比前一代更低。GPT-4 的微調定制也在申請中了。
同時,OpenAI 也開始接受單個企業的模型定制了。「包括修改模型訓練過程的每一步,進行額外的特定領域的預訓練,針對特定領域的後訓練等等。」Sam 表示。同時他表示,OpenAI 沒有辦法做很多這樣的模型定制,而且價格不會便宜。
第六,也是最後一點,是更高的速率限制。
GPT-4 用戶,發布會後馬上可以享受到每分鍾的速率限制翻倍的體驗。同時,如果不夠滿意,還可以進一步通過 API 賬戶,申請進一步提升速率限制。
六大升級以外,是 API 體系的全線降價。
此次新發布的 GPT-4 Turbo,輸入方面比 GPT-4 降價 3 倍,而輸出方面降價 2 倍,OpenAI 表示,總體使用上降價大概 2.75 倍。
新模型的價格是每千輸入 token 1 美分,而每千輸出 token 3 美分。降價的 API 迎來了現場開發者的歡呼。
Sam 還表示,在優先解決價格之後,下一個重點解決的問題将是速度問題,很快,開發者們就會發現 GPT-4 Turbo 将變快很多。
GPT Store 來了!
早在 5 月,OpenAI 就開放了插件系統,首批上線了 70 個大模型相關的應用,領域包括猜詞、翻譯、查找股票數據等等。
GPT Store 風格都非常「App Store」|OpenAI
當時,該功能被寄予厚望,不少媒體将其類比于蘋果的 App Store 時刻,認爲它将改變大模型應用的生态。不過雖然後期插件不斷增加,但插件系統卻遠遠沒有達到蘋果應用商店的影響力。
而此次發布會上,OpenAI 則重新梳理了其應用商店的體系,并将其擴大到了一個全新的範疇——人人都能通過自然語言創建基于自己的知識庫的 AI Agent,加入 OpenAI 的應用商店,并獲得分成。
OpenAI 此次發布的應用,不再稱爲插件,而選擇了一個相對比較奇怪的名字,GPT。而整體的應用商店,名字叫做 GPT Store,将在本月後期正式推出。
按照 Sam Altman 的說法,每一個 GPT 像是 ChatGPT 的一個爲了特殊目的而做出的定制版本。
OpenAI 的工作人員嘗試讓 ChatGPT 管理自己的生活|OpenAI
爲了突出新的 GPT 應用,ChatGPT 整個頁面将有小幅度的調整。左上角除了 ChatGPT,下面的應用,就是此次推出的 GPT 應用。
在演示中,可以看到,較爲複雜的插件——比如曾經在 OpenAI 上線插件系統時第一批進入插件系統的 Zapier,仍然存在于目前的應用商店中,而且仍然可能是未來應用商店裏很重要的一批應用。
演示中,OpenAI 的 Jessica Shay,就利用了 Zapier 鏈接了自己的日曆和手機短信,通過與 Zapier 這個應用聊天的方式,直接安排了自己的日程,并通知了同事。
不過,Zapier 的功能雖然強大,這樣的應用并不是此次發布的重點。據 Glassdoor 數據顯示,Zapier 公司擁有 500-1000 名員工,而财富網站報道,Zapier 估值已達 50 億美金。指望這樣的應用來填充 OpenAI 的羽翼未豐的應用商店,使其成爲一個豐富的生态顯然不太現實。
因此,此次發布中,OpenAI 推出一個重磅發布:讓不懂代碼的人也能輕松定義一個 GPT。
Sam Altman 爲此進行了現場展示。
「在 YC 工作過很多年,我總是遇到開發者向我咨詢商業意見。」Sam Altman 講到,「我一直想,如果有一天有個機器人能幫我回答這些問題就好了。」
接着,Sam Altman 打開了 GPT Builder,先打上一段對這個 GPT 的定義,類似于幫助初創公司的創始人思考他們的業務創意并獲得建議,接着,在對話中,GPT Builder 自己生成了這個 GPT 的名字、圖标,并通過與 Sam 對話的形式,詢問 Sam 是否要對對生成的名字和圖标等進行調整。
Sam Altman 正在創建一個「創業導師 GPT」|OpenAI
接下來,GPT Builder 主動向他詢問這個應用該如何與用戶交互,Sam 表示可以從我的過往演講中選擇合适且有建設性的回答,然後上傳了一段自己過往的演講。
即使加上講解,整個應用也在三分鍾内就完成了。訪問這個 GPT 的人,會收到 GPT 自動生成的對話開頭,可以與這個 GPT 對話咨詢創業相關的内容,而得到的,将是一個類似于 Sam Altman 本人的回答。
Sam 表示,創建者還可以進一步爲 GPT 增加 action(動作)。
創建一個這樣的 GPT,本質上,用戶能夠定制的功能其實并不多:指令(預設的 prompt),外設的知識庫和動作。但是,能把三者絲滑地結合起來,讓一個不懂代碼的人也能更簡單地創建應用,确實是此次 Open AI 的創舉。
GPT 發布後,應用可以選擇私有,專屬企業擁有和公開所有三種方式。而 Open AI 表示,将爲受歡迎的應用提供利潤分享。
很明顯,OpenAI 在這裏的發布,并沒有希望普通用戶能夠通過自然語言創建出多麽複雜的應用,其中的想象空間,更重要的在于個人和企業能夠将自己的知識庫上傳到 OpenAI,一鍵構建專屬應用。
比如作爲一個擁有貨運價格表的代理,可以将文件上傳到 OpenAI 後,一鍵部署出自己的詢價助理,這樣簡潔絲滑的應用部署,在之前還并不存在。而如果發布最終能夠得到用戶認可的話,類似的應用也将能夠填充 OpenAI 的應用商店,使其成爲各種信息的寶庫。
零代碼創建 AI Agent
如果你覺得上述的 0 代碼的 GPT 很酷,此次 OpenAI 也推出了讓開發者更容易使用 OpenAI API 的開發方式—— Assistants API。
Sam Altman 表示,市面上基于 API 構建 agent 的體驗很棒。比如,Shopify 的 Sidekick 可以讓用戶在平台上采取行動,Discord 的 Clyde 可以讓管理員幫忙創建自定義人物,Snap 的 My AI 是一個自定義聊天機器人,可以添加到群聊中并提出建議。
但問題是,這些 agent 很難建立。有時需要幾個月的時間,由數十名工程師組成的團隊,處理很多事情才能使這種定制助手體驗。這些事情包括狀态管理(state management)、提示和上下文管理(prompt and context management)、擴展功能(extend capabilities)和檢索(retrievel)。
在 OpenAI 開發者大會上,這些事情被 API 化——OpenAI 推出 Assistants API,讓開發人員在他們的應用程序中構建「助手」。
使用 Assistants API,OpenAI 客戶可以構建一個具有特定指令、利用外部知識并可以調用 OpenAI 生成式 AI 模型和工具來執行任務的「助手」。像這樣的案例範圍包含,從基于自然語言的數據分析應用程序到編碼助手,甚至是人工智能驅動的假期規劃器。
Assistants API 封裝的能力包括:
持久的線程(persistent threads),人們不必弄清楚如何處理長的對話曆史;
内置的檢索(Retrieval),利用來自 OpenAI 模型外部的知識(例如公司員工提供的産品信息或文檔)來增強開發人員創建的助手;提供新的 Stateful API 管理上下文;
内置的代碼解釋器(Code Interpreter),可在沙盒執行環境中編寫和運行 Python 代碼。這一功能于 3 月份針對 ChatGPT 推出,可以生成圖形和圖表并處理文件,讓使用 Assistants API 創建的助手叠代運行代碼來解決代碼和數學問題;
改進的函數調用,使助手能夠調用開發人員定義的編程函數并将響應合并到他們的消息中。
Assistants API 處于測試階段,從今天開始可供所有開發人員使用。開發者可以前往 Assistants Playground 來嘗試 Assistants API 測試版,而無需編寫任何代碼。
Assistants API 被 OpenAI 視爲幫助開發者在其應用程序中構建「類 agent 體驗」的第一步。有了 Assistants API,構建 agent 應用将變得更容易。OpenAI 表示,随着時間的推移,将會持續提高它們的能力。并且,未來計劃允許客戶提供自己的 copilot 工具,以補充其平台上的 Code Interpreter、檢索組件和函數調用。
OpenAI 開發者大會上的産品升級,再次告訴人們,距離每個人都能有一個甚至多個專屬私人助理、使用自然語言就能開發軟件、還能像浏覽應用一樣,付費 / 免費購買流行的私人助理,這樣的一個未來,正在加速向人們走來。
從 GPT-4 到 GPT-4 Turbo 和 GPT Store,OpenAI 隻用了半年多一點的時間。而在 6 個月之内,全球的科技和 AI 行業,已經是天上人間。
Sam Altman 總結發布會亮點|OpenAI
當多模态、長文本輸入、更便宜、個性化……這些旨在和 OpenAI 大模型錯位競争的特點,都被 OpenAI 搶先拿來自我革命;當 OpenAI 的産品在 B 端和 C 端都體現出強大的吸引力、并且還将利用 GPT Store 率先籠絡住全球AI 開發者時,不知道全球的 AI 對手們的心情如何。
但 OpenAI 的技術進步是令人興奮的,而團隊所采用的商業策略,又有着超出一般創業公司的成熟——我們目睹着一個行業的潮氣,也可能正在見證一個巨頭的誕生。