IT 之家 8 月 23 日消息, OpenAI 在官網宣布,推出 GPT-3.5Turbo 微調功能并更新 API,使企業、開發人員可以使用自己的數據,結合業務用例構建專屬 ChatGPT。
OpenAI 聲稱,這樣定制的模型可以在某些任務上達到或超過 GPT-4 的能力。該公司還表示,GPT-4 的微調功能将于今年秋天推出。
OpenAI 公司在博客文章中寫道:" 自 GPT-3.5 Turbo 發布以來,開發人員和企業都要求能夠定制模型,爲用戶創造獨特且差異化的體驗。此更新使開發人員能夠定制更适合其用例的模型,并大規模運行這些定制模型。"
通過微調,通過 OpenAI 的 API 使用 GPT-3.5 Turbo 的公司可以使模型更好地遵循指令,例如讓它始終以給定的語言進行響應。或者,他們可以提高模型一緻地格式化響應的能力(例如,用于完成代碼片段),以及磨練模型輸出的 " 感覺 ",例如它的語氣,以便它更好地适合品牌。
此外,微調使 OpenAI 客戶能夠縮短文本提示詞,以加快 API 調用并降低成本。OpenAI 在博客文章中聲稱:" 早期測試人員通過對模型本身的指令進行微調,将提示詞大小減少了 90%。"
目前微調需要準備數據、上傳必要的文件并通過 OpenAI 的 API 創建微調作業。該公司表示,所有微調數據都必須通過 " 審核 "API 和 GPT-4 支持的審核系統,以查看是否與 OpenAI 的安全标準相沖突。但 OpenAI 計劃在未來推出一個微調 UI,其中包含一個儀表闆,用于檢查正在進行的微調工作負載的狀态。
微調成本如下:
訓練:0.008 美元 / 1K tokens
使用輸入:0.012 美元 / 1K tokens
使用輸出:0.016 美元 / 1K tokens
OpenAI 表示,包含 100,000 個 token(約 75,000 個單詞)的訓練文件的 GPT-3.5-turbo 微調工作将花費約 2.40 美元(IT 之家備注:當前約 18 元人民币)。
此外,OpenAI 今天提供了兩個更新的 GPT-3 基本模型(babbage-002 和 davinci-002),它們也可以進行微調,支持分頁和 " 更多可擴展性 "。正如之前宣布的,OpenAI 計劃于 2024 年 1 月 4 日停用初代 GPT-3 基礎模型。
OpenAI 表示,對 GPT-4 的微調支持(與 GPT-3.5 不同,GPT-4 可以理解除文本之外的圖像)将于今年秋季晚些時候發布,但沒有提供除此之外的具體信息。