本文作者:杜玉
來源:硬 AI
8 月 20 日周二,OpenAI 宣布将面向企業客戶推出 " 個性化定制服務 ",即可以使用各自的公司數據來 " 微調 "(Fine-tuning)OpenAI 目前最強大的 AI 模型 GPT-4o。
有分析稱,對于 OpenAI 當前的旗艦模型來說,微調是全新的功能,GPT-4o 及其前身 GPT-4 此前均未提供過微調功能。最新舉動說明各大 AI 模型研發公司對企業客戶的競争加劇。
目前,初創企業在商業 AI 産品方面的競争生日益激烈,企業客戶們也面臨着越來越大的壓力,需要證明其在 AI 投資方面能獲得可觀收益。
OpenAI 的競争對手們、特别是谷歌和微軟都在提供定制人工智能模型的能力,OpenAI 則在 2023 年爲 GPT-3 模型發布過自助微調 API,今年 7 月推出更便宜的 GPT-4o mini 模型微調服務。此外,AI 模型微調還催生出 Cloudera 等幫助企業根據特定領域數據集訓練通用模型的 " 中介 "。
OpenAI 的 API 産品負責人 Olivier Godement 對媒體表示,OpenAI 希望通過直接與企業用戶合作,幫助他們更輕松地調整其最強大的模型,而不是使用外部服務或功能較弱的模型産品:" 我們一直非常注重降低門檻、減少摩擦和減少起步所需的工作量。"
爲了微調模型,客戶必須将特定數據集上傳到 OpenAI 的服務器,OpenAI在官網公告中強調了 " 數據隐私與安全 ":
" 經過微調的模型完全由您控制,您完全擁有您的業務數據,包括所有輸入和輸出。這确保您的數據永遠不會被共享或用于訓練其他模型。
我們還爲經過微調的模型實施了分層安全緩解措施,以确保它們不會被濫用。例如,我們持續對經過微調的模型進行自動安全評估,并監控使用情況,以确保應用程序遵守我們的使用政策。"
負責模型定制化工作的 OpenAI 軟件工程師 John Allard 稱,微調訓練平均需要一到兩個小時,與對 GPT-4o mini 類似,最初用戶隻能使用基于文本的數據來微調模型,而不能使用圖像或其他内容。
OpenAI 的官方公告指出,微調 GPT-4o 後的自定義版本可以提高應用程序的性能和準确性,GPT-4o 微調功能現已面向所有付費使用層級的所有開發人員開放。
在費用方面,GPT-4o 微調訓練費用爲每百萬個 token 花費 25 美元,推理費用爲每百萬個輸入 token 花費 3.75 美元,每百萬個輸出 token 花費 15 美元,不過在 9 月 23 日之前将每天爲每個組織免費提供 100 萬個訓練 token。而 GPT-4o mini 的微調将在 9 月 23 日之前每天免費提供 200 萬個訓練 token。
模型微調,指的是将已經預訓練好的通用大模型,針對特定任務或數據集進行參數調整和優化,以提升模型在特定類型的任務或者主題領域内的表現。據百度智能雲介紹:
預訓練大模型雖然具備強大的通用能力,但在面對特定領域的複雜問題時,往往顯得力不從心。微調類似于在通用知識基礎上進行專業知識的補充和強化,使模型更 " 接地氣 ",能更好地解決實際問題。
模型微調通過針對性的優化,使模型在保持原有知識的基礎上,快速适應新任務,提高任務的完成度和準确性。這一過程不僅加速了 AI 技術的落地應用,還降低了模型開發的成本和門檻。
OpenAI 表示,GPT-4o 微調功能是開發者最期待的功能之一。從編碼到創意寫作,微調會對各個領域的模型性能産生巨大影響。而 OpenAI 将繼續投資,爲開發者擴展其模型的自定義選項:
開發人員現在可以使用自定義數據集對 GPT-4o 進行微調,以更低的成本獲得更高的性能,滿足特定用例的需求。微調使模型能夠自定義響應的結構和語氣,或遵循複雜的特定領域指令。開發人員隻需使用訓練數據集中的幾十個示例,就可以爲他們的應用程序産生強大的結果。