财聯社 3 月 15 日訊(編輯 夏軍雄)當地時間周二(3 月 14 日),人工智能研究公司 OpenAI 公布了其大型語言模型的最新版本—— GPT-4。該公司表示,GPT-4 在許多專業測試中表現出超過絕大多數人類的水平。
OpenAI 于 2020 年發布了 GPT(生成型預訓練變換模型)-3(生成型預訓練變換模型),并将其與 GPT-3.5 分别用于創建 Dall-E 和聊天機器人 ChatGPT,這兩款産品極大地吸引了公衆的關注,并刺激其他科技公司更積極地追求人工智能(AI)。
OpenAI 周二表示,在内部評估中,相較于 GPT-3.5,GPT-4 産生正确回應的可能性要高出 40%。而且 GPT-4 是多模态的,同時支持文本和圖像輸入功能。
OpenAI 稱,GPT-4 比以前的版本 " 更大 ",這意味着其已經在更多的數據上進行了訓練,并且在模型文件中有更多的權重,這使得它的運行成本更高。
據 OpenAI 介紹,在某些情況下,GPT-4 比之前的 GPT-3.5 版本有了巨大改進,新模型将産生更少的錯誤答案,更少地偏離談話軌道,更少地談論禁忌話題,甚至在許多标準化測試中比人類表現得更好。
例如,GPT-4 在模拟律師資格考試的成績在考生中排名前 10% 左右,在 SAT 閱讀考試中排名前 7% 左右,在 SAT 數學考試中排名前 11% 左右。
OpenAI 表示,雖然兩個版本在日常對話中看起來很相似,但當任務複雜到一定程度時,差異就表現出來了,GPT-4 更可靠、更有創造力,能夠處理更微妙的指令。
不過,OpenAI 也警告稱,GPT-4 還不完美,在許多情況下,它的能力不如人類。該公司表示:"GPT-4 仍有許多已知的局限性,我們正在努力解決,比如社會偏見、幻覺和對抗性提示。"
OpenAI 透露,摩根士丹利正在使用 GPT-4 來組織數據,而電子支付公司 Stripe 正在測試 GPT-4 是否有助于打擊欺詐。其他客戶還包括語言學習公司 Duolingo、Khan Academy 和冰島政府。
OpenAI 合作夥伴微軟周二表示,新版必應搜索引擎将使用 GPT-4。