就當我們還在爲 OpenAI 的 Sora 實際效果感到震撼,驚歎未來已來的時候。短短一個月,OpenAI 的 " 家 " 就被人偷了,昨晚北京時間淩晨 Anthropic 公司宣布 Claude-3 正式發布,帶有三個高性能的模型形态,并宣布在 AI 邏輯基準測試中超過了 ChatGPT-4。
可能國内的小夥伴很少知道 Claude,這是一個在海外備受關注且用戶基數較大的一個 AI 模型,其從誕生以來就一直與 GPT 相愛相殺,在 AI 性能排行榜上緊追不舍。其也是基于 GPT ( Generative Pre-trained Transformer ) 技術的大型語言模型,通過在大規模文本數據上的預訓練 , 學會了自然語言理解和生成的能力。
亞馬遜于今日宣布使用 Claude3 來優化其商業邏輯
該系列包含三款各具特色的型号:Claude 3 Haiku、Claude 3 Sonnet 以及 Claude 3 Opus,它們在性能與應用功能上各有側重,旨在滿足多樣化的應用場景需求。
Claude 3 Haiku
Haiku 型号憑借其極速處理能力和高性價比脫穎而出。它能夠在短短三秒内完成對一篇含有約 10,000 個标記、信息濃縮且數據密集的 arXiv 研究論文的閱讀工作,包括對圖表和圖形的理解。Haiku 尤其适用于那些對處理速度有極高要求但性能負荷相對較輕的平台。
Claude 3 Sonnet
Sonnet 型号在處理大多數工作負載時的速度是 Claude 2 以及 Claude 2.1 的兩倍,且模型效果與性能一緻,并提供更高層次的智能分析能力。它特别擅長處理那些需要快速反應的任務,例如知識檢索和銷售流程自動化等。
Claude 3 Opus
Claude 3 Opus 是系列中的高端型号,具備與市場上其他頂尖模型相匹敵的複雜視覺處理能力,能夠處理多種視覺格式,包括照片、圖表、圖形以及技術圖解。相較于 Claude 2.1,Opus 在解決開放性問題上的準确度提升了一倍,同時也顯著降低了錯誤答案的比例。
其他亮點
全系列模型均能處理超過 100 萬個标記的輸入,爲那些需要更強大處理能力的客戶提供可靠支持。Claude 3 系列在執行複雜多步驟指令方面表現卓越,尤其在遵循品牌語調和響應指南上,能夠爲用戶打造出值得信賴的客戶體驗。此外,這些模型還擅長生成流行的結構化輸出格式,如 JSON。
目前,Opus 和 Sonnet 已經通過 API 對外開放,開發者現可直接注冊并開始體驗這些尖端模型的強大功能。比如,POE 就已經支持 Claude-3-Opus 模型,購買 POE" 月卡 " 後就可以體驗。
超越 GPT-4;兼顧視覺功能
根據 Anthropic 的說法,Claude 3 Opus 在 10 項人工智能标準測試中超越了 GPT-4,包括 MMLU(本科水平知識)、GSM8K(小學數學)、HumanEval(編程)以及 HellaSwag(常識)。
其中一些勝利的優勢非常微小,例如 Opus 在 MMLU 五次嘗試中得到 86.8%的得分,而 GPT-4 得到 86.4%,一些差距則較大,例如在 HumanEval 上 Opus 得到 90.7%的得分,而 GPT-4 得到 67.0%。這可能就意味着 Claude 3 對于新手碼農要更加友好。
與前代模型相比,Claude 3 系列在分析、預測、内容創作、代碼生成以及多語言對話等方面展現了改進。據報道,這些模型還具備了增強的視覺能力,允許模型處理照片、圖表和圖解等視覺格式,類似于 GPT-4V 和谷歌的 Gemini
在實際測試中,Claude 3 相比于 GPT-4V 對于 PDF 的解讀要更加快速,同時對于中文輸出的邏輯與優化也要明顯好于前代,也是達到了 GPT-4 平替的水準。