GPT-4最強對手出現！Claude-3 AI模型發布

就當我們還在爲 OpenAI 的 Sora 實際效果感到震撼，驚歎未來已來的時候。短短一個月，OpenAI 的 " 家 " 就被人偷了，昨晚北京時間淩晨 Anthropic 公司宣布 Claude-3 正式發布，帶有三個高性能的模型形态，并宣布在 AI 邏輯基準測試中超過了 ChatGPT-4。

可能國内的小夥伴很少知道 Claude，這是一個在海外備受關注且用戶基數較大的一個 AI 模型，其從誕生以來就一直與 GPT 相愛相殺，在 AI 性能排行榜上緊追不舍。其也是基于 GPT ( Generative Pre-trained Transformer ) 技術的大型語言模型，通過在大規模文本數據上的預訓練 , 學會了自然語言理解和生成的能力。

亞馬遜于今日宣布使用 Claude3 來優化其商業邏輯

該系列包含三款各具特色的型号：Claude 3 Haiku、Claude 3 Sonnet 以及 Claude 3 Opus，它們在性能與應用功能上各有側重，旨在滿足多樣化的應用場景需求。

Claude 3 Haiku

Haiku 型号憑借其極速處理能力和高性價比脫穎而出。它能夠在短短三秒内完成對一篇含有約 10,000 個标記、信息濃縮且數據密集的 arXiv 研究論文的閱讀工作，包括對圖表和圖形的理解。Haiku 尤其适用于那些對處理速度有極高要求但性能負荷相對較輕的平台。

Claude 3 Sonnet

Sonnet 型号在處理大多數工作負載時的速度是 Claude 2 以及 Claude 2.1 的兩倍，且模型效果與性能一緻，并提供更高層次的智能分析能力。它特别擅長處理那些需要快速反應的任務，例如知識檢索和銷售流程自動化等。

Claude 3 Opus

Claude 3 Opus 是系列中的高端型号，具備與市場上其他頂尖模型相匹敵的複雜視覺處理能力，能夠處理多種視覺格式，包括照片、圖表、圖形以及技術圖解。相較于 Claude 2.1，Opus 在解決開放性問題上的準确度提升了一倍，同時也顯著降低了錯誤答案的比例。

其他亮點

全系列模型均能處理超過 100 萬個标記的輸入，爲那些需要更強大處理能力的客戶提供可靠支持。Claude 3 系列在執行複雜多步驟指令方面表現卓越，尤其在遵循品牌語調和響應指南上，能夠爲用戶打造出值得信賴的客戶體驗。此外，這些模型還擅長生成流行的結構化輸出格式，如 JSON。

目前，Opus 和 Sonnet 已經通過 API 對外開放，開發者現可直接注冊并開始體驗這些尖端模型的強大功能。比如，POE 就已經支持 Claude-3-Opus 模型，購買 POE" 月卡 " 後就可以體驗。

超越 GPT-4；兼顧視覺功能

根據 Anthropic 的說法，Claude 3 Opus 在 10 項人工智能标準測試中超越了 GPT-4，包括 MMLU（本科水平知識）、GSM8K（小學數學）、HumanEval（編程）以及 HellaSwag（常識）。

其中一些勝利的優勢非常微小，例如 Opus 在 MMLU 五次嘗試中得到 86.8％的得分，而 GPT-4 得到 86.4％，一些差距則較大，例如在 HumanEval 上 Opus 得到 90.7％的得分，而 GPT-4 得到 67.0％。這可能就意味着 Claude 3 對于新手碼農要更加友好。

與前代模型相比，Claude 3 系列在分析、預測、内容創作、代碼生成以及多語言對話等方面展現了改進。據報道，這些模型還具備了增強的視覺能力，允許模型處理照片、圖表和圖解等視覺格式，類似于 GPT-4V 和谷歌的 Gemini

在實際測試中，Claude 3 相比于 GPT-4V 對于 PDF 的解讀要更加快速，同時對于中文輸出的邏輯與優化也要明顯好于前代，也是達到了 GPT-4 平替的水準。