大模型競賽加劇，OpenAI最大對手發布Claude 3，可預測美國經濟

圖片來源：Anthropic 官網

當地時間 3 月 4 日，沒有任何預告，位于美國矽谷的人工智能創業公司 Anthropic 在社交平台 X 上宣布發布大模型 Claude 3，宣稱全方位超越 GPT-4。Anthropic 被視爲 OpenAI 最大的競争對手，最初由 OpenAI 前高管層創立，背後的大投資者有谷歌和亞馬遜，與 OpenAI 背後的微軟形成陣營對比。

Anthropic 表示，Claude 有先進的高級推理、視覺分析、代碼生成、多語言處理等功能。目前 Anthropic 發布了 Claude 3 的三個版本：Claude 3 Haiku（Haiku 意指俳句）、Claude 3 Sonnet（Sonnet 意指十四行詩）和 Claude 3 Opus（Opus 意指藝術作品），這三個版本功能依次增強，價格成本也依次上升，Opus 版本最強大。

據 Anthropic 官方發布的視頻，Claude 可以使用一系列工具，來預測美國 GDP 走勢。Claude3 Opus 可以使用網頁視圖工具，進入網頁的 URL 鏈接并利用多模态中的視覺能力查看網頁信息。Claude 3 Opus 還使用 Python 解釋器來寫出代碼，渲染圖像，将數據生成折線圖。結果顯示 Claude 預測的 GDP 走向的準确度在 5% 以内。

Claude 3 預測的 GDP 走向準确度在 5% 以内。圖片來源：Anthropic 官方 YouTube

在讓 Claude 3 分析世界上幾大經濟體的 GDP 變化時，Claude 3 還使用了調度子代理的工具，能自行建立多個子模型代理（相當于 Claude 3 自身的多個版本），Claude3 給這些子模型寫提示詞，指揮幾個代理平行進行 GDP 的運算和預測。

據博主 " 數字生命卡茲克 " 測評，Claude 有着目前大模型中一流的推理能力，甚至超越 GPT-4。Claude 官網給出的 Claude 3 測評結果顯示，在使用 MMMU 多語言數學推理測試集來測試時，Claude 3 Opus 達到 90.7% 的準确率，用的是 0-shot，GPT4 是 8-shot，達到了 74.5%。0-shot 意味着大模型沒有在 Prompt 裏給任何示例，就直接被要求完成任務。而 8-shot 則是在提示詞中給了 8 個示例。這說明 Claude 在不給出示例的情況下，利用提示詞裏的上下文來推理的能力更強，

Anthropic 表示，Claude 能處理超長的上下文，有着近乎完美的記憶力。Claude 3 系列型号在發布時最初将提供 200K 上下文窗口。然而，所有三種模型都能夠接受超過 100 萬個詞元的輸入。爲了有效地處理長上下文提示，模型需要強大的回憶能力。

一種叫 " 大海撈針 "（NIAH）的評估，是測試 Claude 大模型從輸入的海量數據中準确回憶并找到某個細小信息的能力。Anthropic 使用開源文檔，每個提示詞中放置 30 個随機問題針，來訓練 Claude，結果 Claude 3 Opus 不僅實現了近乎完美的召回率，超過 99% 的準确率，而且在某些情況下，它甚至識别出提示詞中的 " 針 " 語句似乎是人類特意插入到原文中的，并識别這個測試本身的局限性。

據科技自媒體 " 平凡的平凡 " 測評，把劉慈欣 2 萬字的小說《鄉村醫生》分别給到 Claude 3 和 GPT-4 後，提問曆史學家的名字，Claude 3 找出了曆史學家名字所在段落，而 GPT-4 沒找到。

另外，Anthropic 的官方視頻還顯示，最輕量的 Haiku 版本 Claude 3，可以做到将數千個掃描文檔，這些 PDF 是掃描版而非文字版，即使對于不清晰的字迹，Claude 大模型可以用視覺能力，通過上下文的推理來識别文字。随後，Claude 3 分析并提取關鍵詞，來轉化爲結構化的數據。這将簡化出版商、醫療供應商、律師事務所的繁重的文件處理業務。

Anthropic 由 OpenAI 前高管 Daniela Amodei 和 Dario Amodei 兄妹于 2021 年創立。2023 年 9 月，亞馬遜宣布投資高達 40 億美元，谷歌随後在次月承諾投資 20 億美元。2024 年 2 月，風險投資公司 Menlo Ventures 完成了一項額外投資 7.5 億美元的交易。據紐約時報報道，Anthropic 在一年内融資 73 億美元。

據 The Atlantic 報道，2022 年 11 月，當 OpenAI 高層得知 Anthropic 要發布 Claude 聊天機器人時，決定提前上線 ChatGPT，随後這場席卷全球的 AI 風暴就此開啓。2023 年秋天，當 OpenAI 的首席執行官 Sam Altman 被董事會戲劇性地解雇時，董事會曾在那個混亂的周末邀請過 Anthropic 的首席執行官 Dario Amodei 來擔任 OpenAI 的代理 CEO，但是被 Dario 拒絕。

在 Claude 3 發布的幾天前，3 月 1 日，特斯拉首席執行官 Elon Musk 起訴 OpenAI 及其首席執行官 Sam Altman，稱 OpenAI 放棄了最初的造福人類的非盈利使命，轉向爲盈利而開發人工智能。Claude 3 發布後，彭博社科技采訪 Anthropic 聯合創始人 Daniela Amodei，問及 Elon Musk 起訴 OpenAI 一事時，Daniela 表示 Anthropic 作爲一家公益公司，緻力于平衡 AI 的潛在力量，同時保證産品的可靠、安全，執行公司最初的願景，即提高人工智能行業的水平，保證投入市場的模型産品盡可能安全。