本文作者:房家瑤
來源:硬 AI
美東時間 2 月 13 日,據 The Information 報道,人工智能初創公司 Anthropic 計劃在未來幾周内推出一款創新的混合 AI 模型。
這款模型的獨特之處在于,它可以在深度推理和快速回複之間動态切換,爲開發人員提供一個多功能工具。根據一位使用過該模型的人士透露,Anthropic 的新模型在處理複雜問題時,可以調動更多計算資源進行深入推理,而面對簡單任務時,模型又能夠像傳統大語言模型一樣快速處理,無需額外計算。
最重要的是,它提供一種新穎的 " 滑動比例 " 功能,開發者可以通過滑動條精準控制模型在處理查詢時使用的計算資源量,從而調整推理深度和模型的 " 思考 " 時間。例如,将滑動條設置爲 "0" 時,模型将作爲普通的非推理 AI 運行,類似于 OpenAI 的 GPT-4o。
這爲開發者提高了成本效益,使他們能夠根據具體需求平衡成本、速度和性能。相比之下,OpenAI 在推理能力上的設計選擇較爲簡單。公司目前提供的是 " 低 "、" 中 " 和 " 高 " 三個固定設置。一些開發者反映,預測模型在不同級别下實際處理的 tokens 數量仍然充滿不确定性,這使得他們很難估算單次查詢的成本。
從産品設計來看,OpenAI 似乎更注重面向普通消費者和個人專業用戶,因此采用簡單易懂的 " 低 - 中 - 高 " 命名方式,而 Anthropic 則更專注于企業市場,其推出的精細化控制功能,允許開發者通過滑動條來調節 AI 模型的計算資源,使得企業能夠在成本、速度和性能之間找到最佳平衡點。
社交媒體 X 上有用戶表示:
" 鑒于 Claude 已經引起轟動,這可能會改變遊戲規則。"

" 準備好被另一個人工智能模型震撼吧!Anthropic 即将推出一個混合天才,他可以深度思考,反應速度比你說 " 創新 " 還快。"

Anthropic 編碼能力超過 OpenAI 的 o3-mini?
去年秋季,OpenAI 率先發布了具有推理能力的模型,随後谷歌、阿裏巴巴和高飛資本管理等公司紛紛跟進,推動了推理模型的競賽。
而在這場競賽中,Anthropic 則保持低調,選擇了一條不同的技術路線。如今,它終于揭開了這一謎底,計劃通過這款新模型實現雄心勃勃的營收目标。根據 The Information 的報道,Anthropic 的目标是超越 OpenAI,成爲應用開發者的首選 AI 供應商。
根據 OpenAI 首席執行官 Sam Altman 在社交媒體 X 上的最新透露,OpenAI 将推出 GPT-4.5,這将是一個傳統的非推理模型。接下來,OpenAI 計劃将 GPT 模型與 "o" 推理模型整合爲單一 AI 系統,這一舉措似乎借鑒了 Anthropic 的研發路徑。
值得一提的是,Anthropic 的新模型在編程方面取得了顯著進步。生成式 AI 在企業應用中,編程已成爲最強大的應用領域之一。一位使用過該模型的人士表示,當模型被允許以最長時間 " 思考 " 時,在某些編程基準測試中,其表現超過了目前客戶可以使用的最先進的 OpenAI 推理模型(即設置爲 " 高 " 推理級别的 o3-mini 模型)。
與 OpenAI 的推理模型更擅長處理學術性編程問題不同,Anthropic 的模型更适合企業工程師的日常編程任務。特别是在處理複雜的代碼庫時,Anthropic 的模型能更好地理解由數千個文件組成的複雜代碼庫,并且能夠生成首次即可運行的完整代碼行。
這一特性尤其值得關注,因爲 AI 模型在面對複雜編程問題時往往會 " 偷懶 ",僅提供注釋而非實際代碼。
目前,關于 Anthropic 新模型的定價問題仍未明确。業内普遍關注其是否能比 OpenAI 最近發布的 o3-mini 推理模型更加經濟實惠,後者已被認爲具有較高的性價比,吸引了大量開發者。
随着像 DeepSeek 和谷歌最新的 Gemini 模型等低價 AI 産品的推出,整個市場是否會趨向低價化,仍然是業内關注的熱點問題。目前,AI 模型市場可能分爲兩個陣營,一是前沿開發,即持續改進推理或編程能力的模型仍具有定價優勢。二是 " 足夠好 " 模型,它們在價格上可能會相互壓低,形成激烈的競争。