本文作者:杜玉
來源:硬 AI
9 月 10 日周二,據知名科技商業類媒體 The Information 援引多位測試過該模型的人士透露,站在時代風口浪尖的 "AI 寵兒 "OpenAI 計劃在未來兩周内發布名爲 " 草莓 " 的最新人工智能産品,作爲 ChatGPT 所提供服務的一部分。這比兩周前傳聞的 " 秋季發布 "(9 月至 11 月)要更早。
上述報道稱,專注于推理能力的人工智能 " 草莓 " 發布前後還有一些亟待解決的問題,但看似 " 倉促上馬 " 似乎說明 OpenAI 感受到了大語言模型驅動産品領域的激烈競争壓力,希望通過近幾個月被市場期待已久的草莓項目,來恢複 ChatGPT 首發以來兩年裏大部分時間的勢頭。
何爲 " 草莓 " 模型?專注于推理能力,是人工智能下一個重大突破
兩周前曾有消息稱,OpenAI 加速推出 " 草莓 " 推理人工智能模型,以推動聊天機器人業務。四周前的消息稱,著名 AI 搜索公司 perplexity CEO 暗示已經提前用上了 OpenAI 的最新模型 " 草莓 "。
華爾街見聞曾提到,早在 5 月時就有傳聞稱 OpenAI 正在神秘開發代号爲 " 草莓 " 的項目。兩個月前的 7 月 13 日,又有消息确認 " 草莓 " 是 OpenAI 正在開發新的人工智能模型,希望提供更高級推理能力以形成邁向通用人工智能(AGI)的重大突破。
具體來說," 草莓 " 模型憑借增強的推理能力,能夠更好地處理令以往 AI 模型 " 撓頭 " 的複雜科學和數學問題,不僅能讓大語言模型(LLM)根據用戶的複雜查詢生成答案,甚至還能提前規劃,以便自主、可靠地浏覽互聯網,進行 OpenAI 定義的 " 深度研究 "(deep research)。
評論普遍認爲,OpenAI的 " 草莓計劃 " 有望成爲人工智能下一個重大突破。更先進的推理能力意味着該技術可以 " 自主 " 執行更複雜任務,而不僅僅是依靠用戶的逐步提示行事。推理一直是 AI 在類人智能追求中最棘手的問題之一,而具有推理能力的人工智能模型不僅能改善數學和編程能力,還可以徹底改變科學研究,增強醫療保健和金融等複雜領域的決策力,并加速技術創新。
會顯著更貴嗎?" 草莓 " 模型具體的提供形式和定價模式尚不确定
據悉," 草莓 " 發布後雖然整體作爲 ChatGPT 的一部分,但也是一項獨立産品,可能會納入客戶選擇以支持 ChatGPT 運行的 AI 模型下拉菜單中,但具體的提供形式和定價模式都尚不确定。
與常規的對話式人工智能不同," 草莓 " 在回應用戶的提示語之前會 " 思考 "10 到 20 秒,而不是立即給出答案。對于複雜或包含多個執行步驟要求的查詢語," 草莓 " 将比現有的 GPT-4o 版本更易于使用,不需要用戶明确告知 ChatGPT" 完成中間推理步驟以得出最終答案 " 等額外舉動。
有分析稱,這意味着 " 草莓 " 将成爲更加智能的助手,不僅在解決數學問題和編碼方面表現更佳,在更 " 主觀 " 的商業任務方面也更優秀,比如集思廣益制定産品營銷策略等。而且在這類偏創意的任務中,該模型将提供更針對用戶公司需求、更詳細的建議,比如生成每周執行計劃。
不過,假設發布一切順利,在初始版本 " 草莓 " 隻能接收和生成文本信息,而不能接收和生成圖像,這代表不像其他 OpenAI 模型那樣具備 " 多模态 " 功能,算是 " 缺點 " 之一。
同時,盡管 " 思考 " 階段有助于避免 AI 犯錯、且能預測如何全面回答用戶問題,但有測試過該模型的人士稱,一些簡單問題也會令草莓 " 思考 " 而無法迅速給出答案;答案質量僅略佳,不值得額外等待;而且有時無法在回答新問題之前記住并整合與用戶的先前聊天記錄。
在定價方面,上周曾有消息稱,ChatGPT Plus 當前付費價格是每月 20 美元,但 OpenAI 考慮将 " 草莓 " 和被外界譽爲 "ChatGPT 5" 的 " 獵戶座 "(Orion)等全新大模型拟定在月付 2000 美元,等于定價提升 100 倍。分析認爲,OpenAI 能考慮如此高的價格跨度,主要是因爲缺錢、新産品足夠強以及手握數億用戶。
" 草莓 " 模型爲何重要?或重新定義 AI能力邊界,爲 GPT 5提供高質量合成訓練數據
OpenAI 首席執行官奧特曼(Sam Altman)曾在今年早些時候表示,人工智能領域 " 最重要的進步方向将是推理能力 "。
而 " 草莓 " 項目被認爲就是去年披露出的 OpenAI"Q*" 計劃,該項目在公司内部已被視爲一項突破。觀看過演示的人稱能夠回答當前商用 AI 模型無法解決的棘手科學和數學問題。
奧特曼 8 月初發帖被外界認爲給 " 草莓 " 項目預熱
OpenAI曾在 8月 11日給出了未來 AI發展的五個階段路線圖,第一階段便是現在具有對話語言的 AI 聊天機器人,第二階段是具有人類水平問題解決能力的 " 推理者 ",第三階段是可以采取自主行動的 " 代理人 "(AI agent),随後是可協助發明的 " 創新者 " 和可完成組織工作的 " 組織者 "。
而 "草莓 "極可能是幫助 OpenAI實現第二級 AI的關鍵,一旦成功将重新定義 AI的能力邊界,自主執行複雜任務、獨立解決複雜問題并驗證輸出内容,代表人類離通用人工智能 AGI 又進一步。專注于推理的 " 草莓 " 可能也是爲下一代 AI 模型 " 獵戶座 " 或者說 ChatGPT 5 奠基的必經之路。
軟件開發機構 Technology Rivers 創始人兼 CEO Ghazenfer Mansoor 指出,借助 " 草莓 " 項目,OpenAI 對人類推理水平的追求不僅是技術奇迹,更能突破界限、激發每個領域新的可能性。比如在商業領域,人工智能将能極大地改變供應鏈的管理方式,非常準确地預測市場趨勢,并在很大程度上使客戶體驗非常個性化。
而在普通用戶的層面,其使用體驗也會有所改進,例如具有推理能力的 AI 模型不僅能提供更優化的旅行計劃和健康建議,甚至可以分析用戶的消費習慣并創建完全定制化的預算方案,做更智能的助手。
總而言之,在理想化的情況下," 草莓 " 将能夠解決超出當前人工智能模型能力範圍的問題和任務,并進行 " 深入研究 "," 比任何現有的聊天機器人都更勝一籌 "。
還有分析指出," 草莓 " 計劃旨在籌集更多資金,OpenAI 需要這筆錢來支持代号爲 " 獵戶座 " 的下一代前沿模型開發。而且,爲 " 獵戶座 " 模型生成高質量的合成訓練數據被認爲是 " 草莓 " 的關鍵應用之一," 這一點意義重大,因爲互聯網上的大部分訓練數據都已被使用殆盡 ":
人工智能模型所依賴的大型數據集可能容易出現偏差和錯誤,或者包含不完整或不準确的信息。草莓計劃生成的高質量合成數據可以填補現實世界數據集的空白,并提供更全面、更包容、更平衡的訓練集。
許多人認爲,使用合成數據可以幫助未來的人工智能模型更加中立和公平,并減少噪音、幻覺和不相關的信息,從而提高訓練的效率和模型的準确性。
根據已知的信息,草莓計劃改進了推理、邏輯以及規劃和開展研究的能力,可以讓模型自主進行實驗、分析數據并提出新的假設。這可能會帶來科學突破,包括發現新藥。這些模型還可以提供個性化教育,創建教育内容和互動課程。
據知情人士透露," 草莓 " 項目包括一種專門的 " 後訓練 " 方法,即生成式 AI 模型已經過大量數據集上進行預訓練後,進一步調整模型以提高其在特定任務上的表現。這類似于斯坦福大學在 2022 年開發的 " 自學推理者 "(Self-Taught Reasoner,簡稱 STaR)方法。
STaR 創造者之一、斯坦福大學教授 Noah Goodman 曾表示,STaR 可以讓 AI 模型通過叠代創建自有訓練數據," 引導 " 自己進入更高的智能水平,理論上可用來讓語言模型實現超越人類的智能。但他也承認," 這既令人興奮又令人恐懼,人類(應就自身處境)需要認真思考一些問題了。"