專注于推理的OpenAI“草莓”模型兩周内發布？是人工智能下一重大突破

本文作者：杜玉

來源：硬 AI

9 月 10 日周二，據知名科技商業類媒體 The Information 援引多位測試過該模型的人士透露，站在時代風口浪尖的 "AI 寵兒 "OpenAI 計劃在未來兩周内發布名爲 " 草莓 " 的最新人工智能産品，作爲 ChatGPT 所提供服務的一部分。這比兩周前傳聞的 " 秋季發布 "（9 月至 11 月）要更早。

上述報道稱，專注于推理能力的人工智能 " 草莓 " 發布前後還有一些亟待解決的問題，但看似 " 倉促上馬 " 似乎說明 OpenAI 感受到了大語言模型驅動産品領域的激烈競争壓力，希望通過近幾個月被市場期待已久的草莓項目，來恢複 ChatGPT 首發以來兩年裏大部分時間的勢頭。

何爲 " 草莓 " 模型？專注于推理能力，是人工智能下一個重大突破

兩周前曾有消息稱，OpenAI 加速推出 " 草莓 " 推理人工智能模型，以推動聊天機器人業務。四周前的消息稱，著名 AI 搜索公司 perplexity CEO 暗示已經提前用上了 OpenAI 的最新模型 " 草莓 "。

華爾街見聞曾提到，早在 5 月時就有傳聞稱 OpenAI 正在神秘開發代号爲 " 草莓 " 的項目。兩個月前的 7 月 13 日，又有消息确認 " 草莓 " 是 OpenAI 正在開發新的人工智能模型，希望提供更高級推理能力以形成邁向通用人工智能（AGI）的重大突破。

具體來說，" 草莓 " 模型憑借增強的推理能力，能夠更好地處理令以往 AI 模型 " 撓頭 " 的複雜科學和數學問題，不僅能讓大語言模型（LLM）根據用戶的複雜查詢生成答案，甚至還能提前規劃，以便自主、可靠地浏覽互聯網，進行 OpenAI 定義的 " 深度研究 "（deep research）。

評論普遍認爲，OpenAI的 " 草莓計劃 " 有望成爲人工智能下一個重大突破。更先進的推理能力意味着該技術可以 " 自主 " 執行更複雜任務，而不僅僅是依靠用戶的逐步提示行事。推理一直是 AI 在類人智能追求中最棘手的問題之一，而具有推理能力的人工智能模型不僅能改善數學和編程能力，還可以徹底改變科學研究，增強醫療保健和金融等複雜領域的決策力，并加速技術創新。

會顯著更貴嗎？" 草莓 " 模型具體的提供形式和定價模式尚不确定

據悉，" 草莓 " 發布後雖然整體作爲 ChatGPT 的一部分，但也是一項獨立産品，可能會納入客戶選擇以支持 ChatGPT 運行的 AI 模型下拉菜單中，但具體的提供形式和定價模式都尚不确定。

與常規的對話式人工智能不同，" 草莓 " 在回應用戶的提示語之前會 " 思考 "10 到 20 秒，而不是立即給出答案。對于複雜或包含多個執行步驟要求的查詢語，" 草莓 " 将比現有的 GPT-4o 版本更易于使用，不需要用戶明确告知 ChatGPT" 完成中間推理步驟以得出最終答案 " 等額外舉動。

有分析稱，這意味着 " 草莓 " 将成爲更加智能的助手，不僅在解決數學問題和編碼方面表現更佳，在更 " 主觀 " 的商業任務方面也更優秀，比如集思廣益制定産品營銷策略等。而且在這類偏創意的任務中，該模型将提供更針對用戶公司需求、更詳細的建議，比如生成每周執行計劃。

不過，假設發布一切順利，在初始版本 " 草莓 " 隻能接收和生成文本信息，而不能接收和生成圖像，這代表不像其他 OpenAI 模型那樣具備 " 多模态 " 功能，算是 " 缺點 " 之一。

同時，盡管 " 思考 " 階段有助于避免 AI 犯錯、且能預測如何全面回答用戶問題，但有測試過該模型的人士稱，一些簡單問題也會令草莓 " 思考 " 而無法迅速給出答案；答案質量僅略佳，不值得額外等待；而且有時無法在回答新問題之前記住并整合與用戶的先前聊天記錄。

在定價方面，上周曾有消息稱，ChatGPT Plus 當前付費價格是每月 20 美元，但 OpenAI 考慮将 " 草莓 " 和被外界譽爲 "ChatGPT 5" 的 " 獵戶座 "（Orion）等全新大模型拟定在月付 2000 美元，等于定價提升 100 倍。分析認爲，OpenAI 能考慮如此高的價格跨度，主要是因爲缺錢、新産品足夠強以及手握數億用戶。

" 草莓 " 模型爲何重要？或重新定義 AI能力邊界，爲 GPT 5提供高質量合成訓練數據

OpenAI 首席執行官奧特曼（Sam Altman）曾在今年早些時候表示，人工智能領域 " 最重要的進步方向将是推理能力 "。

而 " 草莓 " 項目被認爲就是去年披露出的 OpenAI"Q*" 計劃，該項目在公司内部已被視爲一項突破。觀看過演示的人稱能夠回答當前商用 AI 模型無法解決的棘手科學和數學問題。

奧特曼 8 月初發帖被外界認爲給 " 草莓 " 項目預熱

OpenAI曾在 8月 11日給出了未來 AI發展的五個階段路線圖，第一階段便是現在具有對話語言的 AI 聊天機器人，第二階段是具有人類水平問題解決能力的 " 推理者 "，第三階段是可以采取自主行動的 " 代理人 "（AI agent），随後是可協助發明的 " 創新者 " 和可完成組織工作的 " 組織者 "。

而 "草莓 "極可能是幫助 OpenAI實現第二級 AI的關鍵，一旦成功将重新定義 AI的能力邊界，自主執行複雜任務、獨立解決複雜問題并驗證輸出内容，代表人類離通用人工智能 AGI 又進一步。專注于推理的 " 草莓 " 可能也是爲下一代 AI 模型 " 獵戶座 " 或者說 ChatGPT 5 奠基的必經之路。

軟件開發機構 Technology Rivers 創始人兼 CEO Ghazenfer Mansoor 指出，借助 " 草莓 " 項目，OpenAI 對人類推理水平的追求不僅是技術奇迹，更能突破界限、激發每個領域新的可能性。比如在商業領域，人工智能将能極大地改變供應鏈的管理方式，非常準确地預測市場趨勢，并在很大程度上使客戶體驗非常個性化。

而在普通用戶的層面，其使用體驗也會有所改進，例如具有推理能力的 AI 模型不僅能提供更優化的旅行計劃和健康建議，甚至可以分析用戶的消費習慣并創建完全定制化的預算方案，做更智能的助手。

總而言之，在理想化的情況下，" 草莓 " 将能夠解決超出當前人工智能模型能力範圍的問題和任務，并進行 " 深入研究 "，" 比任何現有的聊天機器人都更勝一籌 "。

還有分析指出，" 草莓 " 計劃旨在籌集更多資金，OpenAI 需要這筆錢來支持代号爲 " 獵戶座 " 的下一代前沿模型開發。而且，爲 " 獵戶座 " 模型生成高質量的合成訓練數據被認爲是 " 草莓 " 的關鍵應用之一，" 這一點意義重大，因爲互聯網上的大部分訓練數據都已被使用殆盡 "：

人工智能模型所依賴的大型數據集可能容易出現偏差和錯誤，或者包含不完整或不準确的信息。草莓計劃生成的高質量合成數據可以填補現實世界數據集的空白，并提供更全面、更包容、更平衡的訓練集。

許多人認爲，使用合成數據可以幫助未來的人工智能模型更加中立和公平，并減少噪音、幻覺和不相關的信息，從而提高訓練的效率和模型的準确性。

根據已知的信息，草莓計劃改進了推理、邏輯以及規劃和開展研究的能力，可以讓模型自主進行實驗、分析數據并提出新的假設。這可能會帶來科學突破，包括發現新藥。這些模型還可以提供個性化教育，創建教育内容和互動課程。

據知情人士透露，" 草莓 " 項目包括一種專門的 " 後訓練 " 方法，即生成式 AI 模型已經過大量數據集上進行預訓練後，進一步調整模型以提高其在特定任務上的表現。這類似于斯坦福大學在 2022 年開發的 " 自學推理者 "（Self-Taught Reasoner，簡稱 STaR）方法。

STaR 創造者之一、斯坦福大學教授 Noah Goodman 曾表示，STaR 可以讓 AI 模型通過叠代創建自有訓練數據，" 引導 " 自己進入更高的智能水平，理論上可用來讓語言模型實現超越人類的智能。但他也承認，" 這既令人興奮又令人恐懼，人類（應就自身處境）需要認真思考一些問題了。"