出品 | 虎嗅科技組
作者 | 王欣
編輯 | 苗正卿
頭圖 | 《教父》
果然是 o1(正式版)和 ChatGPT Pro。
12 月 5 日,OpenAI 僅花了 15 分鍾就結束了聖誕季發布會的首秀。前一天他們發推表示要連續 12 天的集中新品發布,看似 " 大的來了 "。
但在 15 分鍾首秀過後,有人調侃奧特曼将短劇模式玩明白了,把兩小時發布會切成了 12 段。
這次發布的 o1 正式版但并沒有超出行業預期——此前接近 OpenAI 人員就向 The Verge 透露,發布會新品包括文生視頻期貨 Sora 和新的推理模型。
然而,o1 對行業的意義也已經逐漸凸顯——成爲在傳統 Scaling Law 遇到瓶頸後一種新的 scale 技術路徑,國内玩家也在這條路徑上積極投入。
而從售價翻倍、高達 200 美元一月的 ChatGPT Pro,不難看出 OpenAI 的商業化野心—— OpenAI 首席商務官 Lionetti 表示,OpenAI 今年的目标是實現近 40 億美元的收入,其中絕大部分銷售額來自爲 ChatGPT 的高級功能付費的個人消費者。
或許可以說,奧特曼也沒有太多其他選擇。據此前未披露的内部财務數據估算和相關人士的分析,OpenAI 今年可能虧損高達 50 億美元。
新的裏程碑?
Lionetti 表示,OpenAI 将 o1 視爲一個 " 裏程碑 ",它已經打開了新的市場。
o1 使用強化學習技術訓練模型自行解決問題,該技術通過獎勵和懲罰來教導系統。然後,它使用 " 思路鏈 " 來處理查詢,類似于人類通過逐步思考來處理問題的方式。
相較于之前的 o1-preview(預覽版),新模型在速度、性能和準确性上均有顯著提升。據奧特曼介紹,o1 模型在編碼、數學和科學寫作等方面表現更爲出色,特别是在處理複雜問題時,其響應速度提高了約 50%,錯誤率減少了 34%。
值得一提的是,o1 模型還支持圖片形式的多模态推理。除此之外,OpenAI 還計劃在未來幾個月内增加網頁浏覽和文件上傳等功能的支持,進一步拓展 ChatGPT 的應用場景。
OpenAI 推出 o1-preview 後,谷歌也加大了推理力度。谷歌已将其推理模型團隊規模從 o1-preview 發布前的幾十人擴大到 200 人左右。據一位知情人士透露,谷歌還爲該團隊提供了更多計算資源。
在國内,Kimi、昆侖萬維、deepseek 也上線了 o1 路線的推理模型。
11 月 16 日,月之暗面發布了數學模型 K0-math,根據其公布的基準測試:K0-math 可對标 OpenAI o1 中可公開使用的兩個模型:o1-mini 和 o1-preview。
11 月 20 日,Deepseek 的 DeepSeek-R1-Lite 正式上線。與 OpenAI 的 o1 模型相比,R1-Lite 模型将完全公開其複雜的思考路徑。根據 Deepseek 官方的說法,R1-Lite 能夠處理的思維鏈長度可達到數萬字之多。
11 月 27 日,昆侖萬維正式推出具有複雜思考推理能力的系列模型——「天工大模型 4.0」 o1 版(Skywork o1)。
"o1 路線所代表的深度推理模型,其實之前國内各家 AI 公司都有嘗試,但并沒有做得很深," 某互聯網大廠産品經理表示:" 而 OpenAI 的 o1 發布後,大家才堅信這個事情是值得做的,投入會比前期要更堅決一些。"
大家押注 o1 另一重要原因也在于,此前 Scaling Law 的路線已經走到了瓶頸,GPT5 也遲遲未發。
智譜 CEO 張鵬認爲,雖然 "Scaling Law 确實不再漲了 ",但仍在 Agent、多模态、強化學習、擴散模型等不同方向上存在新場景、算法的 scale 可能。
o1 所代表的強化學習路線,就是這些可能性中的一條重要路線。
如何落地?
但 o1 落地場景仍然還需要更多探索嘗試,并且局限依然存在。比如,模型也會因爲過度思考,而在簡單問題上花費多餘的步驟。
然而,在數學、生物、物理等科研領域,o1 的潛力正在逐步顯現。相較于陪聊、普通問答等場景,讓 AI 去攻克哥德巴赫猜想等人類難題,或許才是不斷提升 AI 上限的正确打開方式。
據 The Information 報道,勞倫斯利弗莫爾國家實驗室的研究人員,已經使用 o1 模型來解決博士級的問題。
該實驗室位于加利福尼亞州利弗莫爾,其研究重點是使用高功率激光照射小型燃料膠囊,以在核聚變反應中産生能量。據參與實驗的一位人士稱,在一個案例中,研究人員使用 OpenAI 的 o1-preview,來計算在一定強度的激光作用下膠囊的溫度和壓力,并詢問需要多強的激光才能達到一定的溫度和壓力。
OpenAI 推理模型通常需要 10 到 60 秒來回答這些問題。該人士表示,這可以爲研究人員節省 30 分鍾到幾個小時或幾天的時間。
而在這次的發布會上,Jason Wei 也演示了 o1 在生物科學領域的應用,讓 o1 找出符合标準的蛋白質。對于這個 o1-preview 無法回答的問題,o1 正式版在 53 秒後便給出了正确答案。
OpenAI 首席商務官 Lionetti 也強調了 o1 模型在法律、編程、醫療保健和制造業的應用場景。例如,在法律領域,它有助于對條款清單、文檔分析、多步驟審批流程進行法律或數學計算。他表示,該公司還向醫療保健公司出售 o1,這些公司使用它來爲醫療索賠定價、分析臨床指南和分析複雜數據集。它關注的另一個市場是制造業,OpenAI 表示,o1 可以分析和加速工業流程。
這些場景也讓 OpenAI 看到了商業化的更多可能性。
因此,OpenAI 推出了價格更高的 ChatGPT Pro 訂閱服務,這是一個每月收費 200 美元的新套餐,用戶可以無限制地使用 OpenAI 的 o1、GPT-4o 以及高級語音模式。此外,Pro 訂閱還特别提供了一個僅供 Pro 用戶使用的 o1 版本,這個版本被稱爲 o1 Pro 模式,它通過增加計算資源來優化對複雜問題的處理,以提供更優質的答案。
雖然相較此前每月 20 美元的 Plus 套餐,Pro 定價更爲高昂,但這對于剛剛宣布周活用戶高達 3 億的 OpenAI,仍然存在很大的付費轉化空間。
更爲重要的是,ChatGPT 目前付費版本的可能增長速度,不足以彌補運營該服務的高昂成本——據此前未披露的内部财務數據和參與該業務的人士的分析,OpenAI 今年可能虧損高達 50 億美元。
這種情況下,要達到 40 億美元年收入的小目标,OpenAI 似乎沒有太多選擇。
(Tips:我是虎嗅科技醫療組的王欣,關注 AI 及創投領域,行業人士交流可加微信:13206438539,請注明身份。)