文心一言官宣免費了。
2 月 13 日,百度官方宣布文心一言将于 4 月 1 日 0 時全面免費,所有 PC 端和 App 端用戶可以免費使用旗下最新的模型。2023 年 11 月 1 日,百度推出文心一言專業版,連續包月價格爲 49.9 元,是中國 AI 巨頭中首家面向 C 端推出付費服務的大模型産品。時隔 516 天後,文心一言終于宣布全面免費。

(圖源:文心一言)
就在官宣免費前不久,百度創始人兼首席執行官李彥宏在談及 DeepSeek 對 AI 行業的沖擊時,大方表示沒有被震驚,甚至還要加大創新力度。" 這是一個非常激動人心的時刻,我們到處都能看到創新,我們必須适應這種快速變化的創新 ",李彥宏接受采訪時回應道。
DeepSeek 的到來的确讓與 AI 相關的行業全面地震,一方面,它代表着中國 AI 大模型站在了世界的前列,無論是思維模式的創新性,還是落地實踐的實用性;另一方面,它讓投資者與硬件開發商看到了 AI 大模型的另一種方向,即便不需要豪擲千金,也能獲得不錯的效果。
更重要的是,DeepSeek 完全免費,面對 C 端消費者,我們可以随時随地免費地使用其最新的大模型。這與此前正在焦慮如何通過大模型 C 端産品實現盈利的巨頭們完全背道而馳,比如 OpenAI。
如今,文心一言徹底免費,擁有強悍推理、理解、記憶和邏輯能力的文心 4.0 Turbo 也将面向所有普通用戶開放。這也意味着,文心一言與 DeepSeek 之間的戰争,正式拉開序幕。
文心一言目前面向 C 端的大模型産品主要分爲四個,分别是文心 3.5、文心 4.0、文心 4.0 Turbo 和文心 4.0 工具版。其中文心 3.5 爲免費開放,後三個模型都需要開通 VIP 獲得使用權限。
此前,文心一言 VIP 價格爲 59.9 元連續包月、588.8 元連續包年。與其官方的對标産品 GPT Plus 相比,這個價格已經非常合理。但在今年 4 月 1 日之後,包括文心 4.0、文心 4.0 Turbo、文心 4.0 工具版在内,全都免費開放。
但很多用戶可能會疑惑,文心 3.5 和需要付費的文心 4.0 Turbo,究竟差别有多大呢?爲了讓各位提前看到即将免費開放的文心一言 VIP 服務,小雷給它們來了個對比測試。
首先,我們抛出了一個最簡單的語言類問題:
我也想過過過兒的生活。
" 過兒 ",其實就是金庸小說《神雕俠侶》的人物楊過,作爲男主角,他與姑姑的愛情故事可以稱得上是武俠小說曆史上的經典情節之一。那麽這個問題其實最重要的就是 AI 會如何理解 " 過過 " 和 " 過兒 " 這樣的語言組織關系。

(圖源:雷科技制圖 / 文心 3.5)
文心 3.5 和文心 4.0 Turbo 都能明确了解這句話的實際含義,但通過思考後,給出的建議卻有些不同。文心 3.5 真的推薦了一些武術課程和身體鍛煉的方式,想要幫助小雷成爲一名 " 大俠 "。但從實際角度出發,這樣的建議其實不太合理。而文心 4.0 Turbo 則建議小雷可以從精神角度做一名大俠,即便無法和楊過一樣獲得超群的武藝,也能學會他行爲處事作風。
(圖源:雷科技制圖 / 文心 4.0 Turbo)
而到了推理環節,文心 4.0 Turbo 的優勢就更加明顯了。
我們準備了一個邏輯推理問題,需要從中判斷出小明在哪一天說了實話。
我的同桌小明特别喜歡撒謊,而且他也是一個奇怪的人:在一個星期中(連續的七天,首日不一定是周一或周日),他有 6 天都始終在撒謊,但是總會有一天,他說的所有話都是實話。有一次,我收錄了他在一個星期中連續三天所說的話。 第一天:在星期一和星期二我都會說謊話。 第二天:今天要麽是星期六,星期四或者星期天。 第三天:在星期三和星期五我都會說謊話。 通過這些,我知道了小明會在哪一天說實話。你知道了嗎?
在推理速度上,文心 4.0 Turbo 節奏明顯要快很多,隻做了四次假設,回溯問題後就做出了判斷,最終給出的答案是小明在第三天(星期二)說了實話,而這個回答也的确是正确回答。

但文心 3.5 在推理速度上就有一些不盡人意的地方,它先是将條件單獨羅列,再逐個分析解釋,整個過程花費了大概 1 分鍾時間。而最終給出的答案也不對,可以說是白浪費等待的時間了。但文心 3.5 也有值得誇贊的地方,它給出的思維鏈非常清晰,以緻于我們能從其中某一步就發現它的推理出現問題。

在進階的數學推理問題上,文心一言兩個模型再一次被拉開差距。
我們挑選了經典的撲克牌數字推論問題,要求文心 3.5 和文心 4.0 Turbo 算出正确結果:
老師發給甲、乙、丙三張撲克牌,老師說:" 你們三個人拿到的數字和是 14,并且沒有鬼牌。其中,J、Q、K、A 分别代表 11、12、13、1。你們隻能看自己的牌,能猜出其他兩人拿到的是什麽數字嗎?" 甲:" 我隻知道乙丙兩人的數字一定不同。" 乙:" 其實一開始我就知道咱們三個人的數字一定不同。" 丙:" 我知道你們倆拿到的數字了。" 請問,丙拿到什麽數字了呢?
和之前的結論一緻,文心 4.0 Turbo 無論是速度還是推理能力都表現十分優秀,幾乎在 20 秒之内就給出了完整的思考過程和答案。而文心 3.5 此次的推理速度要比之前快很多,但其推理過程要比 4.0 Turbo 複雜,反複的思辨使其在其中某個環節就出現幻覺。最終文心 4.0 Turbo 給出了正确答案,而文心 3.5 則回答錯誤。

不過,文心 3.5 在小雷的重複測試後,最終也給出了正确的回答,這說明其實對于普通用戶而言,文心一言整體的正确率其實還是不錯的,隻是效率上還是文心 4.0 Turbo 更加出色。

整體來看,早前需要付費才能享用的文心 4.0 Turbo 的确有很大的優勢,主要體現在推理的邏輯性、記憶能力和處理速度上。清華研究報告在此前給出的大模型綜合評測中,文心一言 4.0 都取得了相當不錯的成績,這也确實反映在普通用戶使用的體驗上。
前面我們提到,文心 4.0 Turbo 最大的優勢還是在推理能力、處理速度上,其實這同樣也是 DeepSeek 爆火的原因之一。
那麽,DeepSeek 在處理同樣的問題時,會比文心一言表現更好嗎?
在前面關于撲克牌數字的推斷中,文心 4.0 Turbo 幾乎在 1 分鍾内就完成了解答,并且答案正确,可以說是真的快準狠。而同樣的問題交給 DeepSeek,它卻無法給出正确答案。而 DeepSeek 最大的問題在于思維過程過于繁瑣,它會不停驗證自己假設的條件是否符合此前的推算邏輯,并且重複驗證後推倒重來。文心 4.0 Turbo 僅花費 1 分鍾不到時間就能得出答案的問題,DeepSeek 居然要花費近十分鍾推理。

(圖源:雷科技制圖 /DeepSeek)
最離奇的還是,DeepSeek 在推理過程中得出了正确答案,但最終的回答卻是錯誤的,這足以說明 R1 大模型還有進步的空間,算不上是非常成熟且可靠的大模型應用。
當然,目前 DeepSeek 最大的問題還是服務器算力不足,對于普通用戶而言,随手啓用 DeepSeek 詢問問題,還是有很大的概率會得出服務器繁忙的回答。不過,DeepSeek 目前的優勢還是思維鏈清晰,這對于我們複現和檢查推理過程很有幫助。
而在普通的推理問題上,DeepSeek 和文心 4.0 Turbo 實際上也是相同的問題,前者雖然能展示詳細的思考過程,但速度較慢,遇到複雜的問題還會出現思考與實際答案不符的情況。而文心 4.0 Turbo 則更成熟,隻是展示的思考過程沒有 DeepSeek 詳細。
實際上,百度作爲中國最早推出 C 端大模型應用的廠商,在曆經多次升級後已經非常成熟。隻是在 2023 年 11 月後,象征着百度已落地最強的大模型應用開始收費,對很多普通用戶而言,付費服務仍然存在着一定的距離。
截止目前,中國面向 C 端的 AI 大模型應用中,僅有百度文心一言、智譜清言的智譜 AI 有向用戶提供 VIP 服務。其中,文心一言 VIP 服務僅限制不同模型的使用權限,比如免費用戶隻能使用文心 3.5,其推理能力和生成能力與收費的模型有所區别;智譜 AI 則是限制問答次數,隻有開通 VIP 服務後才能無限次使用,其餘生成能力也有一定限制。

(圖源:雷科技制圖)
免費向用戶開放所有權限的 AI 應用中,元寶、豆包、通義千問都屬于多模态應用,簡單來說,用戶可以要求其生成圖片、表格,豆包還開放了音樂制作的接口,以及實時語音交流能力。在海外市場,包括 ChatGPT、Claude 2 在内的主流 AI 應用,全面開啓 VIP 訂閱模式。
整體來看,中國市場裏的 AI 應用普遍采用免費的方式向消費者提供服務,一方面,免費提供服務是快速擴大用戶基礎的有效方式。通過免費向大衆提供服務,企業可以迅速積累大量用戶,提升市場份額。正如字節跳動在推出豆包時,作爲免費 AI 應用,它在上線短短三個月時間内就突破了千萬的訪問量,跻身一線 AI 應用地位。另一方面,AI 作爲新興市場,在競争激烈的環境中,免費策略有助于提升品牌影響力,吸引更多用戶使用産品,從而在市場中占據有利位置。
如今,百度宣布文心一言免費開放,對于風頭正盛的 DeepSeek,或是其他 AI 應用而言,都是巨大的威脅。
在 2023 年文心一言、ChatGPT 開啓訂閱模式後,市場普遍認爲 AI 付費的時代即将到來。兩年時間過去,這股風潮不僅沒有被其他大模型開發商跟随,甚至在一次又一次初創型 AI 應用的爆火裏落于輿論下風,月之暗面的 Kimi 如今,時下火熱的 DeepSeek 亦是如此。
關于 AI 應用該如何盈利,目前還沒有完善的市場策略出爐。但 DeepSeek 的走紅給了市場一些警示:開發大模型并非純靠力大飛磚即可,狠砸資金堆砌算力也未必能獲得高回報。就連 OpenAI 也被免費的 DeepSeek 狠狠打臉,迫使創始人奧特曼緊急宣布即将發布的 GPT-5 将免費開放。不過,百度轉向免費的背後,實際上也是市場邁向成熟的關鍵。早在官宣免費前,百度創始人李彥宏已經透露 " 每 12 個月,(大模型)推理成本就可以降低 90% 以上。"
作爲普通用戶,小雷當然文心一言的開放免費感到興奮。畢竟在中文領域裏,文心 4.0 Turbo 無論是推理能力還是處理速度,又或是穩定性而言,都是首屈一指的存在。但文心一言免費,也代表着它将進入到更公開的市場裏去和 DeepSeek、豆包、元寶們一較高下,到那時候,屬于中國 AI 應用們的大比拼才算真正開始。