在生成式AI的崛起中，百度“先下一城”

年初，李彥宏在一封内部信中預言："AI 技術已經發展到一個臨界點，各行各業都不可避免地被改變，中國 AI 市場即将迎來爆發性的需求增長。"

而幾個小時前，百度正式啓動産品測評的 " 文心一言 " 全新一代知識增強大語言模型，不僅印證了李彥宏的預言成真，業界也發現百度正在一個個實現曾經吹過的 " 牛 "。

特别是當我國人工智能産業在經曆了十幾年波峰波谷交替之後，正在生成式 AI 技術的東風迎來新的春天，文心一言的面世，無疑成爲了中國科技企業進入 AIGC 賽道 " 掘金 " 的入場券。

對标 ChatGPT？人有我也有，人有我更優

去年，AI 行業再度迎來新的節點，人工智能生成内容 AIGC 以超出人們預期的速度，正在成爲科技革命曆史上的重大事件。

不論是 "AI 畫師 "DALL-E2，還是 " 萬能陪聊 " 的對話機器人 ChatGPT，都在生成式内容的廣度和深度上延展，并且走在了規模化爆發的前夜。

在中國，百度可能是最接近 ChatGPT、DALL-E2 的締造者 OpenAI 的對标之一。

因爲 OpenAI 優勢在大型語言模型，微軟智能雲則提供了 AI 基礎設施，百度文心一言則是兩者的集合，進而文心一言能做到人有我也有。

在百度文心一言的新聞發布會上我們看到，中國自己的生成式 AI 在基礎的文學創作、商業範本寫作、邏輯推理等基礎層面，已經表現得十分成熟。

例如新聞發布會現場，文心一言不僅能對一些有标準答案的客觀問題對答如流，還可以将知名科幻小說《三體》的核心内容進行總結，并提出五個續寫《三體》的建議角度。

在大家之前津津樂道的商業文案撰寫方面，AI 創意生成方面，文心一言也有着自己獨到的見解：

顯然文心一言在測試過程中，并且沒有一些生成式 AI 在回答事實性問題時常常 " 胡編亂造 " 的，或者用 " 我不知道 " 等回答來 " 擺爛 "。說明 TA 在對話問答、總結分析、内容創作生成的綜合能力可以對标一個真實的人類。

另外，文心一言也能夠學會數學推演及邏輯推理等相對複雜任務。面對 " 雞兔同籠 " 這類鍛煉人類邏輯思維的經典題目時，文心一言不僅能理解題意，并有正确的解題思路；還能看出來人類在 " 騙 TA"，進而讓人類給出正确的題目，最後像學生做題一樣，按正确的步驟，一步步算出正确答案。

而在我國這個世界上最難的 " 中文語言處理 " 土壤中，文心一言則做到了 " 人有我優 "。

在新聞發布會現場展示中，文心一言可以正确解釋成語 " 洛陽紙貴 " 的含義、" 洛陽紙貴 " 對應的經濟學理論，關鍵是它還能用 " 洛陽紙貴 " 四個字創作了一首古風藏頭詩。

既能準确理解人類意圖、又能清晰地表達，這是基于龐大數據規模而發生的 " 智能湧現 "。據了解，目前文心一言大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據，以及 5500 億事實的知識圖譜等，這讓百度在中文語言的處理上，能夠處于獨一無二的位置。

在此基礎上，文心一言還表現出更優秀的中文理解及多模态生成能力，李彥宏現場展示了文心一言生成圖片、音頻和視頻的能力，并且可以經受住關于多模态生成素材的 " 靈魂疑問 "。

負責主抓文心一言開發的百度 CTO 王海峰，在詳解 " 文心一言 " 背後技術特性時表示，文心一言是在百度的 ERNIE 及 PLATO 系列模型的基礎上研發的。它的關鍵技術包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。前三項是這類大語言模型都會采用的技術，ERNIE 和 PLATO 中已經有應用和積累，在文心一言中又有了進一步強化和打磨；後三項則是百度已有技術優勢的再創新，也是文心一言未來越來越強大的基礎。

文心一言的使命：生成式 AI 進入千行百業

在文心一言的新聞發布會上，李彥宏又預言道，相信人工智能會徹底改變我們今天的每一個行業。AI 的長期價值，對各行各業的颠覆性改變，才剛剛開始。未來，将會有更多的殺手級應用、現象級産品出現，将會有更多的裏程碑事件發生。

目前業界的共識是，在進入人工智能時代後，IT 技術的技術棧發生了根本性變化。過去基本分爲三層：芯片層，操作系統層和應用層。現在可以分爲四層：芯片層、框架層、模型層和應用層，而在模型層上，類似文心一言的大語言模型，無論哪家公司都不可能靠突擊幾個月就做出的。

在 AI 業界，大模型的訓練堪稱 " 暴力美學 "，需要有大算力、大數據和大模型，每一次訓練任務都耗資巨大。百度布局的優勢則是可以在技術棧的四層架構中，實現端到端優化，大幅提升效率。尤其是在框架層和模型層之間，有很強的協同作用，可以幫助構建更高效的模型，并顯著降低成本。

對于百度來說，文心一言的基礎百度的文心大模型 ERNIE 1.0 在 2019 年時就已經投入研發，在不同行業内都具備解決方案，現在文心一言确實已經具備了深入千行百業的潛力，所以有業内人士預言，未來在大模型的基礎設施公司，文心一言将根本性地改變雲計算行業的遊戲規則。

例如許多新型雲計算公司，其主流商業模式将從 IaaS 變爲 MaaS（模型即服務）。之前企業選擇雲廠商更多看算力、存儲等基礎雲服務。未來，更多會看框架好不好、模型好不好，以及模型、框架、芯片、應用這四層之間的協同。

而在全球範圍内，在四層架構的每一層都有領先産品的公司幾乎沒有，這是百度非常獨特的優勢。後續，芯片、框架、大模型和終端應用場景可以形成高效的反饋閉環，幫助大模型不斷調優叠代，從而升級用戶體驗。

而在需要垂直化、場景化、個性化的模型和應用工具的行業中，基于百度智能雲多年來深入千行百業的經驗，文心一言的行業 Know-how 基礎就會讓别人難以望其項背。例如在複雜的 ToB 業務和客戶服務之間，文心一言可以作爲一個翻譯官，應用于辦公軟件、OA、ERP 等企業日常管理經營必備系統，以及醫療、教育、金融、客服等行業所需的專業化場景。

在面向用戶或者中小企業、C 端用戶，也可以有文字、圖片、音視頻等内容生成服務；或者助力一批企業成爲應用服務提供商。屆時可能基于文本生成、圖像生成、音頻生成、視頻生成、數字人、3D 等場景，湧現出很多創業明星公司。

不久前英偉達 CEO 黃仁勳将生成式 AI 爆發的時代比喻爲 "iPhone" 時刻，因爲當年誰也沒想到，iPhone 誕生之後的十餘年，圍繞着移動生态，移動互聯網前所未有的繁榮。

類比當年 iPhone 先改造再創造的思路，文心一言也可以從現有的工具和服務入手，創造人工智能通用時代的 " 一言 " 時刻。因爲百度對文心一言的定位是一個通用平台，金融、能源、媒體、政務等千行百業，都可以基于這個平台來實現智能化變革，實現效率提升，創造商業價值。據藍鲸财經了解，在正式啓動産品測評之前，主動接入文心一言的 600 餘家企業，大多都是想通過文心一言去創建更好的客戶體驗和管理流程，在企業人效和能效的提升上搶跑。

文心一言雖不完美，但有 " 飛輪機制 " 不可小觑

其實李彥宏在新聞發布會中也坦誠，從他自己在内測過程中體驗到的文心一言的能力來說，（當前）确實不能叫作完美。

所以關于文心一言啓動産品測評的時機，市場上還有個小争議——爲什麽文心一言要和 ChatGPT 火爆的日子撞車？

許多業内人士表示，百度選擇這個時間節點啓動測評，是考量了市場需求——百度的各個産品線都在等待這樣的技術，客戶也在等待，因而需要盡早推出。

但是文心一言的不完美也是暫時的，面世後，文心一言将建立起真實用戶反饋。人類反饋、獎勵模型和策略優化之間的飛輪機制，會随着真實用戶的反饋越來越多，文心一言的效果會越來越好，能力越來越強。

另外，王海峰也表示，随着模型層的文心一言與框架層的百度飛槳平台的進一步融合發展，人工智能技術和應用的研發将越來越标準化、自動化和模塊化，加速人工智能的工業大生産，同時也反哺文心一言加速叠代進化，落地更多場景和行業。

縱觀生成式 AI 的發展曆史，我們發現文心一言的面世并不是一蹴而就的，而是百度進行 " 馬拉松式研發 " 的成果。

财報顯示，近十年累計研發投入超過 1000 億元，2022 年百度核心研發費用 214.16 億元，占百度核心收入比例達到 22.4%。如此高的研發投入，在國内的互聯網大廠中鳳毛麟角。

其中，語言模型的訓練并不是普通公司所能承受的，資料顯示跑通一次 100 億以上參數量的模型，算力至少需要 1000 張 GPU，按照一張 GPU 五萬元的市場均價計算，1000 張 GPU 意味着單月至少 5000 萬的成本。業界測算，gpt-3 單次訓練成本至少 460 萬元。所以國内也隻有百度等爲數不多的幾家公司有這個财力和人力去進行研發。

在互聯網界一直有這樣一個段子："2017 年，美國公司花了很多錢在做阿爾法狗，中國公司在送外賣。2023 年，美國公司花了很多錢在做 ChatGPT，中國公司還在送外賣。"

可見技術抛棄人的時候，其實是打了招呼的。所以中國公司更應該去爲賺更高精尖的錢而投入，文心一言就是這樣一個産物。它代表着百度的技術人員們願意追逐技術改變世界的夢想，這也是李彥宏願意爲了文心一言再拼一把的原因。

寫在最後

有人說 2023 年是 " 陽和啓蟄 " 的時刻，也是轉換經濟動能的關鍵之年。中國企業，需要更多像文心一言一樣的破壁者，才能在人工智能深入實體産業後，摩擦出最原生的中國式突破。

目前，文心一言身上有着百度多年投入的積累，也有中國最大的 AI 生态縱深，故而也能真正助力企業實現高效的上雲運轉，讓千行百業重塑 " 筋骨 "，搭載着新的生産力工具滿配出發。