距離 ChatGPT 發布整整兩年後,中美兩地的大模型代表廠商,仍在完善模型産品功能和使用體驗上不斷發力:11 月初,OpenAI 在 ChatGPT 中上線了 AI 搜索;11 月中旬,百度則推出了一系列智能體應用,嘗試構建 AI 應用生态。
行業領頭羊的不同思考,得以讓外界一窺它們在大模型領域的共識和分歧。
共識在于,無論 OpenAI 還是百度,都在緻力于進一步消除幻覺,并努力提升商業化能力。百度創始人李彥宏甚至發出了 " 過去 24 個月,AI 行業的最大變化是大模型基本消除了幻覺 " 的感慨。
但放在當下節點,兩家公司對大模型應用的探索,更值得行業審視和思考。
OpenAI 的 AI 搜索功能一經上線,就被衆多一線用戶發現其搜索結果依然難逃幻覺困境。如何将大模型帶出幻覺陷阱?
作爲老牌搜索巨頭的百度,帶來了自己的新答案:借助 RAG(Retrieval-augmented Generation)解決了文字幻覺後,百度又盯上了圖像幻覺,并爲後者量身打造了一項獨門秘術—— iRAG(檢索增強文生圖技術,image based RAG),将百度搜索的億級圖片資源跟強大的基礎模型能力相結合,以此來确保生成的圖片更加真實,貼近自然。
更重要的是,唯有解決了大模型的幻覺問題,才能讓更多人願意并敢于用大模型技術。智能體,則成了百度撬動更多普通用戶觸及大模型技術的重磅應用方向。
相比 OpenAI 希望通過搜索持續增強自身變現能力,加碼智能體的百度,不僅自己賺錢,還想讓人人都能賺到錢,繼續構築 AI 應用生态," 我們不是要推出一個‘超級應用’,而是要不斷地幫助更多人、更多企業打造出數以百萬‘超級有用’的應用。" 李彥宏說道。
盡管全球幾乎所有大模型玩家都在關注智能體,但正如李彥宏所言,像百度這樣把智能體作爲最重要戰略方向的公司并不多。強如 OpenAI,也選擇了在今年 3 月份,關停僅運營兩個月的智能體應用商店 GPT Store。
在 ChatGPT 推出兩年來,時間曾屢次證明李彥宏的部分非共識,逐一衍化爲了行業新共識,如對檢索增強的率先重視、卷應用的倡議等。
這一次,高喊智能體會是 AI 應用最主流形态等非共識論斷的李彥宏,還能再次成功嗎?
經過兩年發展的大模型領域,正在轉換出一套新的評判标準:對大模型廠商的綜合實力打分,不再僅僅圍繞它出了多少論文、刷了多少排行榜,更加開始看重它是否能獲得規模化收入,何時能摸到盈利的門檻。
" 也許不是最便宜的赢得商戰,而是最能落地的赢得利潤。" 在今年上半年百度等一衆大模型廠商紛紛啓動大模型 " 價格戰 " 之際,Lepton AI 創始人兼 CEO 賈揚清便給出了自己的見解。在賈揚清看來," 降價是個拍腦袋就可以做的簡單策略,但是真正的 To B 商業成功更難。"
爲了加速商業化落地步伐,OpenAI 選擇了上馬 AI 搜索,擴展新的付費渠道。百度則選擇了平台生态策略:提供平台工具,搭建智能體生态,讓智能體開發人人可用,人人都能賺到錢。
百度世界 2024 大會上,李彥宏對外展示了四大智能體應用——公司類智能體、角色類智能體、工具類智能體、行業類智能體。
公司類智能體,就相當于 AI 時代的公司官網:傳統官網具有的公司介紹、産品圖片和參數展示、線下門店位置等能力,公司類智能體有;傳統網站沒有的主動推薦、及時響應和服務能力,公司智能體也有。
角色類智能體,則是一改往日數字人聲音、肢體動作、口型機械、呆闆的短闆,開始變得更加高度拟人化,簡單來說就是更像真人了。
工具類智能體方面,李彥宏着重介紹了百度文庫與百度網盤聯合發布的 " 自由畫布 ",在充分運用文庫與網盤的融合優勢基礎上,全面打通過去公域與私域資料的限制,實現輸入、編輯、創作、分享自由。
行業類智能體方面,目前已經在法律、醫療健康、金融、體育、旅行等諸多領域落地。作爲法律行業的智能體的法行寶,上線半年多以來,已累計免費服務 940 萬人。
爲了真正做到讓人人都能開發智能體,大會上,李彥宏還帶來了 One More Thing 時刻——對外展示了大模型技術落地的無代碼産品秒哒,号稱是一個不需要寫代碼就能夠實現任意想法的軟件,被李彥宏稱之爲 " 迄今爲止人類曆史上最複雜的多智能體協作工具 "。
智能體完成大模型從 " 言 " 到 " 行 " 能力突破的背後,離不開其基礎大模型能力的叠代進步。
具體到百度自身,早在 2019 年,百度就推出了 1 億參數規模的文心大模型 1.0 版本,随後又在 2.0 版本升級至 10 億參數,ChatGPT 發布後不久,百度就搶先推出了 3.0 版本,并在去年 10 月叠代到 4.0 版本。
近日,沙利文發布報告《2024 年全球 AI 生态全景概覽》,在全球 AI 生态全景中,百度與谷歌、OpenAI 位于 AI-Native Giant 同一象限。
在被問及百度爲何能以如此快的速度發布大模型時,李彥宏曾回答道," 是因爲我們準備得更加充足、工程師非常努力,我們一直在朝着這個方向努力。長期的信念,讓我們爲這樣的颠覆性創新做好了準備。"
能夠持續推動技術叠代的另一助力,則來自百度多年來對全球 AI 人才的招攬,包括吳恩達、Dario Amodei、Jim Fan 等一批行業大牛。
作爲前百度首席科學家,吳恩達在百度期間帶領百度人工智能團隊增長至 1300 多人,幫助百度培養出大量 AI 人才。
但技術叠代和頂尖人才招募背後都需要真金白銀打底,這都迫使身處大模型領域的廠商,必須盡快走向商業化。
那些實力不濟的大模型玩家,在這場燒錢遊戲中,或者被淘汰出局,或者被大廠收編。波形智能賣身 OPPO 的案例,成了這一殘酷競争的最新注腳。更早之前,明星創企 Inflection、Character.AI、AI Agent 獨角獸企業 Adept,紛紛迎來被大公司變相收購的命運。
商業化手段有限,疊加大模型訓練和推理費用高昂,入不敷出的國内部分頭部大模型玩家,此前甚至被傳出退出預訓練的消息。即便不想放棄預訓練,一些大模型玩家也開始轉變策略,開始放棄在國内燒錢做 To C 市場的策略,轉向全力發展更容易見到回頭錢的 ToB 領域。
競争激烈的大模型賽道,或主動或被動地演變爲一場超頭部創企和大廠之間的比拼。尤爲不容忽視的是,當其他玩家對預訓練有所畏懼之時,手握資源的超頭部創企和大廠,反而獲得了意料之外的優勢。
在近期接受一檔播客節目采訪時,OpenAI CEO 山姆 · 奧特曼就提道,模型已經成爲一項貶值資産是不争的事實," 但說它們不值得花那麽多錢來訓練,這似乎完全錯了。更不用說它們有一個正向複利效應。随着你越來越擅長訓練模型,你會變得更高效。至于通過模型獲得的收入,我認爲這足以證明投資是值得的。"
李彥宏此前也表露過類似的觀點。在他看來,模型之間的差距是多維度的,既包括能力方面,也包括成本方面,且 " 未來大模型之間的差距會越來越大,領先對手 6 個月就赢了。"
随着大模型逐漸進入巨頭遊戲階段,紅杉資本在《Generative AI's Act o1: The Agentic Reasoning Era Begins》 ( 生成式 AI 的 o1 行動:代理推理時代的開啓)報告中指出,生成式人工智能産業的根基正在穩定下來。隻有自造血能力充足,且資本雄厚的大玩家才能留在牌桌上。盡管市場競争還遠沒結束(按博弈論來講,甚至将越來越激烈),玩家格局卻越來越清晰起來。
基于此,紅杉資本預測,應用層正成爲風險投資的關注焦點。類比移動互聯網轉型和雲計算轉型期間,應用層大約都有 20 家公司創造了超過 10 億美元的收入," 我們預計 AI 轉型期也會出現同樣的情況。"
早于紅杉資本預言前,當 2023 年 3 月 16 日,百度終于趕在所有國内廠商前面,率先發布文心一言時,李彥宏就對外首度明确," 大模型時代,真正最大的機會既不在基礎服務,也不在行業服務,我覺得恰恰是在應用。"
從去年 3 月 16 日文心一言正式亮相至今,過去近 600 天時間内,李彥宏帶領百度成爲推動 AI 應用落地的最強有力聲音," 卷模型不如卷應用 "" 卷應用更有價值 " 等言論被頻頻提及。
從商業化變現的角度出發,卷應用,也是更能發揮中國創業者優勢的領域。這樣的實踐經驗,已經在 PC 時代和移動互聯網時代屢次被證實。
考驗和挑戰再一次擺到了基礎大模型廠商面前——誰能在應用生态建設上更勝一籌,誰就有望成爲下一個 Android。
在應用生态建設上,沒有移動互聯網超級應用傍身的 OpenAI,在今年 1 月上線 GPT store 後,很快便遭遇熱度難以爲繼的困境。
掌握搜索這一生成式 AI 最重要入口的百度,則在智能體的分發和運營上占據了一定優勢。
據字母榜(ID:wujicaijing)了解,百度搜索目前是智能體最大的分發入口,目前每天分發智能體數量超過 1000 萬,并且還在快速增長。
借助百度 APP 近 7 億月活用戶所帶來的規模效應,百度在幫助普通人開發出智能體之外,還構築起了一個覆蓋 " 開發 + 分發 + 運營 + 變現 " 的商業閉環。
爲了做好智能體應用的分發,百度還打通了智能體在百度搜索、小度、文小言、地圖、車機等多場景、多設備的流轉落地,從而在做到人人可開發的基礎上,更進一步實現人人能分發、人人可獲益的新目标。
值得一提的是,手握智能雲雲服務的百度,比 OpenAI 這類單純的大模型公司,還可以提供更多維度的服務。目前,百度智能雲千帆大模型平台幫助客戶精調模型數達到 3.3 萬個,并合計開發了 77 萬個企業應用,有六成以上的央國企和大量的民營企業,都在聯合百度智能雲進行 AI 創新。
大會期間,百度還展示了大模型在 B 端的應用。
以保險行業爲例,目前百度智能雲基于工作流 Agent 探索、落地車險續保售前數字員工。過去,車險續保的工作指導包含大量流程、子流程、文檔等内容,優秀銷售人員稀缺,且培養周期往往長達一到兩年。
基于工作流 Agent 開發金牌銷售數字員工,則最快可以在 1 小時内完成、上線,大幅提升了企業車險業務的核心生産力。這樣的工作流 Agent 可以快速集成到百度搜索、微信公衆号、企業官網等業務系統中,便利觸達用戶。
在剛剛結束的金九銀十招聘季,智聯招聘便聯手百度,利用後者的大模型重構了人崗匹配這個核心環節,從而顯著提高用人單位的招聘效率和質量。
目前,百度和智聯招聘合作,已經成功沉澱出一系列提示詞模闆,并在數萬條實際數據中得到驗證,場景平均準确率高達 93%。
同樣不容忽視的是,AI 業務還能間接拉動雲廠商的營收。B 端客戶在使用大模型的同時,會積累大量的業務數據,并産生大量資源需求,這都有利于推動智能雲(GPU)相關産品的銷售。
多樣化的分發場景,和更多用戶的使用,除了提升雲服務收入之外,更能起到幫助智能體獲得數據反饋,反過來進一步推動基礎模型自主調優,從而讓大模型變得更智能,并使得智能體越用越聰明的效果。
一如通過 RAG 消除大模型幻覺,刺激更多用戶使用一樣,隻有更聰明的智能體,才能吸引到更多的人真正使用起來。當用的人逐漸變多,李彥宏口中 " 智能體即将迎來爆發點 " 的判斷,才有望越早到來。