圖片來源 @視覺中國
文 | 解碼 Decode
OpenAI 推出 ChatGPT 兩個月後,百度終于要下場了。即便還在傳言階段,資本仍然直接給了一波 13% 的大漲。
搜索引擎對 ChatGPT 的反應無疑是最受關注的。
在此之前,微軟被曝或是第一個将 ChatGPT 引入搜索引擎的巨頭,并且宣布增持 OpenAI,谷歌也通過「Red code」的方式拉響警報,圍繞 ChatGPT 全面調整 2023 年在 AI 領域的工作。
姗姗來遲的百度,雖然官方三緘其口,但投資者們更傾向于相信這一消息,這表明投資者們認可百度研發 ChatGPT 的合理性,并且對百度版 ChatGPT 抱有期待。
而有關百度版 ChatGPT 的迷霧,正是本文嘗試探讨的:百度做不做、怎麼做以及為什麼做?
做不做?
去年年底,李彥宏曾在内部直播中做過一個分享,認為 AIGC(AI 生成内容)和 ChatGPT 這些都是 AI 技術發展到一定地步後産生的新機會。但至于它會變成什麼樣的産品,又能滿足什麼樣的需求,還有很多的不确定性。
不過話鋒一轉,李彥宏又堅定的表态:這個事情很難,但百度必須要做。
而百度必須要做的理由,來自這兩個方面:
一方面,微軟、谷歌已經動作在前,尤其是後者。1 月初,谷歌的子公司 DeepMind 就推出了用以抗衡 ChatGPT 的 Sparrow,并且還在加速布局生成式 AI,包括文字生成 AI 模型 Wordcraft、AI 繪畫模型 Imagen、視頻生成工具 Imagen Video,以及在 1 月 27 日發布的音樂 AI 模型 MusicLM;
另一方面,ChatGPT 的确是搜索引擎的威脅。
摩根士丹利在去年 12 月的一份研報中直截了當的表示:語言模型可以繼續獲得用戶,并從搜索查詢中獲得份額,并破壞谷歌作為互聯網用戶入口的地位。
一個不算好的消息是,ChatGPT 上線 5 天就完成了 100 萬用戶的積累。而據 Similarweb 監測,到 1 月份 ChatGPT 平均每天的獨立訪問者已超過 1300 萬,甚至瑞士跨國投行瑞銀集團(UBS)周三發布的一份研究報告顯示,ChatGPT 在今年 1 月份的月活躍用戶數估計已達 1 億,成為史上增長最快的消費者應用。
相比之下,達到 1 億月活躍用戶數,TikTok 花了大約 9 個月的時間,Instagram 花了兩年半。
這意味着,搜索引擎迎來了自誕生起最強大的潛在敵人。
相比傳統的搜索引擎根據用戶提問,從而提供數千萬個相關鍊接索引,ChatGPT 的優勢在于,直接提供自己搜索和信息綜合的單一答案,讓用戶省去反複點擊鍊接找尋答案的複雜度。
據 The Information 報道,微軟 Bing 引入 ChatGPT 後,這些 AI 支持的答案可能會以包含信息來源的完整句子的形式呈現,而不是引用可能解決用戶提出的問題來源或者鍊接列表的精選片段。也就是說,ChatGPT 能夠輕易碾壓搜索引擎的「首條滿足率」。
但是,對于 ChatGPT 颠覆搜索引擎的說法并沒有得到廣泛認可。主要是 ChatGPT 在搜索領域的應用仍具有幾大懸而未決的掣肘:
1)真實性無法保證。在學術、科研等嚴謹的應用場景中,ChatGPT 提供的答案并不一定都正确。由于 ChatGPT 隻提供純文本,不引用實際網站,目前并沒有辦法從 ChatGPT 的輸出中分辨真僞。
2)信息的實時性難以保證。搜索引擎的索引可以實時更新,更為方便快捷,但對于大型語言模型而言,添加新的内容需要重新訓練模型,耗時且成本昂貴。
比如,GPT-3 就需要 1500 萬美金和 1750 億參數,由于沒有可以适合該模型的單個硬件,因此必須将其分解并分布在多個處理器上,例如 A100GPU。設置和并行化這些處理器以訓練和運行模型既是技術挑戰,也是财務挑戰。
3)商業模式問題。此前,根據 TechCrunch 估計,擁有 100 萬用戶的 ChatGPT 每天就要花費 10 萬美元,若應用于 Bing 後經曆高頻度的搜索查詢,商業運營成本極高。
最新的消息是,OpenAI 發布了 ChatGPT 的試點訂閱計劃,訂閱者以 20 美元 / 月的價格即可獲得比免費版本更穩定、更快的服務,及嘗試新功能和優化的優先權。
怎麼做?
盡管百度對推出類 ChatGPT 産品的消息不做回應,但在多家媒體的詳細爆料和資本的狂歡中,似乎已經是闆上釘釘的事實。
爆料稱,該項目在百度内部由搜索(MEG)和技術中台(TPG)團隊牽頭,呈現形式将會是生成式搜索,也就是将搜索和 ChatGPT 結合。
生成式搜索是百度2019 年就發布的一項服務,其具體形式類似 ChatGPT,比如「北京 GDP 和上海 GDP 誰高」的問題,百度會直接給出答案,相當于省去了用戶分别搜索再自行計算的步驟。
今年 1 月初,百度搜索傑出架構師辜斯缪曾在一次小範圍的媒體溝通會上透露,百度預計在 3 月會做一個比較大的升級,同時今年百度搜索在技術上最重要的工作就是要把整個檢索系統變成檢索 + 生成雙模系統。
如今根據媒體的爆料信息,預計百度版 ChatGPT 大概率将會是這種形式。
生成式搜索可以看作是生成式 AI 的一個版本(ChatGPT 就是生成式 AI 的一種),而後者被認為是搜索引擎的未來:不僅僅是索引網頁與鍊接,而是為每一個查詢生成相應的摘要、回答。
用生成式搜索來回應 ChatGPT,似乎是中美兩大搜索巨頭不約而同的選擇。這種看似戰略防禦做法的背後,也有搜索引擎無法回避的苦衷。
雖然 ChatGPT 組織信息的方式更加簡練,能夠幫助整合信息、梳理段落要點,但當前搜索引擎給出的鍊接往往更加全面,因此使用方面 ChatGPT 并不具備壓倒性的替代優勢。
并且,從 ChatGPT 本身來說,像百度、谷歌這樣的大公司要為數億甚至數十億用戶提供高可靠性的搜索服務,不能僅僅因為一個東西似乎會成為未來,因為人人都為之瘋狂,就把一個不可信的、未經嚴格測試的新技術嵌入進來。
就像谷歌其實在 2021 年 5 月就展示了人工智能系統 LaMDA,嘗試用聊天機器人的技術來增強搜索引擎的使用體驗。
但直到現在谷歌仍不願向公衆發布 LaMDA。部分原因在于,LaMDA 存在較高的誤差,且容易對用戶造成傷害,這也是 ChatGPT 類人工智能的通病。
而生成式 AI 對搜索引擎最大的威脅還不是來自技術不完善,而是對搜索引擎盈利模式的威脅。
一旦引入生成式 AI 搜索引擎,用戶就會減少在鍊接間跳轉、浏覽的時間,也就減少了廣告投放的空間,這會使搜索引擎的盈利模式發生根本性的變化。
以廣告為主要收入的搜索引擎自然要謹慎。2022 年前三季度,廣告營收占谷歌總收入的 80%。百度也同樣如此,據其 2022 年 Q3 财報,廣告占百度當季營收的 57.4%。
換言之,即便是百度将 ChatGPT 嵌入到搜索,其服務範圍也一定是謹慎的有選擇性的,更多是類似「秦始皇和漢尼拔誰年紀大」這種封閉式問題。
為什麼做?
OpenAI 在 2019 年拿了微軟的 10 億美金投資,代價是隻能使用微軟的雲計算服務。當然這并非是微軟的強盜邏輯,而是 OpenAI 确有苦衷。
小公司根本承擔不起數千億數據的喂養以及大算力芯片的消耗,以 Stable Diffusion 為例,它在 4000 台 A100 顯卡集群上訓練了一個月時間、學習了近 59 億條圖片數據才真正開發出來。
而通過 Azure OpenAI 服務,開發者可以直接在微軟雲上訪問 OpenAI 的大模型,并根據特定業務場景進行部署和微調,以較低的成本開發出 AI 應用。同時,支持 OpenAI 也就成為微軟試圖擴大雲計算市場份額的有效手段。
百度去年 12 月發布的「AI 大底座」,從 IaaS 層到 PaaS 層,為企業模型開發的全生命周期提供完整解決方案。名稱雖然不同,但内核同微軟沒什麼區别。都是給開發者降本增效,同時借勢提升自己的市場份額。
按照這個技術複利的進度和未來 AI 應用的浪潮,百度雲是有機會再改一改排名的。
對于百度而言,ChatGPT 的另一個價值在于推動 AIGC 發展。
相比 PGC、UGC,AIGC(AI Generated Content,AI 生産内容,例如 GPT 系列)具有效率和成本上的優勢:
– AIGC 效率更高:截止 2021 年 3 月,推出 9 個月後的 GPT-3 日均文本生成量 45 億,而 2021 年閱文集團新增文字量僅 360 億,僅相當于 8 天 GPT-3 的文字内容生成量;
– AIGC 成本更低:目前 OpenAI 定價最高的文字模型達芬奇(基于 GPT-3)為每 750 詞約 0.02 美元,2021 年閱文集團内容成本為 17.74 億元(每 750 詞約 37 元),是調用 OpenAI 的 API 完成相同文字量生産所需的成本(約 672 萬元)的 264 倍。
理想狀況下,如果閱文集團将 2021 年全年 360 億的文字内容生産量交給 GPT-3,耗時 8 天即可完成,節約成本 99%+,毛利率空間幾乎 100% 釋放。
雖然目前 ChatGPT 隻有文本形式,但也有望在相關産業落地,比如有海量文本創造需求的網文平台、新聞平台等,可以借助 ChatGPT 完成内容快速、低成本地擴增;教育及科研工具類平台也可以借助 ChatGPT 實現定制化、拟人化的教學和輔助,如智能問答、智能批閱、輔導資料智能撰寫等。
尾聲
ChatGPT 推出的那一天,Twitter 上有個叫 josh 的用戶馬上就說:" 谷歌完蛋了。" 馬斯克也在幾天後發推稱,ChatGPT 好的驚人,我們離強的可怕的 AI 不遠了。
但對于大洋彼岸的我們而言,ChatGPT 對搜索引擎有沒有威脅暫且不論,重要的還是應該先有。所以當 ChatGPT 發布後,人們就在期待百度何時跟進。
所以不論百度版 ChatGPT 有沒有新花樣,隻要發布就已經是一種勝利了。
參考資料:
[ 1 ] ChatGPT 是否是 AI 的革命?國盛證券
[ 2 ] ChatGPT- 真格基金分享,真格基金
[ 3 ] ChatGPT:又一個 " 人形機器人 " 主題,東吳證券
[ 4 ] 計算機行業專題報告:ChatGPT:開啟 AI 新紀元,财通證券
[ 5 ] ChatGPT 要和搜索引擎搶飯碗?科技雲報道
[ 6 ] 微軟 vs 谷歌:語言模型會不會壓倒搜索引擎?36 氪
[ 7 ] 微軟的 AI 革命:一場深入業務底層的豪賭,虎嗅
[ 8 ] 百度将推出類似 ChatGPT 服務?财經十一人
[ 9 ] ChatGPT: What is it? Why it Matters? Is it a GoogleThreat...and Broader Industry Implications,摩根士丹利
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App