我們都知道,大模型必須誕生應用才有價值。那麽,哪種應用才能最快發揮出 AI 大模型的價值潛力,成爲大模型落地的第一站?提起這個問題,很多人會首先回答:搜索。
這一方面是因爲,在 ChatGPT 爆火之後," 大股東 " 微軟首先就将其能力融入到 Bing 搜索中,并且一度宣布要憑借大模型優勢,把行業老大哥谷歌挑落馬下。那麽在中國 AI 圈大規模複刻大模型的背景下,在應用側也自然會想到首先推進搜索 + 大模型。
另一方面,搜索引擎天然有着與 AI 深度結合的優勢。早在 2014、2015 年,百度和谷歌這些傳統搜索引擎巨頭就開始将深度學習、知識圖譜等 AI 技術融入搜索當中,以此提升搜索引擎對用戶指令的理解能力,增強搜索結果的内在關聯性。
由此可見,大模型 + 搜索,可謂是天時地利人和。經過近一年時間的探索,中國 AI 行業的大模型 + 搜索應用也逐漸豐富了起來。雖然大模型帶給搜索的改變并沒有徹底浮現出來,但已經形成了較爲多樣化的探索思路。
爲了能讓大家更生動了解大模型 + 搜索的目前進展,理解不同思路的差異化。我們想了一個比喻:大模型 + 搜索,就像一盤跳棋。各位選手手裏的棋子都是一樣的,即大模型技術與搜索技術。而他們的最終目标是一緻的,即孵化大模型時代的第一個爆款應用。
但在下棋的過程中,各自的棋路卻有不同。目前來看,它們分爲三個流派。
選手一
大模型作爲搜索引擎的增強插件
搜索,是互聯網時代人與信息之間最爲頻繁的接觸場景。搜索引擎既需要理解用戶意圖,也需要理解海量信息。作爲信息與人之間的樞紐,搜索引擎提升智能水平的需求是永無止境的。
而大模型爲搜索引擎帶來的差異在于,它不僅能夠加強傳統搜索引擎的體驗,還能夠通過 AIGC 模式帶來各種對用戶意圖與搜索結果的内容生成能力。
舉個例子,大模型不僅能夠提高搜索精準度,還可以把搜索出的多個結果合并生成到一個内容框裏,節省用戶時間。這相當于在傳統的搜索框架外,給用戶了一些額外的搜索工具。
基于這種思路,業界開始探索大模型 + 搜索的第一種模式:把大模型能力,當做搜索引擎的增強插件。在國内市場上,這個流派的代表是百度。
搜索業務,可以說是百度通過文心大模型能力進行産品改造的第一站。目前階段,百度已經在搜索引擎中添加了兩種基于 AIGC 能力的 " 增強插件 "。
首先,是在首條回答中進行信息聚合。
在 AI 技術與搜索結合的過程中,百度非常強調 " 首條搜索結果即滿足用戶需求 " 的理念。而大模型能力,可以将搜索結果進行關鍵信息的聚合,從而生成内容摘要。基于這種模式,百度在搜索引擎中更新了首條回答能力,其覆蓋範圍不僅是文字信息,還可以通過大模型對視頻進行理解從而歸納摘要。在這種模式下,加入用戶想要搜索的結果在視頻内容中,用戶就可以不再去觀看視頻,而是通過首條回答直接得到視頻内容的總結歸納。
百度公布的數據顯示,過去首條搜索滿足率隻有 40% 左右,而在加入大模型能力後,這一比率達到了 70%。可見大模型能力作爲搜索引擎插件,是收獲正向反饋的。
另一種 " 增強插件 " 式的大模型結合搜索,是在搜索欄之外專門提供一個 AI 對話欄,也就是百度搜索在今年 5 月移動生态大會上推出的 "AI 夥伴 " 能力。
AI 夥伴可以與用戶進行 AIGC 問答,幫助用戶在使用搜索引擎時完成諸如答案标記、提供信息來源、總結文檔概要等能力,同時還支持其他工具和服務的調用。
也就是說,百度在搜索引擎界面内,以及搜索引擎之外,都提供了基于大模型能力的 AIGC 插件,從而讓搜索引擎獲得多個角度的大模型重構。無獨有偶,這一思路與谷歌将 Bard 聊天機器人整合到搜索引擎中非常相似
可見具有搜索引擎傳統優勢的廠商,更傾向于将大模型作爲增強插件,多角度融入傳統搜索引擎這種 "1+1 大于 2" 的思路。
選手二
類 ChatGPT 的搜索應用
在增強傳統搜索引擎能力之外,大模型還帶來了另一個問題:是否有可能繞開傳統搜索形态,直接基于 AIGC 能力産生新的搜索産品?
在這種可能性上也出現了一些探索。ChatGPT 本身即具備語義理解、多輪問答、内容生成等能力,從某種程度上看,這也可以看作是一種 " 搜索 "。隻不過搜索的内容從關鍵詞變成了提問和需求,搜索結果從網頁變成了直接生成文字内容。
于是,中國 AI 行業中出現的一種新型搜索産品,可以被稱爲類 ChatGPT 搜索。其中具有代表性的 " 參賽選手 ",是昆侖萬維推出的天工 AI 搜索。
這種搜索引擎完全以 AIGC 作爲産品核心邏輯。用戶通過自然語言來表達需求意圖,随後搜索界面反饋出相關答案,而不再像傳統搜索引擎一樣展現大量網頁鏈接。
相對來看,天工 AI 搜索的一個創新點在于信源索引。在使用 ChatGPT 等 AIGC 平台時,我們經常會面臨一個問題,就是 AI 回答内容的不确定性。極多問題大模型都無法給出正确答案,甚至會胡亂編造論據、文獻出處、新聞源等,也就是廣受吐槽的 "AI 一本正經地胡說八道 "。
而天工 AI 搜索則強調了生成答案的同時給出參考信息源,從而确保用戶能夠追溯信息的可參考性,極大規避了 AIGC 平台的信任難題。并且其參考信息源也相對豐富,包含了新聞網站、知識問答平台、視頻等。
但在目前階段,類 ChatGPT 搜索與 AIGC 平台的界限還難以區分,用戶對其認知還不明确。這種模式有待于進一步的市場普及與用戶檢驗。
選手三
大模型落地垂類搜索
在搜索引擎格局相對穩定之後,曾經出現過這樣一種産業思路:通用搜索機會不大之後,搜索引擎可以在垂直搜索領域發力,從而夯實對該領域有持續搜索需求的用戶群。搜狗搜索、誇克,都曾經在垂直搜索領域發力。其中誇克憑借垂直搜索能力,在年輕用戶群中獲得了不錯的成績。
大模型 + 搜索的第三種思路,是将大模型率先落地在垂直搜索當中。以此強化具體搜索領域的自然語言理解能力與信息檢索體驗。在這個領域,目前的代表選手是誇克。11 月 14 日,阿裏巴巴智能信息事業群發布了誇克大模型。立足于自身的差異化定位,誇克大模型應用會優先落地在專業搜索等信息服務領域。而除了基礎的大語言模型之外,誇克大模型還将衍生出醫療、教育等垂類模型,可見誇克對專用知識領域的重視程度。
目前來看,醫療、教育、人文社科,是大模型落地垂直搜索的幾個主要方向。這幾個方向都對信息源有着極強的要求,并且存在關鍵詞模糊、有效信息較少、邏輯性較強等特點,相比于通用類搜索來說,更加适合大模型發揮出自己的特性。同時,優先将大模型與垂直搜索進行結合,也可以很好地降低産品成本,提升大模型的應用于搜索領域的整體效率。
事實上,還有一種垂類搜索與大模型結合的變體,就是各家網盤目前都在上線具備自然語言理解能力的搜索功能。可以通過模糊描述、形容詞等關鍵信息來檢索網盤資料,尤其是對圖片、視頻等内容進行搜索。
都是超級應用的跳闆
那麽問題來了,到底哪種模式才是大模型 + 搜索的正确解答呢?
不好意思,答案隻能是虛席以待。
大模型 + 搜索,是一個在邏輯上非常具有前景的大模型落地場景。因此在 ChatGPT 剛剛開始爆火後,微軟就将大模型能力打造爲 BingChat,并對谷歌搜索放出了諸多狠話。但時間過去了快一年,微軟已經将很多 AI 能力剝離出了搜索業務,而谷歌的市場霸主地位也沒有受到什麽影響。可見這一場景從理論到實踐,還有不斷的路要走。
回望國内市場,會發現三種探索模式還各自爲戰,并沒有産生太多交鋒,在用戶側也沒有掀起對大模型 + 搜索的普遍認知,甚至其落地程度遠不如類 ChatGPT 的對話應用本身。究其原因,可以發現三點:
1. 這三種大模型 + 搜索的嘗試,都沒有完成産品形态從 0 到 1 的突破。而生在此前的搜索引擎、AI 對話産品上進行加強和補完,因此不具備非常引人關注的産品爆發點。
2. 目前階段,大模型對搜索體驗的提升在大衆用戶端體驗感不強。其更多隻能作爲學術、IT 等領域的專業工具。
3. 除此之外,大模型 + 搜索的商業化空間并不明晰。加入大模型技術之後,搜索産品的商業模式與商業化水平都沒有發生較大的變化,因此受到資本市場的關注不足。
長遠來看,大模型 + 搜索的最終目标,一定是形成大模型時代的超級應用。如同互聯網時代搜索引擎的出現一樣,徹底改變人們的信息獲取與交互模式。
而如果以此爲目标,今天的大模型 + 搜索探索必然還是棋子行進路上的跳闆。也隻有讓棋子持續跳下去,未來某個節點才可能發生質變。
隻要能讓大模型和搜索互爲動力,持續跳向前方,那麽前景中的光明依然遠大于黑暗。