對話 | 張鵬
編輯 | 連冉、鄭玄
大模型的出現,讓「搜索」正在迎來一場從技術底層開啓的變革。
國外谷歌、微軟已經有了動作,國内百度也早已開始行動。今年三月推出文心一言以來,百度已經圍繞搜索産品進行了多次升級,包括推出擁有多輪交互能力的 AI 夥伴;推出文心一言插件平台「靈境矩陣」;發布被 AI 重構的新産品「簡單搜索」等。
在 2023 百度世界大會上,百度搜索完成了進一步的升級。李彥宏現場宣布,升級後的百度搜索将擁有「極緻滿足」的生成能力——在搜索框裏輸入問題,搜索可以不再是給出鏈接,而是直接生成一個最好的答案。此外,百度搜索還将增加幫助用戶更好表達的「多輪交互」能力,和更能滿足用戶内容需求的「推薦激發」功能。
互聯網世界如何變化,「搜索」都是用戶剛需。其本質是,用戶永遠有主動對世界探索的需求。
而過去影響「搜索」的一個關鍵問題是「交付」——用戶不太會搜,或者搜完了不精準、不全面,需要反複輸入或打開鏈接才能得到答案。
這些問題由很多因素導緻,一部分是商業模式,但關鍵還在于搜索引擎自身的技術原理——過去的「搜索」不是用戶問搜索引擎,就給出一個答案,而是用戶問完,它給出一串最有可能包含答案的「鏈接」。這些鏈接可能是網頁、百科、文章或者短視頻,需要用戶一個個打開,然後判斷有沒有解答自己的問題。
而大模型和生成式 AI,至少會從三個層面改變「搜索」的邏輯:更精準地理解用戶的提問并給到回複,在更懂用戶的基礎上推薦更多更合适的内容,以及給用戶更多機會表達——這三個層面,也分别對應「新搜索」所強調的,極緻滿足、推薦激發和多輪交互。
這個邏輯本身不難推演,但要落地卻面臨很多現實問題。大模型的技術能力是否達到要求,新的搜索産品如何定義,是否需要構建一個新的商業模式來支撐,以及如何規劃一個清晰的路線圖,實現到「新搜索」的過渡。
帶着這些問題,百度世界大會期間,極客公園創始人張鵬和百度集團副總裁、搜索平台負責人肖陽進行了近兩個小時的交流。他們共同追溯了百度搜索演變的曆史,分析了大模型如何改變搜索體系,并探讨了大模型時代搜索的未來。
以下是對話全文。
01 搜索的持續進化
極客公園:百度内部是怎麽定義所謂的搜索層面的變革或者說重構?
肖陽:搜索内部這幾年都在發生巨大的重構,我們的系統每兩三年也要重構一次。技術的浪潮,有些是看得見的,更多是看不見的,ChatGPT 這次是公衆能看得見的浪潮,因爲它和自然語言的關聯很緊密,所以人們能理解這次變革意味着什麽。
但是過去也都有這種大的技術變革不斷發生,我們的系統也在發生相關變化。回顧起來,百度搜索曆史上有好幾次都是屬于重構性質的,比如框計算,深度語義匹配,深度問答……
随着技術的發展日新月異,我們肯定會很頻繁地繼續做這種深度重構。最近四、五年,每一年我都感覺搜索在做一個徹底的變革,而且速度越來越快,這會是一個永遠持續不斷的過程。
極客公園:3 月份文心大模型發布之後,搜索經曆了什麽樣的變化過程?大模型對搜索這個體系是怎麽産生影響的?
肖陽:實際上我們在 ChatGPT 發布之後,立刻就将生成式技術融合進搜索了。
在這個過程中,百度一直想聚焦的一件事就是讓用戶更自然地表達需求,一個是更精準,一個是更好消費。曆史上幾次代際變革也是朝這個方向走。
2009 年 Robin(注:李彥宏,下同)提出的框計算其實就是這個概念。那個時候,阿拉丁是 Robin 在全球最先提出來的概念,現在我們的阿拉丁覆蓋面,做得精細程度和投入的資源,都比包括谷歌在内的其他搜索引擎更好。
還有我們做的語義檢索、語義匹配。之前的對稱匹配技術,需要答案中帶有跟問題相同的關鍵字才能識别。2019 年 Transformer 成熟了以後,它能突破非對稱語義匹配的技術瓶頸。很多答案隻要是在回答問題,都能很好識别。我們很早就判斷出這個技術,能給搜索帶來很大提升,在這方面大規模應用是最早、最深、最廣的。
極客公園:你們是怎麽用大模型來解決「非對稱匹配」的問題?
肖陽:我們對搜索的要求是給到用戶精準性很高的回答,精準的同時還要豐富。
總之,用戶所需要的信息,最好是很精準的回答,同時也不要再說任何用戶不關心的問題,這樣對用戶的效率是最高的,這是我們「極緻滿足」一直在做的。
另一方面,搜索的阿拉丁有數千張卡片。這裏面接的各種數據都非常豐富,非常複雜。然而用戶在匹配阿拉丁的時候,需求是非常個性化的,有的人要看未來 15 天的天氣預報,有的人要看穿衣指數,有的人要看霧霾。
我們就在想技術上能不能做到個性化的組裝,個性化的回答。說實話,我們在技術上一直在努力,但總覺得缺那麽一點,也就是需要對知識内容進行理解,甚至有推理的需求。以前,我們在推理能力上是不足的,在數據匹配、産品樣式還有傳統意義上的語義向量模型,儲存學習模型上做了很多事,但總覺得拼圖裏缺少一塊。
看到大模型,我們覺得,這就是搜索整個拼圖裏最重要的一塊。它的記憶、推理、邏輯理解、内容生成能力,能讓我們把之前想在技術上做到的東西串起來。
說實話一開始想得很簡單,覺得我們的精準問答還有創作類的需求,應該立刻就能産生效果。但實際評估才發現,隻用這個模型效果是很差的。它要應用于整個搜索,還要克服很多困難,包括算力,和搜索技術的融合等等。但是我們依舊很興奮,很快就拿出方案去嘗試。
極客公園:你覺得 Robin 在做大模型技術核心方向判斷的時候,腦子裏是不是也因爲過去搜索裏的很多場景,很多問題,他在大模型上能看到答案,所以成爲了最早對這件事下決心的人。
肖陽:我覺得這兩件事本質上是一件事,就是能讓用戶表達得更多。
搜索框的出現,是一個很深刻的變化,讓用戶終于可以對機器去提需求。以前用戶提需求是通過點擊滑動的方式,搜索框讓用戶第一次用語言去提問。
現在看來,這個交互形态(搜索框)非常簡單,但背後的技術有代際提升意義。一是深刻地改變了用戶找内容的方式,還改變了内容生産的方式。再加上百度找到了一個很好的商業模式,讓網站也能賺到錢,所以整個内容供給生态就發生了深刻變化。
ChatGPT 出來以後,我們一看這個就是搜索要往前走的方向。它确實能夠很快速地把搜索原來 20 年的積累串在一起,并且點石成金,取得很好的效果。
02 搜索未來會不會是 Agent
極客公園:今天百度再去幹搜索,它的本質還是連接,還是會變成别的東西?
肖陽:搜索的理念早就不是連接了。百度以前強調服務的閉環,強調怎麽樣能夠實現端到端的滿足。用戶隻是給搜索框提了一個需求,我們就在考慮怎麽樣能使用戶滿意。這實際是一個用戶提出需求,機器如何把它對齊的過程。所有的産品都在往這個方向上走——機器如何 follow 人的需求。
極客公園:有沒有可能搜索未來就是一個 Agent?
肖陽:将來的重點一定是 AGI 在場景上的深度應用。光提 AGI 是沒有用的,就像我們通過九年義務教育,也還是得接着進行業,得成爲一個律師,成爲一個科學家,成爲一個互聯網大佬,在場景裏打透才行。所以它一定是一個 AGI 加上後面的一堆 Agent。
搜索被大模型賦能,但我們需要讓它更精準,更符合 AGI 帶來的機會。AGI 在這個場景裏深度應用,就會把我們過去這 20 多年的技術積累全都串起來,而且還會打開新的場景。
極客公園:新的場景是什麽?
肖陽:Robin 這次提搜索的代際變革是三部分,極緻滿足,推薦激發和多輪交互。它不一定和大模型本身直接相關。極緻滿足的目的是什麽,是營造一種信任感。也就是讓用戶對 APP 信任,對這個場景有認知和定位,願意在這上面花更多的時間。這裏的意思,不光是高效地滿足用戶的需求,還要能互動,讓用戶說出需求并得到滿足。
同時,百度的 DAU 應該比其他 APP 的 DAU 更有價值。因爲其他很多 APP 都是滑動、點擊,而用戶來百度至少需要輸入一個内容,表達一個需求,而且大家是長年累月地表達。所以,我們如果有大模型,就能夠更有内容,也更有可能做到推薦系統或激發系統的代際變革。
五六年來,推薦的場景沒有什麽太大的突破,大家已經習慣了。但百度的用戶行爲和我們對内容的理解,有可能讓我們在滿足用戶需求的同時,更好地去推薦内容。從這個維度,用戶場景的拓展是有可能的。原來我們做 Feed 的時候是拼接邏輯,也就是搜索框底下是 Feed。這種方式我們深耕了幾年,把時長提升了好幾倍。
再進一步,如果我們在場景上能夠更懂用戶,更懂内容,做更多的匹配和激發,這個過程中用戶對場景就會更信任,時長會再有數倍的提高。
還有,這裏的商業價值非常大。比如我們現在看到很多用戶的轉化,商家的轉化,中間都是斷層的。比如過去商家和用戶聊兩句就得要電話,中間還有各種優勝劣汰的機制,我們也沒法很好地去 build。但在這個商業模式下,如果你對平台很信任,整個轉化就能提高 10 倍。
這樣的話,我們到底是一個 Agent,還是一個回答問題的機器,還是一個助手,這些都不重要了。最重要的是,這個場景能不能讓用戶在我們這裏獲得很好的消費滿足。
極客公園:但這個場景百度、谷歌可以做,ChatGPT 或者其他原生 Agent 也在做。
肖陽:所有的産品都有一個邊界,如果太寬泛,沒有具體場景,大衆接受起來也有難度。但我覺得像搜索這樣的場景,用戶在解決問題的同時,還會有一些需求在這裏獲得滿足。
對比之下,ChatGPT 發展到一定程度會有一個瓶頸,就是它把自己定義得太廣泛了。如果它隻是一個對話工具,那麽用戶對話了之後到底想獲得什麽?是獲得情感的陪伴,獲得娛樂,還是解決問題,還是編輯、辦公?總該有一個邊界。其實這也和人類似,要是一個人說自己什麽都會,又是美術家又是科學家,可能别人反而不敢跟你聊了。
03「任何時候都不要抑制用戶的表達」
極客公園:在下一個階段裏,搜索和人的關系是不是又會面臨改變?
肖陽:對,搜索原來能幫助用戶一部分,現在基于信任能夠始終努力地幫助用戶。一個是能做到更了解,一個是能解決更多問題。同時,基于信任的推薦能讓用戶的生活更好,所以用戶就會在搜索上花更多時間。
其中的一個關鍵是,一直讓用戶表達。我有一次和 Robin 開會,他說「任何時候都不要抑制用戶的表達」,這是一條金律,是他的最高信條。我們做了很多動作,絕大部分都是想方設法降低用戶的表達門檻。
用戶怎麽能夠表達?一個是信任,一個是表達了真的有用。另外他表達後你要有反饋,要能更懂他才行,信任就是這麽建立起來的。你表達得更多,我們解決得更多,信任就越來越多。
而且,信任是真正的門檻。以前的搜索是沒有門檻的,用戶的遷移成本很低。我們的效果一旦高過别人 10%,就有馬太效應了。但隻要是犯錯誤了或者是繞彎子,做的效果不如别人了,甚至跟别人持平,用戶時長也會下降。
極客公園:過去可能用戶的表達裏面,有的一些是不準确的。那麽今天去看,搜索沒有對用戶抓取,反而對接下來赢得用戶的信任是非常重要的?
肖陽:搜索是一個老實孩子,可能沒有在推薦引擎的層面上趕上那一波最潮的東西,但老實孩子是有意義的,因爲它對用戶是公平的。
用戶會在百度搜索 AI 夥伴裏,進行很多輪的交流,詢問生活中方方面面的問題,就真的像跟一個夥伴聊天一樣。爲什麽他們能聊起來,就是因爲建立了信任和理解。
要重新從 0 到 1 構建這樣的信任,不基于搜索也是很難的。從回答來看,因爲技術還在發展,有的時候也不盡如人意,有的時候前後邏輯矛盾,但用戶對此是有寬容性的。很多用戶的反饋都是,支持你們,你們一定得做好。這就是因爲信任疊加了交互,用戶更加信任搜索。
極客公園:說到要得到用戶的信任,生成搜索結果肯定要準确才行,所以大模型的幻覺問題,我們解決得怎麽樣了?
肖陽:我覺得這個問題确實有技術難度。首先,我們技術上嘗試了很多創新,比如在溯源的可信度上、在大模型自己的邊界上,和一些數據任務的設計、模型訓練上都有努力。
但幻覺是個世界難題,我們不能說 100% 解決。搜索一直都是這個理念,能解決大部分或者更多的問題就可以。我們不追求 100% 地解決問題,因爲這是一個僞命題,不可能 100% 解決。
搜索依托自己優勢做的事情包括,第一,過往不管是通過框計算還是阿拉丁,我們連接了非常多合作夥伴的權威數據。這些本身足夠可信,足夠權威的數據,在一定程度上能解決特定領域下的一些幻覺問題。第二,我們的插件生态,也有一部分數據型的插件。這些專業、權威領域的數據型插件,也會幫大模型更好地在金融、法律、醫療、教育等垂直領域獲取到足夠優質的信息。在這個前提下,幻覺問題一定程度上是可以規避的。
其次,衡量大盤的效果一定要知道什麽是主要問題,什麽是次要問題。我覺得至少現在生成式技術重構後的搜索,在解決問題的方面比原來的搜索提升了很多效率。
所以,幻覺問題我們可能解決一部分,但是我們更多緻力于讓幻覺問題不要對自己造成問題。
極客公園:爲什麽會覺得多輪交互對下一代搜索引擎有更大價值?
肖陽:比如,如果一個養倉鼠的用戶一天問了 70 多輪倉鼠相關的問題。他可能是搜索的初學者,所以需要不斷換 query。但是換 query 的本質是,用戶覺得你不理解他。
以前的搜索是單輪(對話)基礎上的多輪(對話),是階段性的,需要用戶自己把回答組合起來,但現在可以用生成式模型直接串起來。
還有跨模态。百度很早就做視覺搜索,但之前沒有主動問用戶的能力。現在可以跨模态了,圖片可以識别成語義或者向量,用戶能對圖片發問,這麽一來用戶的表達門檻就降低了。
有些用戶拍一張圖,我們就能知道他的需求,但拍完以後他的需求更多,認爲要對這張圖要澄清,做提問,要根據這張圖獲取更多的信息。從這個角度來說,我們又有新的難題要解決,但這個是很必要的。去年我就說這是雙向奔赴,構建飛輪的過程。我們解決了一些問題以後,用戶就會有更多更難的問題,然而我們接着又解決了,最後構建了這種飛輪。
比如,在 AI 對話裏用戶可以發一張電路圖,問開關開的時候是什麽表現,A 燈泡亮不亮,B 燈泡亮不亮,以前這種問題沒法搜索,但現在你可以搜了,還可以多輪交互。
極客公園:你們其實是通過多輪交互能力的加持,在降低對人的自然語言能力要求。一方面AI要提升,但是用戶的出發點用戶的需求,你是控制不了的,隻能去适應,所以多輪交互某種程度感覺是對這個的一種适應?
肖陽:在大語言模型這次突破之前,我們就試圖讓用戶更自然地表達,我們在這方面是有追求的。不過這裏面稍微有一些差異,比如我那天聽說,現在大家還要挖空心思去看什麽樣的 prompt,能夠挖掘出大模型什麽樣的能力,這個其實是反人類的。人爲什麽要去适應大模型的需求?這樣的 prompt 其實就不是自然語言,而是僞代碼。
我們做了幾十年搜索,就是想把自然語言轉換成機器知道的東西,讓機器輸出能夠讓人自然理解的東西。現在有了大語言模型,我們能把這件事做得更好。
ChatGPT 發布之前,GPT4 已經訓練出來了,但用了不少時間做 Alignment(對齊),内部的反饋是說 Alignment 以後大模型的能力其實是降低了,因爲跟人要對齊。但是對齊到什麽程度?這個其實不是光靠大語言模型自己能解決的,是需要靠周邊的各種智能系統一起解決。而這個就是百度擅長的地方,反過來看 OpenAI,它沒有搜索基礎。
極客公園:這個觀點特别新銳。所以,Alignment 是要讓大模型自己限制自己的智商、表達能力和創造力去适配人,還是我們保留了它的一些東西但給它加框架,加一些能力,讓它再去形成表達?
肖陽:開始的時候我們覺得要有一個很好的生成式技術,但後來發現雖然生成式技術不斷在發展,但我們的工作是做更好的搜索。原來搜索是給人看的,現在是給大模型看的,這兩個任務是有差異的。給大模型看,我們能做更多的釋放。也就是我們能把原來想做的事更高效地完成,然後大模型再給人去做 Alignment。搜索本身擁有連接的能力,解決問題的能力,經過這麽多年的演化已經成爲一個強壯的身體。這個時候加一個大腦,它可以在很多層面幫用戶解決問題。
極客公園:這就變成了兩者的一個組合,就是腦和身體的組合,最後完成更好的動作和交付。
肖陽:用多輪交互降低人自然語言表達的難度,然後再加多模态,本質已經超越了自然語言。
搜索其實是最早用自然語言和機器做交互的起點,今天不斷地在降低人用自然語言的難度。甚至,它的終點都不是自然語言,而是你隻要給它任何東西,搜索就能夠通過多輪交流加多模态能力,更好地服務你,建立更強的信任。
如果信任是終極目标,這幾個技術棧都非常關鍵,這個拼圖也就越拼越緊。OpenAI 有一個很好的大腦。它的大腦不斷地在發展,但這不夠,它還要放開手腳。搜索和大腦,現在看起來可能是兩個場景,但将來越來越會是一件事,就像是有手有腳加上大腦,才是一個完整的人。整個智能系統完成的動作,會遠超出大家的想像。
多模态,目前在工業界實踐上,技術往往還是轉化成文字去解決的。但現在跨模态大模型也在訓練,這個技術突破也就是這幾年的事。人的決策信息 80% 的輸入來自于非語言的信号,現在抖音視頻推薦,也是利用視頻中的文本信号,比如 OCR 、ASR,通過字幕、聲音識别文字,或者周邊的文本信号去推薦的。而對視頻本身的理解,圖片本身的理解還在完善的過程中。一旦大模型在這點上有突破的話,又是一個代際變革。
04 新搜索的商業價值,會十倍、百倍提升
極客公園:靈境矩陣是咱們現在在主推的一塊業務。它的目标是什麽?對百度搜索意味着什麽?
肖陽:靈境矩陣的定位不是搜索的插件平台,是文心大模型的插件平台。我們一開始讨論它的目标的時候,就定位成要讓文心大模型更有價值,能解決更多問題。所以從這個角度來說,我們是在爲文心大模型安手和腳,而搜索是一個軀體。
這樣,大模型這個大腦才能适應各個行業的發展。大模型像是一個頭腦很成熟但還沒有入行的一個人,它把九年制義務教育都念完了,後面要考慮的就是怎麽拿着各種工具,用各種知識,穿着各種工服,進各種公司去解決産品上的問題。
爲什麽是搜索來承接這個功能?因爲搜索最有場景,搜索也已經有很成熟的商業模式。我們隻需要把這些商業模式拓展,它就能回饋文心,基本是這樣的過程。
這個過程說白了,就是讓這個平台更好用,讓文心大模型更符合國内開發者的需求。當然最重要的是把商業模式打通,解決開發者爲什麽要給文心大模型做插件的問題。
極客公園:所以其實是靠搜索來解決插件的商業模式問題嗎?
肖陽:初期是這樣的,因爲搜索更閉環,這是我們的優勢。
搜索相當于是一個 MBT(基于模型的測試),先讓它轉起來,讓各個場景都有一個比較成熟的模式,這樣的話我們所要做的就是繼續擴展,繼續探索怎麽樣能讓大模型更有價值。
極客公園:現在靈境矩陣,本質上是不是可以理解爲它成爲了百度小程序?未來要拉更多開發者到這個生态裏,并且建立一套新的利益分配機制?
肖陽:我覺得它能比小程序做得更多,因爲大模型能力更強。而且插件裏有一個數據飛輪概念,小程序還是功能和容器,那個時代的數據飛輪不像現在大語言模型時代這麽重要。
好的應用場景,都需要一個非常強的數據飛輪。比如 Midjourney 一下子給你四張圖,對它來講,給你一張圖,成本最低,給你四張圖,就是爲了獲得更多反饋,讓它越來越好。所以我們發現,這些開發者越先接入,在場景裏面越先應用好,數據飛輪就可以和文心大模型貫穿,這樣大模型也會越來越好,開發者自己的插件也會越來越好,飛輪會越轉越健康。
極客公園:公司内部對于這樣的一個技術和産品的架構,是有一個明确的規劃還是邊走邊看?
肖陽:有明确的規劃。最近也有人在争論需不需要有行業模型,比如金融行業做一個模型,這個模型要做私有化部署,同時規模要被控制。
這裏面存在悖論。目前業界普遍認爲 600 億以上的參數才能有智能湧現,才能更好地去接入這個行業,否則你解決的問題也許是以前的模型就能解決掉的。
最近有公司說,我處理一個發票,處理一個合同,也用大模型,但一個發票兩毛錢太貴了。我們五年前處理發票就是大模型了,兩毛錢足夠我們處理一大批發票了。所以我覺得大語言模型去解決問題一定要建立在智能湧現、建立在新的 AGI 的基礎上。它一定是一個插件,能讓一個人拿着工具去解決問題。
極客公園:如果我們順着這個角度去談,能感覺到百度搜索未來的整個商業模式,是不是也會面臨變化?
肖陽:這個商業模式肯定會發生很大的變化,但不意味着颠覆。第一個變化是用戶付費,這肯定是在大模型把信息變得更透明、把用戶理解更透徹了以後的商業模式。這樣的話,用戶就會爲更有價值的服務、更有價值的内容付費,這才是更本質的商業模式。
極客公園:不是爲工具付費,是爲服務付費。
肖陽:對,爲服務付費一方面有利于建立用戶的信任感,另一方面它是一個更好的、端到端的、優勝劣汰的方式。服務到底好不好,别老投廣告,拉出來是騾子是馬溜一溜,看有沒有人願意付費。而且我覺得對于百度這樣一個平台,是信息越對稱越掙錢,過去廣告系統的演進也已經證明了這一點。
信息越來越透明,越來越按效果付費,那麽平台的效率一定是高的。信息不對稱,對于大平台來說是消耗資源的。讓信息徹底對稱,對百度這樣的平台來說是一個機會,這樣一來用戶價值也高了,商業價值也高了,沒有人再因此受害了,所有人都得益于這個模式。
第二個變化,我覺得原有的廣告模式,也會因此有很大的提升空間。以前所謂的廣告匹配就像檢索一樣,現在在生成式技術的加持下,可以實現端到端的改造,整個轉換可以有大幅度提升。
還有 B 端也可以付費,比如我們給 B 端做 bot 、做品牌數字人,看到 B 端的付費意願也很強。B 端過去缺一個跟用戶直接溝通的載體,那麽大語言模型可以加持這部分。我們的數字人技術也積累了很多年,很成熟,這一塊會有 B 端品牌來付費。我覺得對于大語言模型來說,也不失爲一個好的模式。
極客公園:所以搜索未來有可能變成 B 端爲某個場景的解決方案付費,爲搜索能力來付費、爲搜索加大模型能力來付費的模式。
肖陽:是,我覺得端到端的轉化應該會有數倍甚至 10 倍以上的提升空間。
比如數字人,搜索業務因爲數字人而增加收入,這個在 B 端有很多案例。比如以前用戶用搜索,我們可能隻能給他一個冷冰冰的結果頁或是詳情頁,現在可以用數字人接過來。
原來廣告的轉化,可能客服聊兩句就要電話,效率很低。現在所有人都可以個性化地聊,聊到最後可能轉化到其他渠道,或者就地直接轉化成線索、直接到線下去了,整個轉化漏鬥會提升數倍,所以客戶會願意爲這個付費。
極客公園:B 端轉化率提升實際上是增長的核心點,甚至這個量比 C 端更大?
肖陽:更大,而且更确定。搜索本身也是百度的「1」,而這件事如果完成升級,它向上的釋放能力是很強大的。
在這個時代裏怎麽向上走,長期來看,用戶的信任帶來更大的時長,加上更好的轉化效果,這就是 10 再乘以 10,是存在百倍的空間的,這是我覺得搜索未來值得期待的那個點。
極客公園:大模型時代帶來的生産力提升,是不是能夠讓搜索實現原本的「不可能三角」,讓用戶、B 端以及平台實現三方平衡?
肖陽:我覺得是。大語言模型讓我們能夠和用戶離得更近,能讓用戶離 B 端也更近,叠代速度也更快,而且信息更透明。這樣的話,大家就能互相理解,這個商業模式實際上是更健康的商業模式。至于能不能帶來原來那麽多的收入,我覺得也是能的,因爲信任已經有了。
首先用戶信任本身就是價值,用戶信任提高了 10 倍,那麽商業價值就應該有 100 倍。長期來看,用戶信任提升了以後,更多的需求會被激發,更多的用戶也會來,平台的影響力也會更大。
商戶的營銷費用,總額就這麽多,營銷費用肯定往效率最高的地方走。
極客公園:再探讨一個更務實的問題,這背後成本上算得過賬來嗎?今天百度是否已經解決了大模型推理成本高的問題?
肖陽:這并不是很大的問題。首先第一點,像百度搜索這麽大的規模,一定會遇到這個問題,我們所要做的就是用現在這樣的成本,這樣的技術,把效率提高,去解決更多的問題。而且這個問題是所有公司都面臨的,沒有誰現在就解決這個問題,我不覺得這是百度競争裏面最關鍵的問題。
接下來,就看我們如何更高效地利用生成式的技術解決更多問題,這是我們擅長的,也是有經驗的。所以第二點,我們一定能比所有的競争對手在這方面做到更好,先比其他人好 10%,再提升 10%。這兩樣加起來不就是壁壘嗎?
經過觀察,我們的成本也略有增加,但整體幅度還好。到這個位置一定會面臨這個問題,隻要我們提前解決了,就比你好,就比你先知,就比你領先。