本文來自微信公衆号:王智遠,作者:王智遠,題圖來自:AI 生成
使用 AI 搜索時,我注意到一個問題:
不同 AI 搜索産品給出的答案數量參差不齊,有的比較簡單,一兩句話總結;有的比較複雜,結構化呈現 5~6 條,沒一個能用的。
這讓我好奇,AI 搜索結果,到底展示多少條合适?要不要結構化?多少條是人們接受的?帶着問題,我進行了測試和調研。
先說結論:最滿意 Kimi.AI 和知乎直答。爲什麽呢?
測試部分,我問 Kimi 探索版,AI 搜索應該顯示幾條内容?它搜索 39 個網頁後,給出的結論隻有 5 句話,即:
搜狗搜索每頁顯示 10 條結果,最多可以設置爲 100 條;百度搜索可以提供 10 條、20 條或 50 條内容,數量取決于用戶選擇。
必應則說自己有置頂框,會展示 AI 總結和相關鏈接。perplexity 隻呈現五六條結果;360 AI 是通過答案再提供 20 到 30 條信源鏈接。
從 Kimi 的回答結果看,搜狗、百度的結論是基于傳統搜索引擎,而必應、perplexity、360 可能是基于 AI 的。
帶着問題,我又問了騰訊的 ima.copilot,這是一個筆記軟件,能搜索所有公衆号内容;我說:AI 搜索應該顯示幾條内容?
它提到結果呈現方式取決于搜索目的、用戶需求、内容類型和 AI 算法性能;百度一般顯示 10 條結果,最多 100 條;Google 可以在 10 到 100 條之間顯示,根據用戶需求決定。
不過,它的答案的确很繁瑣,結構化了還很長,以上都是我幫它優化後的。
接着,我測試了知乎知答。答案很簡單,隻有 4 句話:
AI 搜索内容不固定,由算法根據用戶最有價值、最相關的結果決定;搜索引擎的目标是提供最相關的結果,數量從幾條到幾十條不等,同時考慮用戶體驗和多樣性。
比如:谷歌搜索可能顯示 10 條結果,并提供下一頁鏈接以浏覽更多内容;AI 搜索工具會挑選最重要、最合适的内容,關鍵在于質量而不是數量(這個例子是知乎直答答案中的)。
然後,我測試了文心一言,它給出 5 條結構化内容。
不同的是,它比較模棱兩可;它說,答案數量取決于用戶需求、搜索上下文、設備和界面、算法與性能以及用戶體驗,并且會根據這些因素動态調整。
微信的 AI 搜索自然也不能放過,它的 AI 在 " 搜一搜 " 裏,相對隐蔽。我測試了幾個問題,發現微信搜一搜的 AI 生成式答案相對簡單直接。
我搜索 " 王智遠是誰 " 時,結果顯示王智遠是個多才多藝的人,有多種身份,包括一級建造師、藝人和商業創作者,每個身份都有進一步的 5 點介紹。
綜上認爲,Kimi 的答案結構化,且簡潔有力;知乎知答則更爲直接,沒有列出具體條數,但直接給出了答案;相比之下,文心一言的回答與問題的相關性較弱,微信搜一搜則更注重直接陳述。
對比不難看出,AI 搜索給出的答案,大緻分爲兩類:
一,簡潔明确的;問題和答案匹配,不拖泥帶水,二,切題詳實的,AI 會圍繞答案展開很多讨論;這些讨論看似正确,實際上隻有一部分對用戶有幫助。
爲什麽會這樣?帶着好奇,我詢問了身邊兩位技術朋友:他們說,可以從問題理解、技術邏輯和使用體驗三個角度來看。
首先,使用 AI 搜索,不能指望它像人類一樣理解我們。
聊天時,我能知道你的過去、經驗和外貌,但 AI 做不到。AI 更像一個 " 缸中之腦 "(Brain in a Vat)。這個概念有點奇怪,就像一個人的大腦被放在裝滿營養液的缸裏,通過電腦來操縱,讓它感覺像人腦一樣。
實際上,AI 的模型像大腦,外部信息像營養液,我們給 AI 一個問題,它會在各種知識庫中搜索,然後整合信息找到答案。
因此,它對問題的理解是基于大量數據做出的平衡,平衡什麽呢?就是那些被大量點擊的,或者相對準确的信息,有些模型爲了準确性,自然會選擇呈現多一些内容。
其次,從技術角度來看,當你輸入一個問題後,AI 會捕捉這個問題,利用搜索引擎,比如 Google,或者一些第三方服務來尋找答案。
AI 會用一種叫 embedding 的技術來處理搜索結果,這個技術就像給結果排序和分類,讓它們更容易管理;最後,AI 會使用 RAG 技術,從衆多網頁中挑選出與你問題相關的信息,再通過一個大型模型整合這些信息,最終給出答案。
很多 AI 搜索産品不會自己建立搜索引擎,因爲成本太高了,爬取 5000 萬個網頁可能需要花費一兩百萬人民币,而且爬取的内容還需要進行安全檢查。
現在大型搜索引擎擁有的網頁數量是以千億計的,這是多年積累的結果,從時間和金錢來,一般創業者難以承擔。
所以,AI 搜索找到網頁内容後,會把它們按照段落、句子切成小塊,這樣處理更方便,那麽,很自然地如果問題很長,答案可能也會很詳細;如果問題很短,或者一個詞有多個解釋,它也可能給出很多相關的信息。
這就像找東西,一個詞能引出很多相關内容。
朋友還說,針對一個問題,AI 給的答案比較豐富,也取決于生成式(generative)和交互式(interactive)。
什麽意思呢?
AI 搜索系統本質上是一個問答系統,它的答案和傳統檢索方式有很大區别。
傳統檢索隻是把相關網頁展示出來,而生成式可能返回一個文檔或一組鏈接,這樣用戶可以直接獲取所有信息,不用再從多個來源中篩選總結。
這種技術有創造性,因爲它要理解你的語料後,再給出答案。所以,雖然有些内容可能我們不需要,但這些多餘的内容能增強人與 AI 的互動性。
比如說:
你問 " 如何提升工作效率?",AI 可能會先給你一個常見的幾條建議,比如設定清晰目标、合理分配時間等。
但它還可能進一步提到一些新工具或方法,類似于 " 你可以嘗試使用時間管理工具,如 Notion 或 Todoist,它們能幫助你更好地安排任務 ";這樣,你會因爲這些額外的信息對某個工具産生興趣,從而進行下一次的搜索。
問題是:我們真需要那麽多答案嗎?我從體驗角度做了樣本測試。
有些人說:用 AI 搜索時,喜歡先看到結論,再看過程,這樣能讓他們更快地找到想要的信息。
雖然 AI 能提供很多長文本,但并不是每個人都想要,就像一個知識淵博的人能講很多,但并不是所有内容我們都感興趣一樣。
你要不明白,就想象一下,在工作中,如果領導問你事情辦得怎麽樣,你先說一大堆過程,最後才說沒辦成,領導肯定不高興,相反,先告訴領導結果,再詳細說過程,這樣更好。
但也有人覺得,AI 搜索顯示的内容越多越好,因爲這樣可以學到更多知識,提高找信息的效率。
比如:我問一個問題,可能還沒完全想清楚,如果 AI 能展示很多内容,有些反而會激發我的好奇心,這種好奇心再次引導我探索更多不同的解決方法。
然而,實際情況是這樣嗎?
雖然曆史上沒有人專門研究 AI 搜索結果,但我查了一些關于傳統搜索引擎的用戶調研。
到了 2024 年,谷歌搜索的用戶調研顯示,排名第一的鏈接點擊率高達 39.8%,第二名是 18.7%,後面的點擊率會越來越低。這說明用戶更關注搜索結果頁面靠前的鏈接,越往下,關注度就越低 [ 1 ] 。
統計數據還顯示,75% 的用戶從不浏覽搜索結果第一頁之外的内容,隻有 0.78% 的用戶會點擊谷歌第二頁的結果。
而那些直接顯示答案的精選摘要(Featured Snippets),在 2018 年初的出現頻率約爲 12%,到 2020 年初增長到了約 16% [ 2 ] ;這意味着在搜索頁面上,直接展示答案可能減少了用戶對更多搜索結果頁面的需求。
換言之,用戶願意直接獲取答案,不想浏覽無關信息。
我也讀了谷歌核心工程師瑪麗莎 · 梅耶(Marissa Mayer)的一些用戶調研。她說:
很多用戶告訴她,他們希望每頁能看到盡可能多的結果,20 個不夠,25 個也不行,最好是 30 個;但當她觀察用戶的實際行爲時,發現了一個不同的趨勢:用戶其實更喜歡每頁顯示較少的結果。
當搜索結果數量在 10 到 20 之間時,用戶的點擊率會急劇下降。當每頁顯示 25 個結果時,點擊率下降得更多,而當每頁顯示 30 個結果時,情況最爲糟糕。
最後,梅耶決定每頁顯示 10 個搜索結果,這個決定也被谷歌一直沿用至今。
所以,這個結論是:用戶在 AI 搜索時,往往隻關注一個屏幕内的内容;如果這一屏的前面就能完整呈現結論,他們就能獲取所需要的結果,而後面的内容,對他們來說,可能就沒那麽相關了。
問題是,爲什麽人們說的話和實際行爲不一緻呢?我們總說想看到更多内容,但當 AI 搜索結果真的呈現大量内容時,卻不願意花時間去看?
經過長期使用 AI 搜索,我找到了答案:速度。很多人沒有意識到,大量搜索結果會幹擾我們的認知,影響體驗。
舉個例子:
我嘗試了 Kimi 和天工 AI 的探索版,當我問它們一個心理學研究的問題時,一個給了簡短有力的答案,并适當引導我去網頁查看更多。
另一個卻給了很多内容,要我先浏覽再點擊鏈接查看;相比之下,後者讓我感到選擇困難,甚至覺得大腦負擔加重,而前者的信息,讓我獲取得更直接、更方便。
紮克伯格在 Facebook 早期發展時,也遇到過類似情況。
當 Facebook 從哈佛擴展到耶魯和哥倫比亞大學時,學生們一開始表示懷疑,甚至有些嘲諷,盡管他們抱怨,但沒人真正删除信息或停止使用,反而使用頻率增加了。
紮克伯格得出結論:" 人們并不擅長預測自己對新事物的反應。"Facebook 的成功證明,用戶可能對新事物持懷疑态度,但最終會喜歡成爲其中的一部分。
很少有人能清楚表達自己的真實需求,尤其是在面對未知的新事物時,語言可能會騙人,但行動不會,因爲行動的代價比語言更大。
在産品開發中,我們常聽到一句話:" 不要聽别人說什麽,要看他們做什麽。" 這句話同樣适用于 AI 産品,用戶可能會說他們想要更多功能或選項,但他們的行爲表明,很多人更喜歡簡單快捷的解決方案。
所以,有兩個結論:
一,AI 搜索一開始不要展示太多内容,搜索引擎應該先直接給出答案,然後,逐步引導用戶探索,這樣更合适。
二,AI 越專業,答案越簡潔,長文本能力應該用在解釋過程上,而不是直接給答案。
你認爲是不是這樣?AI 搜索後,你期望看到幾條結論?
研究參考:
1.WSR 團隊 . ( 2024 ) . 30+ GOOGLE 搜索引擎統計數據和趨勢 [ 2024 年更新 ] .
2. 谷歌洞察 . ( 2024, March 8 ) . 用戶搜索行爲分析 .
本文來自微信公衆号:王智遠,作者:王智遠