誰能最先用 AI 颠覆搜索,至今還懸而未決。
年初,在體驗當下幾款熱門的 AI 搜索引擎後,我和同事都一緻認爲,即便百度、Google 等搜索引擎巨頭被群狼環視,但還是難以被撼動。
最近發布的 Kimi 探索版帶來了很大的驚喜。相比于 AI 搜索更懂人類,我們更希望 AI 搜索引擎能夠一步到位,最好就是成爲一個帶腦子的人類。
先來一劑預防針,目前 Kimi 探索版并未向所有用戶開放。
昨天,在探索版上線之後,「Kimi 崩了」這一詞條也迅速登上了熱搜。不過,Kimi 官方也說了,預計将于下周一向所有用戶全量開放,好飯不怕晚,不妨再耐心等待一下。
在這之前,我先行一步,替各位小夥伴嘗嘗鮮。
附上 Kimi 探索版的亮點總結:
搜索調研是核心功能,值得上手體驗
搜索量是普通版的 10 倍,可精讀超過 500 個網頁
能即時反思,補充更多信息提供用戶決策
每天 5 次機會,滿足用戶日常基本需求
啓用方式簡單,預計下周一全量推送
Kimi 搜索版的最強大腦,專治複雜問題
肉眼可見,在熟悉的搜索框裏敲上「/」,亦或者啓用「探索版」按鈕,即可觸發 Kimi 探索版。
普通用戶每天隻有 5 次機會,盡管談不上量大管飽,但足以滿足用戶的日常需求。你看,它也給出了一種另類的解釋——
「根據多項研究,正常人每天使用搜索引擎的次數大約爲 4 次。」
讓我們先給 Kimi 探索版做個熱身運動。
今年的諾貝爾獎幾乎被 AI 包圓了,我試着讓 Kimi 列出諾貝爾物理學獎和化學獎得主的共同點,提出問題後,我就直接當甩手掌櫃,坐等結果。
Kimi 在回答問題前,會利用模型能力識别用戶的真實意圖,将問題轉化爲搜索關鍵詞,并根據前一步的搜索結果實時生成下一步的關鍵詞,甚至使用不同語言進行搜索。
比如在 92 個網頁的搜索中,這個問題就分解成了兩個環節。
Kimi 先是搜索定位到兩位得主,然後再檢索出獲獎的共同點。據官方介紹,在這個過程中,Kimi 探索版能夠并行搜索多個關鍵詞,訪問和篩選大量權威信息源,迅速獲取回答問題所需的背景信息。
與傳統慢悠悠的串行搜索方式相比,二者的效率差距簡直是天壤之别。
▲左爲 Kimi 普通版答案,右爲 Kimi 探索版答案
如果将同一個問題分别輸入到普通版和探索版,你會發現兩者之間的差異更加明顯。
普通版大概會吐出一堆看似詳細但信息量堪堪夠用的大雜燴,而探索版不僅信息量充足,而且答案結構化,條理清晰。
所以說,AI 多介入一步,人類就多一分歡喜。
這裏還有個小技巧,你可以在搜索過程點擊關鍵詞,右側來源頁面将自動篩選并跳轉到相關網頁。
▲點擊關鍵詞,注意看右側頁面
此外,Kimi 探索版網頁搜索的信源要更詳細,質量更高,同時更貼近用戶所使用的語言環境。我試着同一個問題用英文搜索,所引用的信源也更貼近英文環境。
▲同一問題,左爲中文提問,右爲英文提問
我們都知道,任何 AI 都有可能成爲說謊慣犯。
反其道而行之,如果我們一開始就提供錯誤信息,Kimi 探索版會落入我們的陷阱嗎?
比如我們輸入「在清代羅貫中所寫的《西遊記》中,爲何菩提祖師敲孫悟空三下頭?」好在,Kimi 經受了考驗,先澄清了錯誤事項,然後對菩提祖師的行爲作出了一番解釋。
除了考究答案的正确與否,那 Kimi 探索版的時效性如何?
最近股市火熱,我們問它最近 A 股市場的漲跌情況如何,并讓它給出一些投資建議,它很快給出了股市全景圖,并且投資建議也相當到位。
當然,股市有風險,投資需謹慎的免責聲明也沒落下。
「假設我從今年初開始定投黃金 ETF,與同期定投标普 500 指數相比,哪個投資策略的回報率更高?請制作一個對比表格。」
昨天發布的特斯拉「賽博的士」Cybercab 還很熱乎,我用英文提問 Cybercab 和夢碎的蘋果夢碎的汽車項目有哪些不同,也沒能難倒 Kimi。
所有的問題都有答案。
既然 Kimi 探索版擅長拆解用戶的問題,那它能否智鬥弱智吧難題?
怎麽理解「說明書是書,書是人類進步的階梯,說明書是人類進步的階梯」
既然快遞要 3 天才到,爲什麽不把所有的快遞都提前 3 天發?
實測發現,雖然 Kimi 探索版能夠理解拆分複雜問題,但還是一闆一眼地遵循搜索環節,依靠海量知識來解答疑惑。
簡言之,一寸長,一寸強。和 OpenAI o1 有所不同,「搜索調研」是 Kimi 探索版的核心所在,因此,将其放在推理、思考解題邏輯等場景中可能不太合适。
專業的搜索,交給專業的 AI
專業人做專業事,把搜索交給 AI 也是類似的道理。
據悉,Kimi 探索版的搜索量是普通版的 10 倍,一次搜索即可精讀超過 500 個頁面。
官方表示,Kimi 的性能評估團隊結合 1000 多個來自用戶的真實長難問題,對比了國内所有的主流 AI 助手和搜索類産品,包括付費和專業版本,Kimi 探索版綜合性能超過同類産品至少 30%。
Kimi 探索版産品負責人表示:
如果 Kimi 搜不到的信息,那大概率用戶也很難自己通過傳統搜索引擎找到。未來搜索引擎會成爲 AI 更擅長調用的工具,人隻需要專注于提出好的問題,AI 就可以結合模型本身的能力在龐大的互聯網中自主海量搜索,不斷反思叠代,更精準地定位所需答案。
官方的自信溢出屏幕,但體驗下來, Kimi 探索版的實力的确讓人刮目相看。
「甄嬛的生日和薛寶钗的生日相差幾天?」
面對這種刁鑽難題,普通 AI 搜索引擎要麽打太極,稱缺乏具體資料,要麽就算清楚列出了兩者的生日,也懶得動腦筋計算。
還好,Kimi 探索版沒染上這樣的毛病,撸起袖子就給出了運算答案。
運算再複雜些,我們嘗試複現官方給出的一些案例。
「如果所有的鋼琴都定期調律,估算一下北京需要多少名全職的鋼琴調律師?」
我承認,一開始我被這密密麻麻的答案唬住了,但接着我連續問了 3 遍,得到的答案分别爲 1005、1050 和 1200。爲什麽會有所變化?
破案了,Kimi 探索版能夠像人類一樣反思搜索結果,提升回答質量。
面對信息的缺失或數據的沖突,它不會坐視不管,而是會主動出擊,搜尋并補充更多維度的信息,爲用戶提供一個全面而多角度的視野,以便做出更加明智的決策。
比如在第二遍時,Kimi 探索版又搜索了 13 個關鍵詞,閱讀了 45 個網頁,最後給出了 1050 答案。當然,建議在提問時,你的問題寫得越詳細越好。
再給 Kimi 探索版上點強度。
讓它查查 9 月上海迪士尼的排隊時間,還要做成表格,再設計一條最省時間的遊玩路線,看完答案的我,突然腦子裏蹦出一個場景。
如果用 Kimi 探索版規劃出行路線,再查閱景點知識,四舍五入,這豈不是把真人導遊的工作都給搶了。
别急,強度還不夠,讓我們再來看看兩個實測的案例。
每個愛看武俠小說的人,都對「飛雪連天射白鹿,笑書神俠倚碧鴛」這句話早已爛熟于心,但若真要較真,用 C++ 來統計金庸筆下所有武俠小說書名中,哪個字的出現頻率最高呢?
答案是俠。俠之大者,爲國爲民,俠之小者,爲友爲鄰。
「假設 2023 年全球的物流需求都通過無人機配送來完成,需要多少架無人機,這些無人機的總飛行距離相當于多少個地球到月球的距離?」
現在答案有了,這大約需要 5479 萬架無人機,相當于約 520 萬次地球到月球的距離。
想象一下,地上的汽車排成長龍,動彈不得,司機無奈擡頭看向天空,5479 萬架嗡嗡作響的無人機也在空中交通大堵塞。
實際上,在随時随地搜索的互聯網時代,我們似乎已經淡忘了,搜索其實是一門技術活。
在哪個知識被精心記錄在羊皮紙、泥闆、竹簡等載體的時代上,而學者們在查找信息時,也未必能對所需的資料的存放處了如指掌。
随着「圖書館」的進一步普及,圖書管理員的地位也跟着水漲船高。
他們的職責不僅限于書籍的保管,還包括分類、編目、修複和借閱管理。并且,他們還承擔着信息傳播的使命,通過編纂目錄和編寫指南,幫助讀者更有效地利用圖書館資源。
再後來,20 世紀末,互聯網引發了信息大爆炸。傳統信息檢索方法已經無法跟上人類的節奏,因此,充當救星的搜索引擎應運而生。
這一系列的技術革新,其實就是把專業搜索的權力,進一步下放給我們這些普通人。
我們和答案之間的距離正在一點點縮短,檢索效率也一點點提高。
在今天,許多簡單的搜索行爲已經不成問題。
然而,标題黨和眼球經濟不可避免地帶來了誤解、忽略和信息失真。并且在 AI 的推波助瀾下,我們不得不面對「垃圾進,垃圾出」的内容農場困境。
而且,大多數 AI 搜索引擎提供的高級搜索,不過是把一堆長答案拼湊在一起。看起來信息量滿滿,實則空洞無物。AI 偷懶拼湊答案,反而讓我們浪費了更多時間。
如果将信息搜尋過程比喻爲動物在自然環境中尋找食物,那麽 Kimi 探索版通過優化搜索結果的相關性和質量,也就是在減少用戶的「覓食成本」。
這也是《定位》理論創始人傑克 · 特勞特所強調:
「Complexity is sold to the experts, simplicity is sold to the masses. 複雜性賣給了專家,簡單性賣給了大衆。」
想想看,在智能手機普及之前,專業攝影得有昂貴的設備和深厚的攝影知識。用戶常常需要學習如何調整快門速度、光圈、ISO 等技術參數。
但智能手機的出現,使得任何人都能通過傻瓜式的操作拍出世俗意義上的好照片。
類似于智能手機讓每個人都有機會成爲攝影師,Kimi 探索版将複雜的搜索技術封裝成簡單易用的工具,在降低用戶信息的獲取門檻的同時,也朝着更專業更細分的深度搜索邁進。
既要好用,又要易用,專業的搜索,交給專業 AI 的路子,總歸沒有走錯。