自去年起,大模型世界可以說是風起雲湧,不斷有大模型升級和湧現。如果說 2023 年,AI 大模型給所有人都帶來了一種前所未有的震撼,那麽到了 2024 年,AI 大模型競争的核心焦點已經轉移到了落地的應用上。
作爲國内最早推出通用大模型的公司,百度在去年 3 月就發布了國内第一個大模型——文心大模型 3.5,并推出了以此爲基礎的文心一言 App。
今天,百度文心一言 App 再次迎來升級。
全新 4.0.0 版本下,文心一言升級爲 " 文小言 ",App 将提供問問題、陪聊天、寫文章、畫圖片和下任務五大核心場景能力。同時,所有用戶都可以免費使用文心 4.0 大模型,有效期爲整個 9 月份。
圖源:文小言
文心 4.0 上線初期,雷科技就做了上手體驗,當時評價是足夠讓人眼前一亮了。特别是在 AI 搜索方面,不僅在中文語義理解又有了一定的提升,在邏輯推理、知識問答方面也更多避免了大模型 " 幻覺 " 的出現。可以說,文心 4.0 在綜合能力上确實與 GPT-4 不分上下。
在 2024 百度萬象大會上,百度副總裁、AI 創新業務負責人薛蘇表示過去一年,用戶在文心一言 App 上進行了超過 14.3 億次的調用,其中調用最頻繁的功能就是問答,這也是其最核心的能力:AI 搜索。
搜索是百度的老本行了,在用戶心智上,百度之于中國人如同搜索,谷歌對海外用戶而言也早已成爲搜索的同義詞,這使得其他競争對手很難在傳統搜索時代對百度形成威脅。
而以 ChatGPT 爲代表,生成式 AI 被無數人和公司視爲颠覆和改變搜索引擎的關鍵,從巨頭到新創,幾乎都在引入生成式 AI。按百度、谷歌等公司的定義來看,目前大多數支持聯網檢索數據的 AI 大模型都可以算是 "AI 搜索 ",隻不過受限于搜索引擎的數據來源和 AI 大模型的數據規模,給出的回答質量參差不齊。
圖源:OpenAI
目前 AI 搜索賽道已雲集 Google、百度、OpenAI、字節跳動、騰訊、360、天工 AI、秘塔 AI 搜索等玩家。
支持多模态輸入、具備多步驟推理能力、能夠處理帶有多種限制條件的長提問,這些已經成爲 AI 搜索産品的标配功能,信息集成能力進一步提升。更重要的是,AI 搜索幾乎杜絕了過去充斥廣告和内容農場的問題,用戶不必再從廣告堆裏翻答案。
當然,AI 扭轉用戶心智,颠覆搜索引擎市場的前提是:回答足夠可靠。
所以雷科技也很好奇,全新的文小言 App 在 AI 搜索上到底有多少進步?對比其他具備 AI 搜索功能的産品區别在哪?
帶着以上問題,雷科技将文小言與其他 AI 搜索産品進行了一番 PK,看看現階段 AI 搜索到底表現如何。
相比傳統搜索,AI 搜索最大的特點是用戶開始可以像日常聊天一樣詢問機器,尋找信息和答案。面對涉及确切地點或複雜要求的提問時,最能考驗 AI 搜索能力。
于是,雷科技以 " 坐地鐵到某地 " 爲要求,向各個 AI 發起提問,并得到了以下回答:
從左到右依次爲:文小言 / 通義 / 天工 AI
圖源:雷科技制作
從不同 AI 搜索的回答中,我們可以很簡單的看出各個 AI 搜索産品的區别。雖然所有産品都能準确識别出正佳廣場的地理位置,并給出正确的乘坐地鐵方案,但文小言通過調用百度地圖插件,直接給出了基于用戶當前位置的各種交通路線,包含公交、地鐵、駕車、步行。
而阿裏通義、天工 AI、秘塔 AI 搜索、360 AI 搜索等 AI 搜索産品均未能識别用戶當前位置,提供回答都是基于互聯網的常規答案。不過也可以理解,要想實現文小言這樣的場景功能無縫銜接,必須得有地圖插件的支持,個人目前隻在文小言和支付寶智能助理上看到過類似的功能。
同理,AI 搜索産品想要從搜索界面直接提供交通、餐飲等生活服務,一樣需要生态支持,門檻确實有點高,并不是所有 AI 搜索産品都能做到。一旦實現,用戶體驗将得到極大提升。
雷科技繼續發起 " 尋找附近美食 " 的提問,文小言直接甩出了一串西餐廳,不僅有對應評分,點開卡片還能看到路線、評論等信息。與之相比,阿裏通義的回答稍顯遜色,回答中提及信息分别來自于 2020 年和 2021 年。盡管 AI 提醒信息可能過時,但這顯然不是用戶想要的答案。
文小言 / 圖源:雷科技制作
其他幾個 AI 搜索産品的回答中規中矩,除了在西餐廳中混入咖啡廳外,基本沒有出現大的錯誤。雷科技用地圖軟件進行搜索,所有餐廳地點均在設定地點附近,範圍不超過 5 公裏。
這或許也是 AI 搜索的潛在發展方向之一,雷科技在文小言身上看到了一個以 AI 搜索爲中樞,連接各種生活場景和服務的 AI 生态雛形。
潛力歸潛力,目前在實際體驗方面,文小言還有不小的優化空間。比如涉及到多個關鍵詞的大段自然語義提問,AI 會出現識别不全的情況。作爲基于 AI 大模型打造的 AI 搜索,這表現顯然不夠智能,并不是說它沒有完成的能力,隻是還需要根據用戶需求做進一步的信息篩選與推薦。
作爲用戶,雷科技對 AI 搜索的期望遠不止單一的搜索引擎,而是能與 AI 助手結合,能在不斷交互中逐漸熟悉用戶,有記憶能力,有個性化服務能力,将用戶從繁雜 App 中解放出來。
我們在前面說到過,谷歌、百度、騰訊、OpenAI 等企業都在推動 AI 搜索發展。從産品角度來看,市面上 AI 搜索産品大緻可分爲兩類。
一是專門的 AI 搜索引擎,隻提供 AI 搜索功能,比如 360AI 搜索、秘塔 AI 搜索、谷歌 AI Overviews 等;另一類則是複合型 AI 助手,集成了 AI 搜索、AI 生成、智能體等 AI 功能。裏面有一開始就定位 AI 助手的文小言、騰訊元寶、Kimi 等,也有一開始隻做 AI 搜索,後面加入了其他 AI 功能的天工 AI。
要回答标題的問題,我們得先确認搜索應該出現在什麽場景中。大夥平常遇到問題會去哪裏尋找答案,是搜索引擎,還是抖音、小紅書、微信等平台?答案必然不會統一。
但我想說的是,移動互聯網發展至今,用戶獲取答案的渠道不再局限于的搜索引擎。比如小紅書官方透露,有 60% 的日活用戶每天都會在平台主動搜索,日均搜索查詢量接近 3 億次。
圖源:百度
從長遠來看,産品隻具備單一搜索功能或許很難吸引用戶留存,這意味着用戶需要在本就繁雜的應用海中再添一個。個人認爲最理想化的手機環境應該是盡可能少的應用解決盡可能多的需求,而文小言以 AI 搜索爲核心組建的多模态全能 AI 産品路線,恰恰符合這一趨勢。
就目前來看,百度對于文小言的産品方向是可行的。改名文小言也隻是爲了更親近用戶,更好地面對接下來的 AI 搜索競争。但其面臨的最大挑戰是如何平衡功能的寬度與深度,究竟是新增功能數量爲先,還是優先深挖 AI 搜索等功能的實際表現,這或許是百度接下來需要考慮的地方。
此外,文心 4.0 大模型免費使用一個月相信能給文小言帶來不少新用戶。大夥使用時需要注意 AI 默認使用 4.0 Turbo 模型,不同模型會給使用帶來不一樣的體驗,可以按需切換。