最近有兩件事,讓搜索引擎重回聚光燈下。百度發布 " 文心百中 ",用 AI 大模型技術驅動的産業級搜索系統。構建企業内部搜索引擎的人力成本減少 90% 以上,同時隻需要極低數據。幾乎同一時間,Open今天Feier要和大家分享的是AI大模型加持,生成式搜索來了!,歡迎閱讀~
最近有兩件事,讓搜索引擎重回聚光燈下。
百度發布 " 文心百中 ",用 AI 大模型技術驅動的産業級搜索系統。構建企業内部搜索引擎的人力成本減少 90% 以上,同時隻需要極低數據。
幾乎同一時間,OpenAI 最新發布聊天機器人ChatGPT,網友發現用它來尋找問題的答案雖然有時會出錯,但直接得到完整回答的感覺要比從搜索中再去挑選爽快多了。
搜索引擎這個經典技術,就要迎來一輪變革了嗎?
想當年,搜索引擎是 PC 互聯網時代的流量入口,絕對的王者。
進入移動互聯網時代後,雖然不再是最受關注的焦點,但搜索也仍舊是高頻剛需,逐漸融入人們的日常生活。
當人們重新把目光看向搜索引擎,也會注意到它這些年并沒有停止進化。
搜索變了
過去一提到搜索,肯定離不開關鍵詞。前幾屆世界杯時,人們更習慣于搜 " 世界杯 直播地址 ",關鍵詞之間用空格隔開。
就好像把所有網頁當成一個大文檔,用類似 Ctrl+F 的方式去對關鍵詞做匹配。
随着手機、移動互聯網的普及,人們的需求也在變化,現在更傾向于提出一個問題,并期待搜索引擎能直接給出回答。
如搜索 " 世界杯直播在哪看?",更口語化也更複雜,甚至一些時候就是語音轉換出來的。
搜索引擎也在适應這種變化,給出的結果不再是單純的頁面排序。
針對一些問題,會給出對内容深入理解後的答案抽取。
有時會給出更直觀、更容易跟着操作的視頻内容。
甚至在理解需求的基礎上出現配套的服務跳轉。
這些變化看起來并不複雜,背後卻要有很多技術做支撐。
在這裡要重點講一下百度今年亮相的兩項新技術," 知一 "和" 千流 "。
先看跨模态大模型知一,AI 技術在搜索場景落地的代表。
簡單來說,知一大模型可以從全網形态各異的資源中持續學習,無論是文本、圖片、視頻還是結構化信息都可以融會貫通。
打破了資源形态的界限,就更容易理解用戶的搜索需求。
從技術層面講,知一使用了百度文心大模型技術。大規模預訓練技術提升模型性能,蒸餾壓縮率高達 99% 的模型小型化技術以降低成本,得以在搜索場景全面應用。
據了解,目前知一在百度搜索的各場景中每天要進行上萬億次的推理。如此巨大的使用規模又帶來新的問題,如何把滿足需求的結果高效呈現給用戶。
這就要提到新一代索引技術千流,負責把不同維度的信息進行智能有序的組織。
千流與之前的索引技術相比,主打多領域、多維度表達的立體栅格化索引。
如何理解栅格化?
在過去,搜索引擎為提高效率會把内容按質量橫向分層。先從高質量内容開始檢索,滿足需求就可以及時返回結果,還未滿足再進入下一層。
如今,在千流中又把質量最高的一批内容按領域垂直分層。質量分層 + 内容命中結合,一橫一縱把内容切分成栅格按需檢索,大大減少每次檢索的計算量。
百度工程師透露,這樣節省下的計算量也沒有閑着,而是對内容進行精耕細作,用不同的算法從多維度提高索引的質量。
還有一個額外好處,在不同栅格之間可以應用個性化算法。就好比 " 一魚多吃 ",不同的部分使用不同的烹饪方法。
知一和千流配合起來,整個系統還會根據模型最新學習到的知識,進行實時動态調整,确保最優檢索效果。最大程度避免無效計算,最終把滿足需求的結果高效呈現給用戶。
這些新技術,在實際業務中是否起到了效果呢?
答案或許可以從數據中找。
反饋驅動創新
9 月份舉辦的萬象 · 百度移動生态大會,百度指出,過去一年,百度搜索規模逆勢增長 17%。
最新的百度第三季度财報也顯示,移動端搜索查詢次數同比實現兩位數的增長。
百度集團資深副總裁、百度移動生态事業群組(MEG)總經理何俊傑指出,其中的關鍵是" 反饋驅動創新 "。
一方面反饋來自智能搜索。百度搜索每天響應來自 100 多個國家、幾十億次的搜索請求。
另一方面則來自智能推薦。2022 年第三季度百度 App 信息流内容分發量同比增長 23%,其中的用戶點贊、評論、分享也都是用戶最直接的反饋。
用戶的高頻需求,驅動着 AI 技術變革。新技術又能激發新用戶需求表達,兩者構成" 雙輪驅動 ",持續推動搜索進化。
比如虛拟人技術加持下,可以實現交互式對話,單純的搜索之外又有了聊天、陪伴需求。
正如百度研究院在年初的十大科技趨勢中所預測的,AIGC(AI Generated Content,人工智能生成内容)在今年大放異彩。
未來 AIGC 繼續與搜索深度結合,還将帶來 " 搜索即生成 " 甚至 " 搜索即創造 "。
不會再有 " 抱歉,沒有找到相關的網頁,請檢查您的輸入是否正确 ",而是用戶點下搜索按鈕的一瞬間,本不存在的内容由 AI 即時創造出來。
百度 CEO 李彥宏前段時間也說過:
随着技術的突破,AI 作畫、AI 視頻、甚至 AI 構建一個虛拟世界可能都會像手機拍照一樣簡單。
而一切技術的突破和創新,都離不開人才。
為了更好推動技術和算法創新、促進産學研交流、培養人才,百度舉辦了首屆搜索技術創新挑戰賽。
大賽提供 30 萬元總獎金池、提供英偉達 A100 算力資源,更是有機會接觸到百度海量搜索業務的脫敏數據。
本屆大賽分為兩個賽道:
搜索問答,旨在探索開放領域搜索場景。面對網頁文檔質量參差不齊、長短不一,問題答案分布零散、長度較長等問題,希望參賽者能進一步提升深度智能問答效果,給用戶提供更好的搜索體驗。
搜索模型推理優化,對于保障億萬用戶流暢的搜索體驗、控制算力成本開銷至關重要。希望參賽者通過各種優化技術,挑戰最優的模型推理性能。
大賽期間,百度還提供了豐富的相關課程和學習資料,搜索技術與 GPU 加速計算專家也将提供全程的技術輔導。
本次大賽對全社會開放,消息一出立即吸引了大量高校學生、企業團隊或個人開發者,目前已有 1500+ 隊伍報名參加,成為搜索技術領域一次盛會。
大賽地址:
https://sti.baidu.com
— 完 —
點這裡關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
關于AI大模型加持,生成式搜索來了!就介紹完了,您有什麼想法可以聯系Feier。