隻需要回答幾個問題,就能生成個性化的簡曆,還提供優化建議,安排 AI 模拟面試。這樣的效率神器,就出現第二屆百度搜索創新大賽的賽場上。
來自南京航空航天大學的 " 肝到淩晨 " 團隊,利用文心一言插件平台 " 靈境矩陣 " 和百度搜索提供的平台與技術,憑借 AI 簡曆助手 "Linchance JOB" 一舉獲得本次大賽賽道三的冠軍。
百度搜索創新大賽是百度搜索聯合 NVIDIA 英偉達、全國各大高校、社團、科研組織共同舉辦的一項全國性 AI 科技競賽。
9 月 7 日正式啓動、以 " 新搜索 · 新奇點 " 爲主題的第二屆百度搜索創新大賽,曆經 3 個月的角逐,最終吸引了 2800 多人報名,涵蓋了 95 所雙一流高校,最終 28 支團隊獲獎,5 萬名同學直接參與相關課程學習,宣傳覆蓋 100 萬開發者群體。
每個優秀成果的背後,無疑離不開優秀人才的付出與努力,離不開行業的加持與探索。百度集團副總裁、百度搜索平台負責人肖陽在頒獎典禮緻辭時表示," 在這次還遠未到終局的大模型浪潮裏,搜索的技術變革基因不僅要持續發揮作用,還需要自我進化。而這次的進化,更需要創新力量的支持。而得益于創新大賽這個平台,搜索的技術變⾰基因,迅速和衆多年輕的血液産生了碰撞。 "
對此,NVIDIA 全球副總裁何濤在大賽頒獎典禮緻辭中也表示:" 作爲百度搜索創新大賽的技術合作夥伴,我們非常高興的看到百度搜索大賽共吸引了超過兩千多名優秀選手參賽。這一年裏,各行各業都在經曆從通用計算到加速計算和生成式 AI 的平台轉型。也勉勵在場的各位同學,順應技術發展趨勢,把握機會,成爲懂得使用 AI 的人,以掌握未來職業發展的主動權。"
五大賽道成果亮眼,28 支團隊站上領獎台
肖陽表示,人人都能成爲開發者,搜索創新大賽這個競技場,就是成就卓越的最佳場地。本屆大賽設立了五大賽道,題目涉及搜索核心業務場景,如語義檢索、多模态、軟硬結合優化等豐富的技術方向,并且開設了賽道三産品賽道,号召參賽者 " 洞察用戶在搜索場景的需求,并通過構建 AI 應用解決 "。
最終有 28 支隊伍站上了領獎台。
賽道一 " 搜索答案組織 ",來自中國科學院大學的 "None" 團隊獲得了一等獎。該團隊通過精細調整 Lora 微調 LLM 方案,精選公開問答數據增強訓練,利用大模型蒸餾提升學習效果,并參照 NEFTune 進行噪聲嵌入增加模型魯棒性,使測試數據結果更符合用戶需求。每一個技術選型均給出了合理動機、紮實分析和可信結論。這體現了團隊對搜索答案組織問題的深度理解和出色的科研能力。
賽道二 " 基于向量交集的 Topk 搜索 "," 晨曦 " 團隊獲得了頭獎。這個團隊隻有一個人,還是位全職奶爸,不僅在機評結果中遙遙領先,在答辯中整體技術方案的創新性、通用性與先進性上也獲得了評委們的一緻認可。
賽道三 " 設計一個解決搜索用戶需求的 AI 原生應用 ",來自南京航空航天大學的 " 肝到淩晨 " 團隊憑借 AI 簡曆助手 "Linchance JOB" 獲得冠軍。隻需要回答幾個問題,就能生成個性化的簡曆,還提供優化建議,安排 AI 模拟面試。
賽道四 " 基于 GPU 的近似最近鄰檢索算法挑戰 " 則由杭州電子科技大學的 "HDU01" 團隊獲得一等獎。該團隊在調研業内的相關算法并深入分析開源版本的基礎上,做出了有意義的修改,使得最終版本的性能超過了開源版本的兩倍以上。
賽道五 " 可控圖片生成算法挑戰 ",北京理工大學 " 幸運的深不見底的團隊 " 奪得一等獎。他們通過對數據的精心清洗與增強爲模型訓練提供了穩定基礎,采取的多模型融合策略體現了較好的理論實踐結合能力,最終使得生成圖片的相關性和質量有了顯著提升。
此次大賽還組織了線上線下共 16 次活動,提供了超 100 小時的知識培訓和交流機會,有 5 萬多同學直接參與,覆蓋了 100W 開發者群體。
技術變革的基因,⼀直植根于搜索
百度是全球最早推出生成式 AI 的大廠,3 月 16 日發布文心一言内測版,8 月 31 日正式向全社會開放。在 10 月份舉辦的百度世界 2023 上,百度推出了衆多重構後的産品與應用,其中重構後的百度搜索尤其引人關注。
被大模型重構的搜索,目前已經擁有極緻滿足、推薦激發和多輪交互三個新能力。當用戶提出一個問題時,新搜索不再是提供一堆鏈接,而是通過對内容的理解,生成文字、圖片、動态圖表等多模态的答案,讓用戶一步獲得滿足,引領了搜索行業的代際變革。目前,在百度,每天已經有超過 3 億次的搜索需求,被生成式搜索滿足。搜索在首位能給出滿意答案的比例已經提升了近 1 倍。
NVIDIA 開發與技術部門亞太區總經理李曦鵬也闡述了自己 " 新搜索 " 的理解," 從最早書籍檢索、數據檢索,到了數字化過後内容的檢索,到現在如火如荼基于 LLM 生成式檢索,都在說明一個好的領域可以不斷地引領創新、不斷地産生創新、同時不斷地吸收創新。搜索業務本身是 NLP、CV、語音這些最前沿 Deep Learning 的合集。基于此,大模型有創新,第一個落地場景就是搜索。對于大模型在搜索引擎裏大放異彩,是非常值得期待的。"
搜索的技術變革基因,正在注入年輕的血液
肖陽在緻辭中表示," 面對遠未到終局的大模型浪潮,搜索的技術變革基因不僅要持續發揮作用,還需要自我進化。而這次的進化,更需要創新力量的支持。" 創新力量指的就是人才,百度搜索創新大賽所構建的就是選拔人才的舞台,就像業内所說,打造 " 搜索界的奧林匹克 "。
憑借百度搜索創新大賽這個平台,搜索的技術變革基因,正在注入年輕的血液。肖陽稱," 在接下來的⼀段時間内,百度搜索都會持續擁抱年輕⼈的靈感,爲自己的技術基因注⼊新的活力。 "
NVIDIA 的開發者社區,也是創新力量的彙聚之地。何濤表示,"NVIDIA 也給開發者提供了許多學習交流的資源,NVIDIA 的開發者社區,目前在全球已經有 450 萬開發者,CUDA 加速庫下載量也超過 4800 萬次,我們非常歡迎廣大同學們和參賽選手加入 NVIDIA 開發者社區,提升自我競争力,加速你們的職業成功。"
構建起聚合創意、場景和技術的平台,吸引更多新鮮的靈感、可落地的技術湧現,逐鹿 AI 原生時代,搜索就是天然的競技場。