11 月 14 日,阿裏巴巴智能信息事業群宣布正式推出誇克大模型。據介紹,誇克大模型是基于 Transformer 架構、全部技術均爲自研,同時參數規模達千億級的多模态大模型;其應用場景除了基礎的通用搜索,還将包括醫療健康、教育學習和職場辦公等更垂直的領域。
從其應用方向來看,誇克大模型的推出很符合當前大模型"重落地"的發展趨勢。
推出之前,誇克大模型已經組建了數百人的研發團隊,在上述垂直領域進行了預訓練和精調。官方發布的數據至少顯示,誇克大模型并非是一個"趕時髦"的産物,而是有着想做到行業頂尖的野心——
11 月 16 日,在 C-Eval 和 CMMLU 兩大權威評測榜單的最新評測結果中,誇克大模型分别以 89 和以 77.08 的均分登頂;國内專業考試測試方面,它在中考、高考和研究生考試中均超過了 GPT-4,包括在臨床執業醫師資格考試、計算機等級考試、公務員考試、教師資格證考試等評測中,也均優于 GPT-4(其中臨床執業醫師資格考試成績爲 486 分,遠高于 360 分的及格線)。
如果進一步結合阿裏巴巴在 AI 生态的布局,就會發現誇克大模型的誕生有着很強的戰略屬性,阿裏巴巴智能信息事業群連同大模型在其中的地位一起,都被提到了相當的高度。
AI 技術基因
需要指出的是,智能信息事業群屬于阿裏巴巴 "1+6+N" 中的 N 公司,同閑魚、釘釘等公司于集團内的序列類似。
阿裏巴巴智能信息事業群更注重産品創新和技術研發,這也是内外部對其的認知之一。
該事業群成立于 2021 年 4 月,定位于信息服務方向的智能化創新,旗下包括了誇克 App、UC 浏覽器和書旗小說等産品。
同年 10 月,智能信息事業群升級組織架構,圍繞誇克 App 成立了誇克事業部。該動作被外界解讀爲是在加碼信息服務賽道,誇克則有望承擔起創新突破的使命。包括此次推出的誇克大模型,研發路線也是爲了服務誇克的業務戰略。
随着AI時代的到來,信息服務領域的用戶價值和商業價值仍處在高速增長的初期,誇克開始被置于更高的發展優先級。
今年9月,阿裏集團宣布了用戶爲先、AI驅動的兩大戰略重心,将加大對"技術驅動的互聯網平台業務"、"AI驅動的科技業務"等業務的戰略性投入。
吳泳銘指明的阿裏巴巴未來的戰略投入方向,誇克顯然是 AI 生态中的一份子,誇克大模型的推出已經是一個證明。
爲什麽是誇克
誇克當前的定位将關系到誇克大模型将如何應用。
把時間拉回至幾年前,當時出現在人們眼中的誇克還是一款極度簡潔的小衆産品,專注于優化用戶的搜索體驗。也因爲體驗做得好,在極客和 App 玩家裏圈了一大波粉絲,月活也達到了百萬級。
後來誇克所有的探索,也都是在此基礎上展開的,各種變化也一直圍繞着誇克的成長。
對于當時已經擁有一定體量的誇克來說,一條分岔路其實已經擺在了面前——作爲一款信息服務産品,它必然要考慮後續的發展方向,單一的功能定位能赢得當下,卻不一定争取到更大的市場。誇克需要在克制的前提下做加法,然而對于這樣一款對用戶體驗有着執念的搜索爲主的應用而言,做加法不是個容易的過程。
期間誇克進行過一些嘗試,譬如垂直領域的專業搜索,以及不同形态的優質内容生态建設。
但就在人們以爲誇克要走上内容付費時,它又結合用戶需求和市場變化迅速對自己的業務體系進行了梳理。
2021 年誇克事業部成立,按照阿裏巴巴智能信息事業群總裁吳嘉的說法,誇克已進入新的階段,正在從一個好用的搜索App,邁向個人學習、生活和工作的智能助手。
此前,誇克已經在搜索業務的基礎上延展出了一些信息服務,譬如輔助考生進行志願篩選的高考信息服務,包括健康百科和健康精選問答在内的健康信息搜索,以及内容涵蓋簡曆、PPT、論文、合同、表格和期刊等在内的文檔等。此外,工具屬性更強的誇克網盤也在 2019 年就已上線。
這些服務在"智能信息"的概念出現之前,還是較爲分散的,而當明确要做用戶"個人學習、生活和工作的智能助手"之後,誇克的定位也逐漸清晰起來。
依然是在不犧牲用戶體驗的原則上,誇克後續又對這些服務進行了更深入的優化,并在 2022 年推出另一款工具産品誇克掃描王,補足了掃描場景下的用戶體驗。也是在 2022 年,誇克 App 的 Slogan 正式由 " 新生代智能搜索 " 升級爲 " 你的高效拍檔 ",自此完成了從一個"小而美"的App走向新一代智能信息産品的生态化發展的蛻變。
由于服務場景更貼合學生以及年輕的上班族,誇克也在更新自己的同時,積累起了一批畫像更加年輕的用戶——據 QuestMobile 發布的《2023 年輕人群智能效率應用研究》報告,誇克 App 在泛學生人群和新生代職場人群的用戶占比最高,年輕用戶使用時長位列行業第一;此外,在誇克服務的數千萬級用戶中,25 歲以下用戶占比超過一半。
這些統統構成了誇克區别于其他同類應用的差異化用戶心智。
很顯然,對于誇克這樣緻力于幫助用戶提高效率、有更強實用性質的應用來說,大模型的引入在現階段是适配的,也符合大模型的進化規律。誇克的發展已經從單一服務變成産品矩陣形态,這也給大模型提供了足夠多的落腳點。
大模型将如何 " 升級 " 誇克
當我們提大模型對某個應用的改造,一定是建立在這個應用原有的業務基礎之上。
誇克首先作爲一個搜索工具,在過去幾年已經積累起了海量的中文數據,并号稱有 " 最全面的中文數據庫 "。訓練大模型最核心的三要素之一就是數據,誇克過去的積累首先給了大模型能更好理解、評估和提煉中文知識體系的前提。
而在更細分的領域,誇克的知識内容體系也相對更完整。
比如高考服務,到今年誇克已經連續五年提供高考信息服務,各省市的高考數據非常齊全,同時也涵蓋了豐富的圖文、視頻和直播等針對不同省份、分數段學生的填報技巧内容;健康服務方面,誇克也聯合數百位院士、醫療專家和專業協會建立起了誇克健康百科,并且和數十家行業頭部醫療機構合作建立起了健康精選問答體系;至于文檔服務,其内容也包括了實用範文、求職簡曆、合同模闆、PPT 模闆、教育教學、表格模闆和研究報告等八大類,精選文檔也已上線了超千萬份……
更重要的是,這些數據和内容背後,包含的是非常豐富的用戶場景,對于大模型理解和認知不同用戶對工作、學習和生活上的真實需求,亦是加分項。
某種程度上,大模型的加持和誇克一直以來的技術傳統是一脈相承的。
AI 此前就在誇克的各項服務中多有應用,就高考和健康服務來說,已經在錄取預測、模拟填報以及針對病例、藥品的篩查等等使用場景下借助過 AI 幫助;誇克網盤也在今年先後上線了 AI 自然語言搜索以及播放器 AI 字幕生成功能;誇克掃描王在識别的準确性上,也一直離不開 AI 的貢獻。
誇克可以說對浪潮的到來早有準備,而大模型一旦加碼融入,對誇克各項功能服務的影響可以預見地也将十分顯著。
想象這樣一種場景,在掃描工具的使用中,用戶的痛點通常在于相機識别出的内容不夠準确,盡管此前借助 AI 已經能在諸如版式、公式和手寫内容等的識别上提升準确度,但此類 AI 往往在語義和前後文的理解上較爲機械。而大模型最強的能力恰恰就在于認知,因此當大模型被用于掃描場景,識别準确性又可以提升一個量級。
類似的大模型應用場景,幾乎可以匹配到誇克當前的每一項服務,從而帶來更多體驗上的變革。
而在大模型現階段普遍存在的幻覺問題方面,誇克也提出了自己的應對,建立了從内容、搜索再到推理的一套可辨别知識真僞的技術體系,尤其是在通用知識、圖文知識、專業知識、推理知識和寫作增強等方面,有望讓大模型提供的内容更具有準确性和專業性。
在給用戶帶來改變前,誇克先積極擁抱了變化,改變了自己。
吳泳銘幾天前在世界互聯網大會上的預判是," 在可見的未來,會有更智能的下一代産品進入人們的生活,AI 助理會無處不在,成爲每個人工作、生活、學習中的助手 "。誇克已經到了邁向下一代搜索的臨界點,大模型也将成爲推動誇克持續進行産品體驗創新的技術底座。