圖片來源:視覺中國
誇克發布大模型一周之後,11 月 22 日,誇克技術負責人蔣冠軍,在阿裏中心舉辦的閉門會上分享了關于誇克大模型更多的技術和發展細節。
誇克大模型是阿裏巴巴智能信息事業群于 11 月 14 日發布的全棧自研的大模型,是基于 Transformer 架構的,具有千億級參數的多模态大模型。
此次閉門會所處的房間,牆上貼着很多彈幕熱詞、影視作品台詞以及歌詞作爲裝飾,其中一句是 " 讓年輕人的快樂更陽光 "。年輕人,正是誇克大模型始終在強調的關鍵詞之一。在會上,蔣冠軍分享了一個數字——現在誇克的用戶中,25 歲以下的年輕用戶占比達到一半,他表示," 我們一開始做誇克,就是希望把誇克做成年輕人或剛工作白領群體的智能助手 "。
打開誇克 APP,在搜索框下面有 7 個闆塊,分别是誇克網盤、誇克掃描王、誇克學習、誇克日報、誇克文檔、誇克熱搜以及更多。蔣冠軍表示," 在大家的工作、生活和學習過程中,無外乎是先找資料,再存資料,并且最好有一個能雲端編輯和加工的智能産品,幫用戶去解決工作學習中的具體問題 "。而誇克大模型正是在這一基礎上,對搜、用、存進行智能化升級。
在今年阿裏 Q3 的财報會議上,公司明确将 1688、閑魚、釘釘和誇克定義爲阿裏巴巴第一批戰略級創新業務,集團會支持其 3-5 年,這意味着誇克必須在 3-5 年内自己養活自己。據藍鲸财經獲悉,誇克所屬的智能信息事業群在過去幾年内已保持了小規模的盈利的狀态。
在具體介紹誇克大模型的技術優勢的時候,蔣冠軍從數據、平台、人才和知識增強四個方面進行了展開。其中值得注意的是,蔣冠軍表示,誇克大模型在科普回答上的幻覺率爲 25%,通過知識增強降低到 15%,具體到醫療領域,這一數值則可以降低到 5%。
所謂幻覺,可以簡單粗暴地理解成人工智能中存在的 " 胡說八道 " 的現象,幻覺率低代表的是準确性高。而準确性,是現在通用人工智能能力最核心的問題之一。蔣冠軍表示,其所處的團隊是通過對大模型的預訓練、人類對齊以及模型改進和模型參數規模增加等方式去降低幻覺率。
11 月 16 日,複旦大學與上海人工智能實驗室構建了針對中文大模型的幻覺評測數據集 HalluQA,對業界包括百度文心一言 ERNIE-Bot、百川 Baichuan、智譜 ChatGLM、阿裏通義千問和 GPT-4 等在内的 24 個主流大模型進行了評估。
其中,在幻覺消除上,具備檢索增強能力的大模型優勢明顯,而在所有評測的模型,文心一言排名第一,整體無幻覺率爲 69.33%。而 GPT-4 整體中文無幻覺率爲 53.11%,排名第六。
同樣地,蔣冠軍也在強調誇克團隊此前通用搜索的技術和經驗,使得誇克大模型具有數據和平台上的優勢。
具體來講,通用搜索在數據的數量、完整性和豐富性都爲大模型核心的三要素之一——數據提供了支持。而傳統搜索引擎與大模型同樣都需要龐大的算力," 搜索引擎本身就是海量的網頁數據,我們的數據庫裏有千億級網頁,這意味着需要有一個非常好的離線系統或工程系統,去處理大規模的網頁數據,去做對齊、去重、分析等工作 "。事實上,誇克的前身是誇克浏覽器,而誇克則是由被阿裏收購的 UC 團隊于 2016 年 10 月打造。
國内同爲搜索引擎出身,進軍大模型領域的百度,于今年 3 月就推出了大語言模型文心一言。據近期百度發布的 Q3 财報,文心一言用戶數達 7000 萬,覆蓋場景 4300 個。此外,百度三季度的研發費用爲 61 億元,同比增加 6%,主要是由于支持文心一言研究投入的服務器的折舊開支及服務器托管費增加。
來自清華大學的新聞學院新媒體研究中心的主任沈陽也參與了此次閉門會,他對于搜索引擎和大模型之間的關系進行了進一步的闡釋。
沈陽表示搜索引擎和大模型之間有着天然的适配性,包括搜索引擎本身具有的數據量大,内容安全上經過了長時間的考驗的特點,以及搜索引擎具有的交互功能适配大模型的同時可以通過大模型進一步升級改造。沈陽還表示,未來 5-10 年後,将會沒有搜索引擎的概念,而隻有大模型的概念," 因爲你有任何問題,會習慣于問大模型,不再用搜索引擎 "。
至于具體的應用場景,會議上着重強調了醫療和教育這兩個領域。其中在醫療領域,蔣冠軍表示,誇克大模型不隻可以做出科普性的回答,還會追問,具有進一步的推理能力。而在教育領域,蔣冠軍則通過具體的案例介紹了誇克大模型在中英雙語上的理解和輸出能力,以及對于解題思路進一步解釋的能力等。
在誇克大模型公布之初,就有媒體報道過誇克大模型将衍生出通識、醫療、教育等垂類模型,可以提供 AIGC、智能檢索的專業服務。但由于誇克大模型還未拿到備案,具體的應用産品尚未披露,更遠的商業化場景也還未明晰。
相較之下,近期基于文心大模型 4.0 的 " 文心一言專業版 " 也已經上線,并針對專業人士需求開放收費使用,跑了半年的文心一言大模型,正在商業化的道路上大步邁進。
同爲阿裏系大模型,更早之前,阿裏巴巴已經推出通義千問大模型。通義千問屬于阿裏雲,誇克大模型則屬于智能信息事業群。
大模型燒錢,是衆所周知的事實,那爲什麽誇克要另起爐竈呢?對此,蔣冠軍表示,二者之間的目的是不同的,通義千問更多的是 ToB,而誇克大模型是爲了解決誇克的智能化問題,爲 C 端用戶打造一個智能工具助手。如果隻在通用大模型的基礎上做樣本的精調,并不足夠應對差異化的場景。