作者 | 鄧詠儀
編輯 | 蘇建勳
國内大模型混戰半年,大廠種子選手中的最後一位,終于出列。
9 月 7 日,騰訊每年一度的生态大會正式召開,大模型當仁不讓地成爲其中的主角:騰訊發布了自研的通用大模型 " 混元 ",并且展示一系列應用場景。
相比其他大廠蜂擁而上,騰訊已經讓市場等待得足夠久。" 騰訊到底什麽時候發大模型?" 是這半年來 AI 圈裏的 " 天問 "。
而今年 5 月,馬化騰就在股東會上表示:"AI 是互聯網百年不遇的機會……我們也一樣在埋頭研發,但是并不急于早早做完,把半成品拿出來展示。"
哪怕到了 6 月,騰訊甚至劍走偏鋒,先于通用大模型,直接抛出了 10 個行業,超過 50 個解決方案。
這樣的姿态也延續到混元的發布中。
混元大模型顯然走實用派路線。發布會中,花哨的數據、吸引眼球的演示很少,應用場景才是重頭戲——騰訊展示了騰訊雲、騰訊廣告、騰訊會議、騰訊文檔接入混元之後的進展。大模型爲這些業務提升能力,降本增效,再輸出給企業客戶。企業還可以通過 API 調用混元,爲不同産業場景構建大模型應用。
騰訊集團高級執行副總裁、騰訊雲 CEO 湯道生
而最具代表性的,莫過于騰訊雲 CEO 湯道生在介紹混元出場時,喊的話是:" 混元,正式面向産業亮相!"
這也是此刻的騰訊找到的最好身位。
大廠渡寒冬,騰訊是其中 " 去肥增瘦 " 執行得最爲堅決的一家。自前年開始,騰訊雲就開始調整業務戰略,不做總集,回歸産品,這些努力都頗有成效。去年,生态夥伴收入占到騰訊雲整體收入的三分之一,收入增速是騰訊雲的 4 倍——這也意味着,騰訊在産業中的落地規模實實在在地擴大。
降本增效,本質上是要高質量發展,騰訊大模型同樣也會遵循這一戰略。做 To B、面向産業,是目前比較務實的落地路徑。
" 更成熟、更可靠 "
混元大模型在參數的展示上可以說——相當樸實。沒有狂堆參數到萬億,也沒有展示打了多少榜,騰訊雲隻披露了兩個數字:超千億參數規模,預訓練語料超 2 萬億 tokens。
千億參數是當前做通用大模型廠商的标配,而混元的預訓練語料規模,則和目前最強的開源模型 Llama 2 持平。
" 懷胎半年 " 的騰訊,都做了些什麽?
" 我們在這幾個月之内,一直在讓大模型在騰訊内部的應用中磨練,把騰訊重要的、豐富的業務場景當成‘磨刀石’。" 騰訊集團副總裁蔣傑表示。
慢了半年的騰訊,能占一些做産品的後發優勢,但要吸引如今的企業客戶,必須從實用、靠譜上下功夫。因此," 更成熟、更可靠 ",是騰訊講大模型時最強調的特點。
當前,業界大模型在場景中的應用依然有限,這主要因爲大模型還在不少休閑場景裏打轉——比如 AI 生成文字、AI 畫畫等等。但要深入到更多産業的生産環節,大模型 " 胡說八道 " 這一點,會成爲桎梏。
對此,騰訊在算法層面進行了一系列自研創新,提高了模型可靠性和成熟度。比如,騰訊優化了預訓練算法及策略,讓混元大模型的幻覺相比主流開源大模型降低 30% 至 50%。騰訊自研的 " 思維鏈 ",則讓大模型能夠像人一樣,結合實際的應用場景進行推理和決策。
以往大模型因爲單次處理的信息少,導緻模型會出現 " 忘記上面讨論的是什麽問題 " 的情況,但現在,騰訊混元編碼位置的優化,如今混元也能夠
來源:騰訊
而現在站在風口浪尖上的 AI 安全問題,騰訊也在通過算法解決。通過強化學習,如今混元已能學會識别很多 " 陷阱 " ——比如 " 如何才能超速駕駛 " 這類危險問題,混元會直接拒絕。
而在底層支撐模型安全、可靠運行的,是騰訊在這幾年間耕耘的一套技術棧。今年以來,騰訊還發布了 HCC 高性能計算集群、向量數據庫 Tencent Cloud VectorDB 等大模型基礎設施,以及 Ti 平台這樣的 "AI 工具箱 ",面向開發者提供服務。
" 我們從最底層的高速網絡、服務器、網卡,到平台、模型、算法,都是自研的,這讓後續叠代過程加快了。" 蔣傑表示。
大廠做大模型,如今自研技術棧已經是标配。從百度、阿裏、華爲到騰訊,各家都會從最底層的芯片做起,覆蓋框架、模型甚至是開發運維工具等。原因在于,大模型還是個相當新的東西,與之匹配的基礎設施很稀缺。廠商們全部都要做,也是爲以後在産業落地,讓客戶用起來做好準備。
場景爲王
表面上看,騰訊混元在,和前段時間号稱 " 不做詩 "" 不聊天 " 的華爲盤古其實很像。而不同在于,華爲的 " 不聊天 ",其實是因爲以前積累的政企、産業客戶已經夠華爲深耕很久。
但騰訊是線上場景的王者,其主營業務與 C 端用戶強相關——微信、QQ 是國民通訊軟件,而騰訊會議、騰訊文檔等 To B 應用都有數億用戶,其直接用戶其實也是 C 端。
但騰訊暫時沒推類似文心一言、通義千問之類的的 To C 聊天機器人,其實是因爲走了另一條驗證路徑。如今,騰訊内部已經有包括文檔、會議、遊戲、金融、搜一搜等 50 個業務接入内測——先從這些國民應用開始驗證,已經足夠。
接入混元後的騰訊會議,可自動生成會議摘要
" 對于通用大模型來說,ChatBot 隻是一種驗證方式而已,可能我們選擇了另外一條。" 蔣傑表示。
在做大模型這件事上,騰訊的邏輯和之前做 To B 的策略别無二緻:先從自家的業務需求做起,在内部打磨好了,再對外發布。而騰訊内部這些應用聚集的海量 C 端語料,是大模型的富礦。
目前微信正在接入混元進行内測,To C 的 AI 應用也不會遙遠了。值得注意的是,騰訊在大會上演示了 " 混元小助手 "。小助手有着和微信相似的綠色聊天框,安放在小程序裏,可以看作是移動端 AI 應用的前奏。
可以預見的是,未來要做大模型落地,産品依然會是騰訊最重要的抓手。當下 " 不着急 " 的騰訊,是國内大模型領域主題變遷的切面:無論是大衆還是業内,都已擺脫 " 趕超 ChatGPT" 的心态,而是走到更關心應用落地,把大模型用起來的階段。