作者 | 楊逍
編輯 | 鄧詠儀 蘇建勳
6 月 19 日,騰訊雲正式公布了行業大模型研發進展,爲客戶提供 MaaS(Model-as-a-Service)一站式服務,幫助客戶生成專屬大模型和提供相關應用。
通用大模型近期備受關注,這是騰訊首次公布大模型相關進展。而從發布會來看,騰訊選擇将重點放在 AI 和行業相結合上,希望解決各個行業存在的具體問題。
對企業客戶而言,通用大模型有着專業知識與行業數據積累不足,針對性與精準度不夠的痛點,且企業客戶對數據的專業性要求很高,容錯率較低,信息失誤會帶來法律風險,企業需要可控、可追溯、可修正,且能經受充分測試的大模型。
騰訊集團高級執行副總裁、雲與智慧産業事業群 CEO 湯道生認爲,企業需要的是具體行業針對性的垂直模型,企業可以用自己的數據對行業模型進行訓練和微調,讓大模型能提供更具有實用性的服務。
在發布會上,騰訊雲直接推出了覆蓋了金融、文旅、政務、傳媒、教育等 10 大行業的模型,提供超過 50 個解決方案。騰訊展示了文旅行業、金融、教育等行業的垂直模型——這都是騰訊 CSIG 的重點服務行業。
以文旅行業爲例,基于垂直行業大模型的智能客服,能夠提供更詳細的每日日程規劃,如交通、景點安排,及定制化的推薦方案。
騰訊雲也同樣推出了 MaaS(模型即服務)服務。騰訊雲會爲客戶提供模型預訓練、模型精調、智能應用開發等行業大模型解決方案,其次,企業可以根據 TI 平台内置的大模型,加入企業自己的數據,生成專屬模型。企業也可以根據自己的業務規模,選擇不同參數、不同規格的模型服務。
爲了讓企業用起來,騰訊雲在 TI 平台上提供了一系列模型工具鏈,如數據标注、訓練、評估、測試和部署等。
在安全角度,騰訊雲可以提供模型的私有化部署、權限管控和數據加密等方式,保證數據安全和使用安全,保證敏感數據的保護與安全合規。
算力是直接影響大模型訓練和使用效果的因素。訓練和推理需要耗費大量的算力,算力能力的穩定性、性能直接影響大模型訓練速率和效果。騰訊雲會爲客戶提供算力能力。
騰訊雲在今年 4 月推出了面向模型訓練的新一代 HCC(High-Performance Computing Cluster)高性能計算集群,提供穩定計算、高速網絡與專業運維的服務,讓客戶可以将精力放在模型構建和算法優化上。該集群采用了騰訊雲星星海自研服務器,互聯帶寬達 3.2Tbps,算力性能可以提升 3 倍。據湯道生介紹,目前,幾家 AI 獨角獸和騰訊雲展開了合作。
此外,騰訊即将推出更适合 AI 計算的向量數據庫。向量數據庫可以更高效處理圖像、音頻和文本等非結構化數據,可以實現檢索規模 10 倍提升,數據接入 AI 效率提升。
目前,騰訊的行業垂直模型已在賦能騰訊内部的行業應用。如騰訊會議将推出覆蓋會議全流程場景的小助手,可以幫助用戶進行日程安排、管理,且可以自動生成總結摘要,可以讓用戶回顧會議重點。
騰訊的企點智能客服,也會基于行業大模型和客戶的具體業務,讓客服機器人能提供更精準、詳細的回答。
在企點分析平台上,垂直模型可以爲銷售人員提供精準的商業分析,如當銷售人員問最近 7 天購買業浏覽人數變化趨勢時,企點分析平台可以直接回答詳細的變化趨勢,銷售人員不需要再學習各種複雜軟件、制作看闆。
發布會後,騰訊雲也安排了和騰訊雲副總裁、騰訊雲智能負責人、優圖實驗室負責人吳運生,及騰訊雲副總裁、騰訊雲智能研發負責人、優圖實驗室研發負責人、騰訊企點研發負責人吳永堅的交流對話,以下爲經編輯對話:
問:爲什麽選擇在這個時候發行業大模型?
答:我們希望大模型跟行業相對能夠做深入的結合,能夠實質的具體的解決我們行業當中存在的對各個行業各個客戶存在的具體的問題。
在過去幾個月時間裏,大模型技術飛速發展,在過去的時間裏,我們掌握了相關的行業大數據積累,覺得現在合适把我們過去的一些實踐層面的思考和我們所積累的工具鏈給大家分享。
問:騰訊現在的解決方案和之前相比,會有何不同?
答:我們認爲,本質上是要在特定的行業裏去滿足客戶的需求,我們會發現有一些可能以前技術上不好解決的問題,用了大模型技術之後,有更好的、更容易的解決手段。
問:大模型能很好地幫助客戶降低成本嗎?
答:我們的主要精力不會說考慮怎麽推廣,更多還是希望紮實地把這些工具、這些能力運用到客戶那裏,提升他們的生産力。我們會選擇一些行業裏面有代表性的客戶去進行合作建設,去産生一些标杆的意義,所以這個過程我覺得是一個很自然而然的過程。
問:客戶對大模型的态度反應如何?
答:非常歡迎和擁抱,他們确實看到了以前一些很難解決的問題,得到解決了。如印章檢查,印章蓋在簽名上,此前很難提取出章的樣子,再識别出簽名内容和簽名日期。現在可以做到了。
問:智能客服已經是行業行業大戶型落地的核心場景之一,騰訊雲有哪些優勢?
答:首先,我們堅持的是垂直行業模型的思路,能解決很多具體行業的問題。二是,我們背後有着過去多年的行業積累,這是很重要的基礎。三是,底層的基建部分,算力、網絡、工具鏈等,還是比較有門檻的。四是安全能力,騰訊在過去 20 多年裏面,在安全裏面有很深的積累。保證輸出的答案是合法合規的。
問:現在行業大模型跟産業結合處于什麽樣的一個階段?
答:現在還是處于比較早期的階段,一方面我們現在大部分的技術還在發展過程中,非常多的技術的門類都在發展;二是産業對于模型的理解還有待加強。我們在面對行業特定問題的時候,都要去特定解決。
問:對于開源模型你們怎麽看?
答:開源模型,我們對不同模型也會做嘗試。比如去年評測時,我們發布的萬億模型,一直是在榜首的,同時,我們也會密切關注開源的發展,如開源模型,和開源模型之上的技術發展和應用發展。
問:騰訊現在使用的模型參數如何?
答:我們有不同規模的模型,但是我們更關注怎麽解決客戶的問題,用最有效最低成本的手段去解決客戶的問題。不同的參數量,對于數據的要求和算力的要求是完全不一樣的,包括後續的訓練、推理成本都是不一樣的。
問:騰訊雲如何保證内部的算力資源調度的?
答:我們目前沒有遇到非常大的瓶頸和沖突。我們會提供算力,在一些行業裏,客戶本身也會有自己的計算資源,我們提供一整套的工具鏈和大模型服務流程,方法論,以及評測專家服務就可以了。
問:金融領域,很多銀行等企業也會部署私有化小模型,我們現在的行業預訓練大模型和上一代小模型相比有什麽區别?
答:大模型,在不同參數量上會有很多的區别,邏輯推理确實需要很大的參數量,但是智能問答等,有十幾 B 的需求,就可以滿足客戶的需求。客戶的預算,是結合客戶需要解決多大問題的難度,和需要解決的資源,來設計這套方案。有的場景,預算甚至不會增加,反而會降低,不再需要過去那樣部署非常多的方案。
問:MAAS 平台和之前的 AI 平台相比有什麽升級和不同?
答:以前的 AI 平台,更強調的是平台的工具屬性,做數據标準、訓練,模型評測等。現在升級到 MaaS 後,工具屬性仍然有,且客戶可以直接在我們平台之上直接使用我們的模型,去做下一步的任務。