做大模型的公司不少,能明确給出産業落地時間線的還是頭一次見。
剛剛,在 2023 京東全球科技探索者大會暨京東雲峰會上,京東推出了言犀大模型 + 言犀大模型開放計算平台,并展示了零售、健康、物流、營銷、金融、客服等多個産業場景的階段性實踐成果。
一開場,就欣賞了一段由大模型驅動的數字人歌舞表演。
電商場景下,支持 AIGC 商品内容生成。
還有 AI 增長營銷平台,幾句話構建出營銷方案、推廣網站。
醫療場景下,通過多輪對話即确定用戶腰疼的的原因。
除了現場演示之外,三步走的落地路線圖也格外引人關注——
今年下半年在京東内部高複雜場景中反複打磨錘煉,并針對重點場景的标杆客戶進行對外服務,主要目的是發現那些看起來 " 不起眼 ",但産業應用中又非常關鍵的問題。
2024 年上半年,就能針對嚴肅商業場景将大模型能力全面對外開放 。
劃重點了,這裏的對外開放不隻是提供 API,而是連産業應用一起打包,讓企業開箱即用的那種。
京東不會把沒做好的菜端上餐桌。
而京東之所以有底氣制定這樣路線,也是頗有不少幹貨在裏面的。
産業夥伴需要什麽樣的大模型?
通用大模型火過半年之後,整個産業已經把目光聚焦到下個階段——産業大模型。
随着最早提出産業大模型的京東交出答卷,關于「産業夥伴需要什麽樣的大模型」的問題也可以得到階段性解答。
大模型時代到來,C 端應用層出不窮,普通大衆有了直觀感知,對其所存在的 " 胡說八道 " 等問題,也有了切身體會。
但對于 B 端企業而言,由于身處行業不同以及自身業務考慮,到底「用什麽?如何用?」始終沒有很好的答案,大多都 " 還是不知道怎麽用 "。
當大家談到産業大模型,第一反應是聚焦某個行業做小模型。
但何曉冬告訴量子位,這可能是一個誤解,做産業模型的時候還是需要一個通用域的數據,通用域數據對行業應用也非常關鍵,它提供了背景常識性的知識。否則如果用戶突然提出一些跟這個領域不相關的詢問的時候,話題的跳躍性比較大,原來領域小模型就會很茫然。
所以,企業所需要的産業大模型也必須建立在通用能力基礎上。
大模型于企業而言,大都是降本增效之用。比如可以自動化處理數據和任務、分析大量數據給出更精準的決策、擴展到新的業務領域等等。
而要實現這些用處,大模型就必須滿足兩個原則:可信、可用。
可信,意味着模型的預測結果是可靠的,可以被企業信任;
可用,則表示模型可以在實際業務中發揮作用,爲企業創造價值。
這兩點,不僅是企業用什麽大模型的選擇基準;也是實現大模型産業化的兩個基礎特性。
首先來看可信。
針對性地解決大模型可信問題,市面上仍未形成完整的解決方案。
過去幾個月大模型從亮相到應用以來,始終存在的幻覺問題。而早在 2020 年京東基于 Transformer 做的K-PLUG模型實體屬性抽取準确率達到了 95%,已經達到了商用的水平。
這各中原因,在于京東走出了自己一條路——知識注入。
當時放在業内,屬于首創。
它大幅改善了此前 AI 生成長文本任務中文本多樣性、篇章連貫性,以及在商品賣點文案的生成中尤其需要關注的賣點獨特性、屬性一緻性,給予商品 " 真實的贊美 "。
最終在一系列 NLP 任務中,比如實體屬性抽取準确率、生成式多輪對話 ROUGE-L、多輪問答知識檢索率,其性能明顯優于其他基線模型。
之所以能這麽早地發現 " 幻覺 " 問題并解決,這與他們一直以來圍繞産業實踐有關。
市面上一般生成式語言模型生成的内容正确率是 83%、85% 左右。一般 toC 用戶用起來覺得還可以,十個裏面錯一個,但是商用是不可接受的。
同樣的思路,也集成到了可用的實踐上。
從提供大模型企業的視角下,這個問題就轉變成如何讓大模型創造普惠價值。任何一項技術實現普惠,意味着技術門檻和使用成本的盡可能降低。
算法的泛化 + 向量數據庫 +SaaS,這是京東給出的一套組合拳。
前兩者自不必多說,一方面算法泛化能力,可以讓模型處理多種任務,解決行業中複雜長尾場景。
2022 年,針對模型泛化性不足,京東提出百億級 Vega 模型。并于 2023 年在通用語言理解基礎模型方面對織女大模型進行再升級,提出規模更大、性能更強、遷移性更好的 Vega v2 模型。
向量數據庫則可以實時更新知識庫,補齊大模型的長期記憶,還能降低訓練成本,可以說一舉多得。
而向量數據庫,2019 年京東就在業内率先研發了 Vearch。目前服務超 100 家大中型企業用戶。數據顯示,将京東的向量數據庫用于大模型預訓練,相比傳統方式,通過優化模型推理效率,推理成本降低 80%。
目前大模型在應用上的主流思路,就是調用 API。何曉冬在接受采訪時表示,這對于一些傳統行業客戶來說,這依舊有一定的技術門檻。
而客戶唯一關心的就是服務效率,隻要能将産品用起來就行。
于是團隊決定直接将技術解耦形成" 言犀 AI 開發計算平台 ",并在内部實踐中打磨産品模塊。客戶甚至不需要掌握深厚的 AI 知識,跳過中間步驟直接引入成熟的大模型能力。
之前需要 10 餘人的科學家團隊工作,現在隻需要 1-2 個算法人員,通過平台即可完成從數據準備、模型訓練到模型部署的全流程,訓練效率提升 2 倍,推理提效 6.2 倍,成本節約近 90%。
從可信、可用這兩個角度來看,京東給出的解決方案,在整個行業中打了個樣兒。
從語言大模型走向多模态數字人交互
這種圍繞産業實踐發現問題、解決問題的方法,不光體現在大語言模型上,也體現在京東産業 AI 發展的各個階段。
前深度學習時代,還很少有人期望 AI 能像今天一樣獨立成爲一個功能甚至産品,當時的目标主要集中在降本增效、體驗優化上。
2012 年京東開始應用智能客服中心,着力于用技術輔助客服提升人效,優化客戶體驗。回首看來,其中探索的三個具體任務方向:
ASR 語音識别技術、NLP 語義分析技術、數據挖掘技術。
時至今日,這三類技術對大模型的訓練影響頗深。
進入深度學習時代,AI 開始能在更綜合、複雜的場景下發揮作用。
2015 年,京東智能客服正式應用了深度神經網絡技術。2018 年,首度升級無人客服實現人機結合。在同樣 " 深度 " 的實踐過程中,言犀團隊逐漸認識到了這樣一個問題:
客服對話屬于任務導向性對話,最終是要解決真實場景的問題,與一般閑聊有本質區别。而且不同的場景,用戶對于對話的要求也不一樣,僅售前和售後就差别很大。
于是,早在 AlphaGo 掀起上一輪人工智能熱潮的那段時間,何曉冬就提出" 對話的本質就是推理和決策 ",後來他在各種場合常用 " 圍棋也叫手談 " 來解釋這個觀點。
在此思想指導下,何曉冬帶領團隊融合聲學、語義、時間等多模态特征,開發出一系列人機交互場景的 " 話語權決策 "(Turn taking)技術路線。
最近谷歌整合旗下谷歌大腦與 DeepMind 團隊,提出要用 AlphaGo 技術與 Transformer 結合開發下一代大模型 " 雙子星 "Gemini,也标志着這條路線的價值終于被更多人認識到。
再後來就到了現在 Transformer 大模型時代,京東的布局也很早。
京東在 AI 工程化方面,每天服務數億活躍用戶。以智能客服領域爲例,每年産生數百億的動态交互數據,一是數據規模大,每天提供 1000 萬智能客戶服務,每月 200 萬小時通話語音,今年京東 618 期間累計服務超 7 億次,在各種高負載考驗下,京東沉澱出了最佳實踐。
加上京東其他領域的人機交互,數據量級達到了數百億。
2022 年,京東以言犀 2.0 ——人工智能應用平台的方式将内部驗證過的技術解耦出來,開始對外輸出。
如今的言犀 AI 開發計算平台,也是延續着這個思路。
何曉冬介紹,今年起,言犀大模型正在強大工程化能力基礎上于京東場景内深度落地,在健康、金融、物流等京東衆多優勢行業可複制性的場景中率先錘煉能力,打磨出成熟可靠的技術能力。
以健康領域爲例,靠着言犀大模型的多輪交互、工具調用、總結摘要、圖文多模态等能力,打造了健康助手及輔助診療應用。
目前,健康助手及輔助診療已積累超 3 千萬高質量臨患對話,構建起百萬級規模醫學知識圖譜,涵蓋超千種疾病專業性服務,20 種評價标準保障醫療安全。
在物流領域,在言犀大模型的支撐下,京東物流超腦實現實時交互、根因分析和智能決策,并更新叠代至具備實時自動生成全局最優的供應鏈解決方案的能力。
在營銷領域,京東科技市場和平台運營團隊打造了 AI 增長營銷增長平台,運用大模型解決了諸如關鍵性任務,動态适應性、用戶體驗等問題,大幅優化了營銷運營流程,實現方案生産效率上百倍提高;将過去涉及産品 / 研發 / 算法 / 設計 / 分析師等 5 類以上職能才能完成的流程,壓縮至 1 人;同時,一個入口的全新交互模式,讓人機交互次數從 2000 次降低至少于 50 次,将操作效率提升了超過 40 倍。
接下來是正在加速到來的通用人工智能時代,何曉冬認爲一定是往多模态方向走。
當 AI 的通用能力達到一定程度,就可以不隻停留在幕後提供技術支持,而是形成産品直接面對人類用戶,甚至像未來智能體一樣更深層次與人類交互。
對此,京東雲在言犀大模型的基礎上整合了多項多模态數字人交互能力,也在數字人客服、直播等場景實踐中找到出一些心得。
比如實現了語義驅動的肢體動作編輯,通過與大模型結合讓數字人說話時的動作與語義匹配,交互更加自然。
又比如數字人動态局部高清技術,利用了人類視覺感知并不均勻的特點,對臉部特别是眼睛周圍格外敏感。通過重點區域提高分辨率,其他區域适當降低分辨率,從而降低部署成本。
在 JDD 上他們表示,言犀會進一步降低操作門檻與操作難度,讓更多中小商家與個人能夠用得起、用得上數字人服務。
……
如此看來,言犀大模型落地路線圖中強調要有 " 半年打磨期 " 的原因就呼之欲出了:
不能隻提供 API 告訴外界有這麽個 AI 能力,最終目标是爲合作夥伴提供直接可用、有端到端價值的産品模塊。
大模型時代下的京東路線
幾個月前,企業們還在紛紛搶發大模型,到世界人工智能大會搖身一變 " 大模型主場 ",各家紛紛給出自己的行業落地解決方案。
雖然看上去琳琅滿目,但若進一步了解就會發現,這些方案不可避免存在業務場景趨同、落地進展仍處于起跑階段等問題。
這與大模型技術産業化難點有關,尤其是最後一公裏的問題,往往就是能用與否的邊界。這牽涉到整個系統工程難題,并非傳統 AI 三要素就可解決。
作爲最早提出聚焦産業大模型的京東,早已感知到這種轉變,并将其更新爲全新 " 三要素 " 内涵:
場景,以往靜态的數據無法适應動态的交互,隻有活的在行業應用中的場景數據,才得以實現。
産品,單點算法不足以支撐起新的大模型。最終産品形态才具有核心競争力,并能帶動體系算法的創新和突破。
算力,單個 AI 芯片進步的速度慢于大模型算力需求的井噴,算力集群成爲更好的解決方案。
至此大模型時代下的京東路線,也就此明晰:
産業原生。源于産業、服務産業。
于是在這場峰會上,京東将自身底層能力解耦,從基礎層、模型層、到 MaaS、SaaS 一攬子技術産品和解決方案都給釋出亮相給産業夥伴。
甚至于,已經給出了明确的 " 三步走 " 戰略:
第一步,基于核心産業數據,内部構建基座大模型;
第二步,在零售、金融、健康、物流等京東内部核心業務應用;
第三步,針對金融、政務、健康等京東域外重點産業場景全面開放大模型能力,向産業輸出可用可控可信可負擔的定制化模型。
這樣一條落地路徑,也是京東再次向業内重申了自己的技術追求:
成本、效率、體驗、可信、普惠、突破。
早在 2017 年,京東提出" 技術、技術、技術 "口号,這三個技術代表了三個層次:
第一個層次是服務自己業務的需要;第二層次是服務産業的技術;第三層是探索未來的技術。
這三者兩兩耦合,形成技術與産業的閉環——基于産業的前沿創新突破,随後在内部打磨沉澱實現 " 可信 ",最終服務産業創造普惠價值。
也正是因爲基于産業的思考,自今年 2 月業内首宣産業大模型之後,京東沒再透露更多進展,直至現在才首次将自身技術積累首次亮相。
畢竟從現在發展情況來看,大模型落地的難點并不在于技術追趕,而在于産業突破。
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~