圖片來源 @視覺中國
2018 年至今,NLP 領域經曆了非常大的變化,Transformer、ELMO、BERT、GPT-3,再到最近的 ChatGPT(GPT 3.5 的微調)的突破,NLP 在預訓練大模型的暴力拆解路上越走越遠,這也讓各行業開始相信:很多之前無法做到的場景、效果,現在可以有新的解法和落地。
智能客服,是 NLP 和深度學習技術落地的重要領域之一。客服可以基于提前設定好的規則,對用戶意圖進行判斷并生成對應的固定話術。文本機器人、外呼機器人,可以替代掉原有重複性比較強的人工動作,逐漸轉變為相對日常的落地場景。比如你日常所接聽到的快遞客服電話,訂單咨詢的對話框等等,背後都有來自客服機器人的驅動。
但在對客服要求比較高的企業級場景中,對多輪對話理解用戶意圖和知識專業度要求較高,現有的客服機器人仍有很高提升的空間。
一是系統整體搭建的維護成本比較高,效率比較低,因為大多數的企業級智能客服的知識庫不是流程化的,而是技術知識庫,需要人工 / 半自動的方式進行搭建。
二是業務場景複雜,專門知識門檻會更高,往往會涉及不同客戶的應用場景,與業務流程相關的複雜場景。
三是持續突破比較難,邊際效益遞減明顯,一般在良好技術知識庫的支撐下,企業級智能客服的起步較快,但受制于方法論的影響,前期需要投入的大量人力、算力和數據,而到一定階段則會陷入提升的瓶頸。
這樣的問題也曾經困擾浪潮信息的客服系統研發人員。
近日,钛媒體 App 對話浪潮信息服務總監陳彬、浪潮信息 AI 軟件研發總監吳韶華,圍繞智能客服市場當前解決的難題,以 AI 大模型的實際落地應用為視角,進行深入交流。
具體來講,浪潮信息以 AI 大模型 " 源 " 為智能引擎,和 InService 智能服務平台,搭建出了 " 智能客服大腦 "。
據介紹," 智能客服大腦 " 學習了 2 萬餘份産品文檔和用戶手冊的數據,并結合百萬條浪潮信息專家工程師服務對話、數十萬份日志、工單數據等算法訓練,具備語言理解、數據分析、自主學習和智能推理等能力,支持自然語言交互服務、已授權 IT 設備的智能運維與診斷、以及備品備件等資源的智能管理和調度。
AI 大模型在應用過程中必然會面臨各個行業的應用落地。在此之前,浪潮 AI 大模型 " 源 " 已經在人機交互、知識檢索、語言翻譯、文學創作等領域有所應用。
以大模型作為基礎能力,通過大模型的蒸餾實現相關的小模型,不僅實現的速度更快,智能化水平更高,從技術角度來講,大模型在落地過程中呈現出了與以往模型非常不同的技術特征,也帶來了更好的智能化水平。不論對大模型進行微調,還是引入領域知識庫的方式,均是業界在探索的路徑。
在浪潮信息 AI 軟件研發總監吳韶華看來,"大模型想要在某個方向上訓練得更好,智能化水平更高,确實需要在具體落地場景引入額外的領域知識,才能解決實際問題。AI 大模型有其自身特點,訓練時使用的數據集主要來自互聯網,在通用知識和領域知識的分布上存在不均,會影響其在具體行業的應用。"
舉個例子,在浪潮信息服務所面臨的主要客戶問題,包括咨詢和故障報修兩大類:前者如各類的産品服務政策、設備使用、以及複雜的技術咨詢,如技術咨詢方面其實比較常見的是如何做系統安裝、Raid 配置等,因為這個過程比較複雜,常出現各種問題;産品咨詢包括購買産品的内存配置、保修時長等等;故障報修相對會比較有針對性、更多元,例如無法開機、硬盤故障、内存故障等等。
在浪潮信息的咨詢客戶中,有 80% 的用戶為非專業工程師,智能客服需要在準确理解用戶、精準定義問題的基礎上,通過多輪回答解決技術問題,給予客戶滿意的答案。對于客戶而言,如若智能客服所給予的答案過于标準和冗餘,卻無法快速幫客戶解決具體問題,客服所給予的答案隻可被定義為對的答案而不是好的答案。
實際上,浪潮信息從 4、5 年前就開始進行客服的數字化轉型和探索,并且在 2019 年開始着手應用業内在探索的 FAQ、任務式對話、知識圖譜等 NLP 領域相關技術,對客服系統進行了一定程度的改造和提升。
但當時遇到的瓶頸也十分明顯,主要在于兩方面:" 一是企業産品信息更新快,造成模型訓練任務非常大,加之模型知識庫的封閉,在訓練效果上也受到制約;二是機器人需要對上下文結合語境進行語義理解,引導客戶提問并且精準識别問題,在專業知識領域的 IT 行業,難度非常高。" 浪潮信息服務與實施部總監陳彬指出。
除了在大模型的落地中引入領域知識外,浪潮智能客服在研發過程中還重點考慮了其他幾點因素:
第一,客服系統是不是真正地理解客戶,是否能夠通過多次對話了解到客戶真實的服務意圖。企業級場景中,客戶有個報修問題,但無法用專業的技術語言對服務場景進行準确描述時,就非常考驗客服系統的理解能力。
第二,是否需要投入額外和高昂的人力成本讓客服機器人具備自主學習、叠代的能力。讓專業工程師做重複的模型訓練工作,既不符合企業成本要求,也不符合企業建設專家型團隊的長期規劃。
第三,B 端客戶對企業的服務體驗、服務口碑要求高,訓練出的客服系統是否能夠讓更多的客戶接受、信任并滿意地使用。相較于傳統的智能客服采用多模型、多數據庫的架構,浪潮信息智能客服系統最終實現統一架構支持多任務解決問題。而此前完成一套客服動作,往往涉及 FAQ、任務式知識圖譜、知識檢索等模塊,需要在多個知識庫、模型之間進行任務調度,架構複雜且維護難度比較大。
此外,由于在模型訓練上實現了自進化、快進化學習,而不是原有需要人工或半人工搭建和訓練模型的過程,在人工标注和訓練成本上得到了極大降低。
從浪潮信息數據中心服務的成效來看,在應用智能客服系統後,客戶問答的匹配率(即覆蓋率)達到 92%,對常見的複雜問題的解決率目前能達到 80% 以上,平均解決率是 65% 左右。此外,服務整體人員規模占浪潮信息總人員規模的 4%,而業内一般都占比 15% 到 20% 左右,在整體人均效能上得到了一定提升。
" 服務作為一個公司的重要窗口業務部門,也是和客戶交互最緊密的平台。所以我們首先考慮的是怎麼把實際業務和 AI 算法結合在一起。本身 IT 的服務場景非常複雜,且面對是更多大量的 B 類客戶,我們當初也在讨論,是否真的需要花這麼大的精力,把傳統的服務場景,做 AI 的相關技術和算法的落地,在項目初期也是比較有争議的。" 陳彬表示。
但從目前取得的成效來看,當初的投入是值得的。
結合钛媒體的觀察,客服機器人的背後仍是複雜的 AI 技術棧作為支撐。涉及語音識别、語義理解和生成、人機交互等等,存在系統搭建成本較高。如 AI 的邊際成本,模型訓練中對人工标注數據的成本,加之企業多數存在二次開發的定制化要求,導緻部署交付成本也難以避免。
企業對技術的投入和成熟與否直接決定了體驗的高低,而如今浪潮 AI 大模型 " 源 " 在智能客服場景的實際落地應用,為業界提供了一種另一種可參考的解決方案。
(本文首發钛媒體 APP 作者 | 楊麗)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App