圖片來源 @視覺中國
大模型在企業級市場落實一段時間後,沒有砸出想象中的水花。
" 都是公網數據,企業不敢用。實際應用場景也很少。"一位 HR 企業級軟件的售前專家告訴钛媒體。
現在這家企業主要将場景落地在了人才發現、簡曆評估和面試提問追問三個核心場景。钛媒體了解到,現在市場上能夠感受到企業裁員、收緊招聘需求的信息,但這并不影響高質量人才的流動,尤其是對于中大企業的招聘需求,需要對人才的識别、人效挖掘上有一定的能力提升;同理,到了簡曆評估和面試環節,也需要減少依靠經驗判斷不足,或者得不出有效結果的情況。
但實際上,這家企業的客戶案例不多,爲客戶訓練出的大模型被稱爲 " 不斷叠代的過程 ",收費則是計劃以訂閱模式收費,目前接受這一做法的試點客戶來自全球 500 強的跨國公司和國内業界領先的企業。
實際上,客戶需求市場對生成式 AI 産品或大模型技術也充斥着不同見解。钛媒體了解到,尤其是對于大企業客戶,雖然有不少企業客戶公開宣傳在積極嘗試大模型,恨不得以此解決當前業務遇到的所有痛點,但同時,也有企業客戶對此不屑一顧,認爲自身已經積累的經驗和人才,不會簡單被大模型所替代。
" 大模型的開發訓練依然很複雜,能不能做到更加簡潔?" 在與國内某頭部 ICT 廠商的閉門會上,一家傳統能源行業客戶提出了這樣一個疑問。
該客戶明确指出:" 雖然過去推進智能化取得了一定成果,但跟我們的想象還存在非常大的差距。"除了該行業本身生産作業複雜的自然條件外,各個下設廠家對智能化理解的不足,導緻投入了大量資金,卻仍然各自爲戰。
另一方面,大模型現階段并不 " 便宜 ",能用得起大模型的企業,要麽具備一定的生産體量,要麽手裏有一定預算,認爲大模型所帶來的生成式技術值得嘗試和布局。
某 AI 上市企業負責人近期談及大模型創業時指出," 市面上大模型具備一些基本能力,但隻是玩具或工具,大模型不隻是這些能力,更關鍵的是實現商業變現。"
事實上,無論是文生圖、還是文生文,大模型技術驅動的生成式 AI 确實展現出了其巨大的應用場景。據钛媒體不完全統計,目前相繼參與其中的巨頭公司、AI 創企已不下 50 家,而通用大模型也在嘗試接入多個雲平台,供企業調用或定制開發私有模型。
值得一提的是,OpenAI 在 11 月 6 日舉辦的首屆開發者大會上,對其接下來發力的方向進行了說明,包括:加強文本輸入長度,輸出模式符合預定模式,更多更優質的訓練數據,更多的多模态,領域知識和業務邏輯,以及更優惠的價格等方面。
這對于其他 AI 開發者或使用方而言是個好消息,但對在座的各位大模型技術創業派而言卻是懸頂之劍。
與此同時,生成式内容的合規審查和隐私安全也是大模型或生成式 AI 技術想要在市場中普及的必要前提。
在國内,10 月 11 日,全國信息安全标準化技術委員會官網發布《生成式人工智能服務安全基本要求》(征求意見稿),面向社會公開征求意見。這是國内首個專門面向生成式 AI 安全領域的規範意見稿,也是對 7 月網信辦等七部門推出的《生成式人工智能服務管理暫行辦法》的支撐。
相比大模型到來時的狂熱與喧嚣,到了真正落地的階段,大模型在行業内如何深入應用的探索和考驗才剛剛開始。
每款産品都值得大模型重做?
" 每個産品都值得用大模型重做一遍 ",這是初入大模型應用層企業的普遍叙事。
但在将産品重做一遍之前,還有一個更基礎的問題:大模型能用在哪兒?
在 B 端市場,這個問題可能更難回答,或者很難有唯一的答案。
從國外 Meta 的 LLaMA 系列、Stability AI 的 StableLM 系列、MPT 等模型的開源,以及國内通用大模型面向企業級 API 的内測,激起了更多創企的跟進試用。
如果将一套招聘流程拆解爲簡曆收集、篩選、測評、面試、Offer 及入職,在整個鏈條上,大模型驅動下的自然語言交互技術,最直接體現在提高 HR 招聘效率和改善用戶體驗。
作爲一家智能招聘管理軟件企業,MOKA 倡導用 AI 對核心人力系統進行改造。今年 6 月底,MOKA 公布上線基于大模型的智能産品解決方案 Eva,包括簡曆篩選、定制面試題、AI 寫面評、對話式 BI、員工 ChatBot。例如,員工 Chatbot 功能用于員工完成與招聘、人事相關的任務并獲取相關信息,類似于提供咨詢的 AI 助手。對話式 BI 以自然語言的界面進行交互,讓員工快速訪問數據庫,查詢關鍵指标,支持業務決策和管理。
類似地,北森首先公布了基于百度文心一言大模型的内測功能——招聘 JD 撰寫和招聘海報制作。在 5 月的春季發布會上,北森還推出了全新 AI 産品個人領導力教練 Mr.Sen,用于新晉領導者的轉型适應、團隊管理、個人發展、績效反饋等方面。據北森 CEO 紀偉國透露,AI 面試、員工服務機器人、陪練機器人等都将是大模型可結合的場景。
用友、金蝶則選擇通過融合通用大模型能力,結合基于自身私域數據,以訓練應用于人力、财務、供應鏈等流程軟件場景的企業級領域模型。
用友高級應用架構師包飛與钛媒體交流時指出," 現階段大模型距離行業落地還是比較遠的,客戶最關心的是能在行業裏帶來怎樣的價值。"
目前用友 YonGPT 所支撐的領域模型應用名單包括:企業經營洞察、智能訂單生成、供應商風控、動态庫存優化、智能人才發現、智能招聘、智能預算分析、智能商旅費控、代碼生成等數十種。
而金蝶蒼穹 GPT 目前主要在财務、人力、程序研發場景。例如,金蝶首個公布的财務大模型,實現類似一個财務 AI 助手,提供财務問答、費用報銷、合同審批、報告生成、分析預測等服務。
钛媒體此前報道,金蝶中國執行副總裁、研發平台總經理趙燕錫在調研時發現企業對大模型确實有濃厚興趣,但提及率最高的兩個反饋,一是 "AI 焦慮 ",怕不用 AI 則會落後;二是 "AI 迷茫 ",不知道怎麽用到業務裏。金蝶的策略是,先找一批原型客戶做業務場景的試點驗證,更貼近企業的實際業務。
在 i 人事 CTO 王景飛看來,"客戶關注更多的不是用了哪個大模型,而是大模型對于業務的幫助是什麽。老闆關注企業經營,就會關注經營指标,如人均産出,投入分析,成本優化等;HR 會關注員工體驗,工作效率,如更流暢的人事流程(入轉調離、加班調休等等)。"
專注于核心人事 + 人效的 i 人事,也在跟釘釘合作推出運營效率、風險管理和業務專家三類智能化方案,其目的就是解決企業老闆最關注的問題:用最科學的方法、在風險最低的前提下,最高效地實現企業戰略。
運行效率方面,通過大模型能力,可以爲員工提供 7*24 小時,全年無休的人力資源咨詢、流程和其他支持;人事風險管理專家,可對人力資源中可能會出現的風險進行管理,如對勞動合同内容的潛在風險進行預警、提出修正建議和風險預案等;業務專家中的績效專家,可以指導企業員工如何完成 OKR 的目标拆解、對齊和複盤工作。
找試點場景、找原型客戶,也是絕大多數大模型應用廠家的策略。
是技術黑盒的問題,也是現實投入的窘境
但落地到最終用戶那裏,由于企業業務邏輯、組織形态的千差萬别,大模型從 " 測試 " 到 " 全面落地 ",是 ChatGPT 還是 "ChatPPT",仍存在一定迷惑性。
" 我們沒說我們已經做到了,但是能在客戶剛好有這麽一個強需求的時候,給客戶做個技術參考,因爲有時技術太前沿的話,客戶管理還跟不上,這也隻能讓客戶産生一種垂涎三尺的感覺。" 一位 HR SaaS 團隊負責人 A 對钛媒體表示。這家企業目前計劃在 SaaS 版本融入第三方 AI 大模型能力,在問及是否已經落地時,該負責人不置可否。
在上述不同廠家的内測産品描述中,大模型并沒有在各自領域的應用範式帶來颠覆性改變,更多是針對不同環節增加了多一項交互方式的選擇,衡量的标準無非是 " 夠不夠理解人類語言,能不能産生相關智能化動作 "。換言之,智能化水平強弱并非由軟件所決定,而是由背後使用的大模型決定。
客觀上,大模型是個概率模型,生成什麽樣的内容完全屬于改變,想要取得更精準的結果還受限于數據、場景、人才、成本等問題,這都跟現實條件的投入情況相挂鈎。另外,應用廠家還會選擇跨多個模型開發,目的是降低因模型企業經營和政策引發的潛在風險。
這是作爲大模型面向市場必須考慮的問題。
據 Oracle Cloud HCM 産品負責人透露,Oracle 産品約 80% 的叠代都是由客戶需求推動。目前 Oracle 已經确定了 100 多個人力資源生成人工智能的高價值場景,如輔助編寫、推薦方案、彙總等,并且才剛剛開始。
Oracle Cloud HCM 是以 OCI 雲平台爲基礎,内嵌生成式 AI 相關能力。一方面,客戶可以使用自己的數據來優化模型,平台提供對客戶敏感信息和專有信息的保障,同時,通過内置提示詞生成更符合用戶需要的内容,同時減少事實錯誤和偏差。
爲盡可能将大模型适用于企業級場景,包飛指出,目前用友的解決方案是,一部分會依賴于專家經驗,同時也會實現業務化的流程管控,包括在大模型更上層增加一個管控層,針對于生成結果進行可靠性和合規性管控。
而在 8 月大模型監管法規出台之後,i 人事會優先考慮國内大模型以及開源大模型。對于通用的一些信息,如 " 法律助手 " 中的法律法條等公開數據,會使用國内大模型來完成訓練和微調;而對于與企業、員工相關的信息,則考慮使用開源模型,自主完成訓練,以保障個人信息的安全。
王景飛指出,模型訓練過程中勢必需要自身積累的 " 私域 " 數據,爲保障企業訓練大模型的數據合規,目前底層的基礎模型大模型提供方,提供了一些接入能力,允許私有數據庫接入大模型,與大模型結合使用。除此之外,大部分國内大模型在其他方面的數據安全方面提供了支持。
與此同時,應用廠商接入大模型并不順暢。
某 HR SaaS 産品負責人告訴钛媒體,"HR 廠商跟 AI 廠商不同,過去雙方是處于一個相互期待對方,但合作相對來講不夠深入的階段。AI 廠商最大的問題是有優秀的算法,但沒有相關垂直業務的數據;業務方有大量數據,AI 能力是相對缺失的。AI 公司的數據以及這種業務公司的這些數據,相對來講會慢慢結合,我覺得這肯定是個趨勢。"
比如在大模型出現之前,這家企業就已經在嘗試 AI 面試,盡管有不少企業在嘗試這一新鮮事物,但其應用還不是很廣泛。這家企業認爲,決定企業是否選擇 AI 面試作爲應用場景,取決于所招聘的崗位、AI 面試能力的可信度等," 在實際場景中,用人單位對 AI 面試評價候選人的能力存在疑慮,系統評價候選人的标準不一,是否客觀可信,都有待驗證,也需要一個時間去接受。"
而上述創企負責人 A 也指出,在産品層面會跟友商合作,或自主研發,也會一些互聯網公司對接,直接封裝其技術方案。
"AI 在 HR SaaS 領域的應用比較有限。" 這家企業所涉及的 AI 産品主要有:簡曆解析、身份證 / 銀行卡自動識别、人臉識别、電子簽名,應用環節主要圍繞在了人崗匹配和招聘模塊。
在薪酬環節,很多中大型企業的薪酬體系還是比較複雜的,包括傭金、獎金的計算,如果是靈活用工的派遣方式,薪酬體系有的是按時的、有的是按件計算,同時實踐過程中,這些數據來源有很多,也就是系統很多,如果無法做接口(稅、社保、銀行、政府),那麽就需要其他技術将數據同步起來。
"當前大模型的成本相對來說還是比較高的,所以對于高頻低價值的場景和低頻高價值的場景,性價比差異就會比較大。i 人事目前推出的人事法務助手、勞動合同風險分析、績效輔導專家,屬于低頻高價值場景,同時,我們也在積極探索高頻高價值的用戶場景。" 王景飛告訴钛媒體。
爲此,i 人事首先選擇績效環節,成本方面是考量之一,更重要的是 i 人事基于 " 人力資源管理專家 " 數字角色的考量。績效管理,尤其是 OKR,需要大量方法論和實踐結合才能做好。i 人事會提供大量專家,通過賦予 AI 這些專家的能力,将專家影響力發揮到最大。
在王景飛看來,應用方想要安全、便捷地用好基礎大模型還得從以下幾個層面着手:
(1)采用向量數據庫配合大模型使用。自建向量數據庫用來存儲客戶的數據,這些數據隻存儲在 i 人事的服務器中,不會對外部模型開放。
(2)采用自建大模型。針對一些垂直領域的大模型,如 " 人事法務助手 ",需要大量的文檔和數據積累,自建模型 + 微調的方式會更合适。i 人事也在自建模型的基礎上,基于法律的特征進行微調。
(3)采用數據脫敏。有些數據一定需要外部大模型進行分析的,就可以将這些數據脫敏之後傳輸給大模型。脫敏之後的數據,在大模型看來隻有一串數字和一個标識數據所有者的一個随機 ID,大模型在完成分析之後将對應的 ID 返回 i 人事系統,然後 i 人事在内部完成映射之後,返回給客戶。
反思
其實不止 HR 賽道,其他行業同樣面臨大模型落地的難題。
4 月,釘釘搶先展示了其智能化成果:通過接入阿裏通義大模型,在群聊、文檔、視頻會議、應用開發等四個高頻場景實現 AI" 魔法棒 " 能力。從最近成效來看,在超過 50 萬家企業内測後,釘釘 "AI 魔法棒 " 正式上線,在釘釘聊天、文檔、知識庫、腦圖、閃記、Teambition 等 17 項産品、60+ 場景全面開放測試。
談及接入大模型的過程,葉軍在此前與钛媒體交流中談到兩點:一是在交互層,做釘釘各個産品應用界面和千問大模型 API 的連接,二是模型之間的對接,千問大模型需要來自于知識庫文檔的一些通用文字文本。
在葉軍看來,與大模型對接不難,難的是怎麽将釘釘平台上不同的業務系統與大模型實現對接。" 現在釘釘上面的很多數據是有業務含義,對接模型就複雜一些,理論上它不是傳統意義上的大模型,而是有一定行業特征的,或者有一定應用系統結構化的一些中型模型。所以對接我覺得投入的時間周期會更長,這也是企業級應用跟傳統通用搜索之間很大的差異。"
關于商業化,葉軍表示釘釘會考慮兩種模式:一是針對比較高價值的商業服務,直接做訂閱式收費,将其組合到釘釘專業版、專屬版、專用版的底座;二是會參考 Midjourney 的收費模式,按照調用次數一次性付費,如釘釘個人版可能首先嘗試走這個模式。
而由于釘釘本身連接了非常多的生态應用,怎麽通過釘釘讓 SaaS 創企去直接調用平台的模型能力,對 SaaS 産品進行改造,這是作爲平台應用所能承載的事情。上述釘釘與 i 人事的合作,或許會是未來典型路徑之一。
" 對于企業應用而言,大模型是需要訓練的,不僅效率要高、準确性要好,這跟寫個散文或簡單的人機對話完全不同。" 談及 Oracle(甲骨文)在 HCM 領域的大模型實踐經驗時,甲骨文公司副總裁及中國區董事總經理吳承楊告訴钛媒體。他認爲,Oracle 的特點在于,已經在跟 Cohere 這樣的大模型企業密切合作,同時在數據層面,會将向量搜索與存儲在 Oracle 數據庫的客戶業務數據相結合,加之 RAG 架構等生成式 AI 技術," 隻有這些技術結合起來,才會有一個颠覆性改變。"
所有軟件都值得用大模型重寫一遍——這樣的結論是理想主義的樂觀遠眺,但在企業實際的場景和業務當中,還要考慮 " 是否值得 " 的實際考量。
再回到 HR SaaS 與大模型的結合當中,跟 " 人 " 高度相關的簡曆信息、面試信息、勝任力評測等信息,如果大模型能夠用更精準的專有數據訓練,那麽這個 HR SaaS 系統将是企業效能最高的管理終端,但是這個包含個人高度隐私的數據是否獲得個人授權,用于訓練?所以現階段用數據,用什麽樣層級的數據?怎麽用?用到什麽地步?其中所要承擔的風險與收益,都是廠商必須考慮的,而并非一味追求技術的先進。
當下,許多招聘平台都在緊密的與大模型産品 / 服務積極接入或者合作,但得到相對成熟應用場景的确實不多,招聘場景、面試陪練場景、人才測評場景,這幾個場景的數據恰好介于公有數據和專有數據之間,就是所謂巧妙地用到合适層級的數據,用于這些對企業以及面試者雙向獲益的場景中。
值得一提的是,盡管企業可以接入開源平台訓練大模型,但勢必要遵守更加嚴格的合規和安全保護準則。目前業内已經在警醒開源技術關停的風險。接入開源平台,甚至私下使用 GPT 進行内測,都在冒巨大風險。
目前看來,HR SaaS 的場景中 " 選、用、育、留、離 " 大環節中的千百個場景,都需要 HRSaaS 廠商去一一試錯,這個成本或許跟重寫一套産品也相差不大了。
此外,能否商業化才是生成式 AI 的終極命題,至少在 ToB 市場裏,技術要爲商業服務才是本質。
無論是選擇開源大模型蒸餾,還是第三方 API 調用,企業和廠商都在躍躍欲試,不過對 AI 大模型的應用最終是提供給員工一款場景應用。外界普遍期待 AI 能将一線人員從繁瑣、危險、重複性的工作中解放出來,但現階段,生成式 AI 主要隻是在各自領域增添了新的功能體驗。未來還會有更多 AI 技術的加持,但它會對企業産生多少經濟價值,是否足以赢得客戶方與一線員工的共同認可、買單……這條 AI 應用的探索之路才剛剛開始。
(本文首發钛媒體 APP,作者 | 楊麗)