當 AI 賽道來到下半場,如何真正借助大模型引領各行各業發展創新,成爲頭部互聯網企業的必争之地。(雷峰網雷峰網雷峰網)
放眼全球,企業對大模型的需求日益增加,這不僅因爲其強大的數據處理和分析能力,更因爲其在實際應用中的出色表現。大模型通過預訓練大量數據,提升了模型對内容的理解力和生成力,面向行業,無論是在市場營銷、辦公提效,還是客戶服務等方面,如何将更好的将大模型進行業務場景化落地,始終是企業關心的核心問題。
百度作爲全球領先的技術公司,率先推出了文心大模型等系列大規模預訓練模型,這些模型通過整合海量數據和知識,成爲多個應用場景的技術基礎。
今天,百度的文心大模型在金融、醫療健康、旅遊、專業咨詢服務、内容創作與 AI 作畫方面的應用均展示了其在跨模态、跨語言情景下的深度語義理解與生成能力,以及在搜索問答、内容創作生成、智能辦公等衆多領域的應用潛力。
在其自主研發的百舸 AI 算力平台,更是通過對底層硬件資源的優化,提高了模型的運行效率和資源利用率,幫助企業更高效地進行大模型的開發和部署。
盡管 AI 大模型已經 B 端爆發,爲各行各業帶來巨大價值,但在下遊行業的大模型落地中,仍面臨一系列相關場景挑戰。比如投入成本大于可見收益、應用效果不達預期、以及後續模型效果退化等問題屢屢出現。
11 月 6 日,百度智能雲舉辦百度世界大會 AI 應用媒體沙龍,特此分享百度 TO B 市場的企業級應用産品的落地效果,并邀請百度智能雲技術委員會主席孫珂、百度智能雲數字人産品部總經理張裕翔、百度智能雲智能客服與智能内容産品部總經理張紅光等三位專業人士在現場做了分享和交流。
以下是媒體與三位嘉賓在會上的對談實錄,雷峰網在不改變原意的情況下做了編輯和調整:
01 用戶正向反饋,百度智能雲 " 客悅 " 幫助企業節省運營成本
Q:關于百度智能雲客服客悅這款産品的用戶反饋如何?
張紅光:過去智能客服無法感知到用戶情緒,比如說複雜的多主語問題,但現在客悅有能力去解決這些問題,通過語音引擎(ASR/TTS)來識别和表達用戶語音,專門适配電話場景、定義溝通場景和回答方式,并對通話數據進行結構化分析和标簽打标,提升業務洞察能力,最關鍵的是,能在一定程度上減少轉人工率,節省了企業的運營成本。
張紅光:這次我們在世界大會推出的大模型智能外呼,還能夠幫助企業節省人力成本。這是因爲有很多企業在做線索篩查和聯系用戶時,80% 時間都是在撥打一些無效電話,大模型智能外呼可以替代人工重複性工作進行初篩,甚至還可以洞察出某些高意向用戶,轉人工跟進進一步溝通。并且與用戶溝通過程中能夠保持拟人、友好的交互,這些都是大模型加持下的智能客服,給客戶帶來的新的産品體驗。
Q:針對不同行業的落地應用,百度有哪些定制化?如何降低定制化工作的成本以達到最優狀态?
張紅光:以智能客服客悅的市場經驗來看,目前大部分應用還是在一個場景裏橫向滿足用戶需求,定制化主要體現在企業使用的過程當中,比如作爲一個客服,既要跟 CRM、銷售管理流程貫穿,還要在數據收集系統裏,所以就需要對接不同的系統,這就需要定制化的工作。
張裕翔:以百度智能雲的數字人爲例,提升它的應用集成效率速度,就能降低數字人在不同端的訓練能力和開發成本。比如過去最早做定制項目可能 30% 是數字人相關,70% 和用戶相關,關注的是系統要如何融合打通的問題。但現在轉變過來,整個業務裏 70%-80% 都是跟數字人效果能力強相關的,比如怎麽在一個視頻裏去優化數字人的動作等,這背後都是源于客戶對于大模型認知的轉變,客戶開始更加關注應用場景的落地價值。
目前百度智能雲在标準 SaaS 場景應用中,也會更側重于大場景上的通用能力,比如數字人視頻,雖然很難将教師視頻、醫療視頻,甚至一些非常大的場景做的非常細緻,但在整個數字人的生成合成層面是可以做到最優的。
02 解析數字人的應用場景,以及定制化解決方案
Q:站在數字人角度,現在更被大家所接受或者大家願意應用的是 2D 還是 3D?
張裕翔:整體來看,頭部企業客戶喜歡用 3D,中小客戶和廣泛用戶喜歡用 2D,這也跟客戶的使用場景相關。
比如,在一些科技類企業,要做金融報告的解讀和對外宣傳時,會傾向于使用 3D 形象,包括在一些文旅、地方科技館的服務場景,也會使用 3D 形象多一些,因爲 3D 形象更具備科技未來感,能夠從互動感受上帶來更新穎的體驗。
Q:針對 SMB 客戶和 KA 客戶,如何定制化解決 2D 跟 3D 的數字人的産品形态?
張裕翔:其實差别并不大,因爲基礎應用場景無非是視頻、對話、直播這三個場景,雖然從技術角度看,數字人視頻一對多異步渲染、數字人對話是一對一的實時渲染、數字人直播是一對多的實時渲染,但是其實從底層能力的角度來看是幾乎一樣的,無非是驅動人像技術及其算法模型應用上略有差别。
比如要解決 2D 形象如何拍視頻的問題,讓動作呈現出更多樣性,突破原來的拍攝内容。理想情況就是用自己的形象拍一張照片或者一個視頻,通過授權後,無論是在出席發布會或者做講解視頻等場景下,都可以把形象做出來,這就是未來理想化的一個狀态。
3D 層面則相對簡單一些,因爲 3D 本身在遊戲場景中就包含了動作系統和語言系統,但問題在于,如何讓普通人以更低的成本,或者像企業級應用那樣,實現高指向性和準确性的驅動,這是目前正在解決的調優問題。
03 解放雙手,文心快碼如何助力程序員
Q:文心快碼往外推的時候,程序員對文心快碼的信任度高嗎?
孫珂:其實從内部的測試來看,一開始推廣的時候程序員也會有排斥心理,但随着他的使用頻率增強,逐漸會感受到對工具的依賴性也在慢慢變高,就會發現他的代碼生成量占比和采納率在往上漲。
整體來看,程序員群體對新技術接受度還蠻高,但他們關注的點不是信任與否,而是産品本身能否跟程序員做一些交互上設計。
Q:如果要将文心快碼推廣到市場,中間會不會經曆所謂的教育用戶過程?
孫珂:其實這個過程我認爲不是教化邏輯,更多是互相成長,如果仔細觀察就能發現,在市面上有非常多的代碼輔助類産品,但卻有三個不同的區别,一個是比較常見的用 IDE 加 plugin 的一種形态,跟程序員進行一個陪伴式的編程;另外是稍微接管多一些,在 IDE 裏面會幫你嘗試做更自動化的編程嘗試;還有一些很激進的廠商或創企,它會直接邁到所謂 Out coder 的過程,從 PRD 開始自動生成。
因此,整個過程其實是逐步根據當前應用基于大模型,針對程序員需求的一些解法逐漸進步,而最終大家都會趨同都會走到那個平衡點上。
Q:文心快碼目前在哪些行業應用成熟?
孫珂:首先是金融行業,特别是銀行、證券等對代碼類的工具需求非常多,第二是泛科技或者泛互聯網行業,這些新興企業也應用比較廣泛。
第三是傳統的軟件開發,最後一個則是制造業,包括一些汽車行業、工業行業等。
Q:站在基礎設施角度,這次我們産品升級帶來哪些差異化優勢?
孫珂:基于一個統一的底層架構具有諸多優勢,其中之一在于我們的模型服務。
無論是大模型還是傳統的 AI 模型,如何運行這些模型并提供一個穩定的接口,以保證其吞吐量,包括如何對這些模型進行優化是一個重要的問題。百度智能雲千帆這樣一個 PaaS 平台在應用之下爲我們提供了完整的相關服務,包括模型效果、推理性能等系列工作,千帆平台都提前爲我們做好了,這極大地提升了我們産品的研發效率。
其二,還需要适配底層的硬件資源和基礎中間件。目前可能有幾十種底層的硬件配置方案,要想讓應用程序高效地适配所有這些配置,是一項非常複雜的工作。如果每個應用程序都需要直接适配各種底層硬件配置,那麽複雜度的數量将是一個天文數字。
但在我們的底層基礎設施百舸平台上,無論是公有雲還是私有化部署的環境下,都可以屏蔽底層硬件相關的适配工作,讓我們可以更聚焦産品本身的工作。因此,對于我們開發應用而言,實際上隻需要關注一個平台即可,而且隻需要關注一套效果。
這對我們整個上層應用的蓬勃發展和提升效率都是非常有幫助的。