圖片來源 @視覺中國
文|第一新聲,作者|夏雨,編輯|也行
據 IDC 預測,中國數字人市場規模預計到 2026 年達 102.4 億元。這其中不僅包括正在快速發展中的 B 端市場,還有被視爲潛力股的 C 端市場。尤其是在 AIGC 大模型高速發展的當下節點,數字人的滲透率将會增強。
目前,諸多廠商已經入局。今年 8 月,華爲宣布推出盤古數字人大模型,可幫助用戶 12 小時完成數字人生成。此前騰訊推出了一些基于特定場景的虛拟數字人,如平安普惠數字員工、新華社主播 " 新小微 "、航天員 " 小诤 "、3D 手語翻譯官 " 聆語 "、故宮博物館導遊 " 福大人 " 等。阿裏巴巴的虛拟數字人爲自身業務需求服務,仍是以直播帶貨爲主 ......
那麽,在 AIGC 大模型浪潮下的數字人發展情況究竟如何?數字人将會應用到哪些場景?面臨哪些技術挑戰?成本多少?本篇内容對話了心識宇宙産品 VP 陳陽、世優科技創始人 &CEO 紀智輝、行業從業者李元(化名)等,試圖解答上述問題。
01 AIGC 加持下,數字人開始狂飙?
騰訊發布《數字人産業報告》中,将數字人界定爲 " 以數字形式存在于數字空間中,具有拟人或真人的外貌、行爲和特點的虛拟人物。"
2023 年,随着 AIGC 的強勢崛起和類 ChatGPT 語言大模型的問世,數字人賽道變得越發熱鬧起來。開始頻繁出現在各大應用場景,以及文旅、電商、金融等多個行業,形形色色的虛拟數字人正代替真人,充當着代言人、主播、播報員、客服和智能助理的角色。
市場的參與者也肉眼可見變多。互聯網大廠、創業公司、老牌 AI 公司和一些此前做智能客服營銷的數字服務商和資方都躬身入局。
銳觀網數據顯示,截至 2022 年 12 月,中國數字人行業投融資事件超過 140 件。據 IDC 發布的《中國 AI 數字人市場現狀與機會分析 2022》報告中,預計到 2026 年中國 AI 數字人市場規模将達到 102.4 億元。
對于數字人産業越來越熱的現象,多位受訪人總結出三個原因。
一是從技術上來看,AIGC 的出現解決了數字人 " 隻會念稿、不能交互 " 等諸多痛點。 生成算法提高了内容創作的效率和便捷性,降低了成本和門檻,同時還豐富了内容創作的多樣性和個性化,滿足了用戶的不同需求和喜好。自然語言處理大模型有助于提升數字人交互體驗,讓數字人從過去的 " 沒有大腦沒有靈魂 " 找到了一個比較好的出口。
與此同時,建模渲染、 AI 生成動作捕捉等技術也在不斷的進步,讓整個數字人的表現比普通的 AI 機器人更加像自然人,對信息、知識的挖掘和梳理更充分,對語句的處理更加貼近人類的日常交流表達習慣。
二是 90 後、00 後爲代表的 " 網絡原住民 ",對虛拟角色的接受程度逐漸深入,很容易對虛拟角色投入情感。
三是國内數字經濟的進一步發展趨勢下,讓企業降本增效的經營需求起到了助推作用。
行業從業者李元(化名)同意該觀點,并以直播場景爲例解釋,真人直播需要花費一定成本來搭建直播場景,而且随着抖音、美團等平台開啓本地生活直播,人才缺口也是一個問題,數字人恰好能填補這個缺口,而且能夠做到 7 × 24 小時無休。
" 公司通過 AI 技術在數字人‘造人、養人、用人’三個不同階段均實現成本控制、規模化生産能力。在 AI 産品方面,今年世優科技推出了世優 BOTA、世優 AI 數字人直播系統 AI 數字人産品體系。通過 AI 與數字人的結合應用,實現批量化打造虛拟人,爲行業降本增效。" 世優科技創始人 &CEO 紀智輝說道。
當前,數字人的應用越來越廣泛,無論是 B 端還是 C 端都出現了數字人的身影。清華大學發布的《虛拟數字人研究報告 2.0 版》顯示,數字人已經滲透到各行各業,成爲新一代的生産力和創造力。從頭部企業的布局來看,數字人産品服務在 B 端占有 79% 的市場,而在 C 端占比 36%。
在數字人的 B 端應用場景方面,心識宇宙産品 VP 陳陽坦言:" 主要是做客服、營銷、文旅導遊以及 AI 直播等, 因爲 AI 直播本質上也是在與觀看直播的用戶互動、回答用戶提出的問題。難點在于數字人客服如何快速的爲交流對象提供正确的答案?基于 ChatGPT 大語言模型,數字人可以得到很多信息,但同時也會出現無法準确回答交流對象、甚至是編造答案的現象。這對客服場景會帶來緻命的傷害。"
在數字人的行業應用落地方面,IDC 的相關報告介紹,金融行業是當下數字人應用相對更成熟的領域,到 2025 年,超過 80% 的銀行都将部署數字人,承擔 90% 的客服和理财咨詢服務。 例如浦發銀行是國内最早 " 聘用 " 數字員工的銀行,目前 3D 數字人 " 小浦 " 已經在 20 多個崗位任職,包括财富規劃師、文檔審核員、大堂經理、電話客服等。
此外,企業的數字人可以與内部系統綁定,員工可以跟它交流了解公司的規章制度,查詢各種信息等。
未來,數字人将在醫療、教育、制造等多個領域發揮作用,例如在醫療領域,數字人可以作爲認知智能大模型,輔助醫生進行診斷和治療;在教育領域,數字人可以作爲個性化教學助手,幫助學生提高學習效果。
接受采訪的幾位業内人士都表示,未來 C 端也是一個比較有潛力的市場,未來可能人人都會有一個屬于自己的數字人,但從成本、技術、設備來看,還需要經曆一段時間的發展。
02 難以逾越的成本高牆,3D 數字人成本達 100 萬
想要躬身入局的企業,需要懂得計算投入産出比。
目前,數字人分爲兩類,一類是由人驅動的 " 中之人 ", 是指依靠人力驅動虛拟主播進行直播,這種驅動方式需要進行大量的拍攝及後期工作,成本較高,衆多 3D 虛拟人采用的便是中之人驅動。
另一類是 AI 驅動數字人, 指通過使用機器學習,喂養數據等方式訓練數字人完成特定的任務。這類數字人通常應用于工作重複量高的服務型場景,目前在直播間帶貨的 2D 真人數字人大都屬于該類。
3D 數字人往往以動畫人物形象出現,适用于虛拟 IP 的打造。對于該類型數字人來說,從面部輪廓到服飾場景都需要自定義打造,成本通常會更高,制作周期也會更長,報價超過 20 萬元。
例如英偉達曾在官方博客中稱,黃仁勳虛拟人在發布會上出鏡的 14 秒視頻,共有 34 位 3D 美術師和 15 位軟件工程師協同參與,總計近千工時。
這樣高昂的成本得到了李元的證實,"在傳統的 3D 建模技術下,一個能看得過去的定制數字人,需要幾十萬的成本,這還隻是冰山一角。"
據世優科技 CEO 紀智輝介紹稱,市場一般将數字人成本分爲 3 部分,即造人、養人、用人。第一部分是造人,通過角色創意、原畫、建模、綁定、表情、實時渲染等環節,可按照風格生産出卡通 Q 版,迪士尼人形、二次元、次世代、美型寫實、超寫實等不同風格。價格從幾萬到上百萬不等。
第二部分是養人 ,當數字人被造出之後,還需要低成本、高頻不斷的輸出内容,用數字人生成内容,養出 IP 認知度。例如數字人需要出一條短視頻或者一條 TVC 廣告片,其成本則是根據内容的精度、效果以及腳本内容不同等因素來決定,一分鍾成本從幾千、幾萬到幾十萬不等,主要取決于腳本的難易程度。
第三部分是用人 ,主要是指數字人生産内容後所應用的場景。" 目前,世優科技在用人方面涉及十大應用場景,包括廣電媒體、品牌營銷、電商直播、短視頻、政府文旅、教育娛樂、影視劇、 AR/VR/AI 、NFT、元宇宙等各類線上線下場景。比如數字人做虛拟主播、媒體記者、活動主持人、線下展廳接待員等等。根據客戶的項目需求,涉及相關執行的成本。" 紀智輝說道。
不同類型的數字人所産生的成本差異較大,應用 AI 生成技術研發的 2D 數字人相比之下,成本便宜很多。"整體來說,2D 數字人的成本隻有 3D 的 1/10 或者 1/20,這是目前相對接地氣、市場上容易接受的水平。" 紀智輝說道。
世優科技擁有 2D 數字人相關産品線。2D 不需要建模,生産過程也相對簡單,主要是通過拍攝一段真人視頻後通過 AI 技術訓練而成,造人成本隻需要幾千塊錢。在養人生成内容方面也隻需要輸入腳本,數字人就能講話做到對外輸出,養人成本隻需要幾塊錢 / 分鍾,之後會接近于 0。
當然,2D 數字人并不能适用于所有場景,在遊戲場景和虛拟偶像這樣的賽道中,企業隻能使用高價的 3D 數字人,成本負擔可想而知。而且無論 2D 數字人還是 3D 數字人,都面臨着内容劣勢。
今年 5 月抖音發布 AI 标識令,開始監管數字人這一新物種。在内容上沒有競争力,隻會重複口播的大量 2D 數字人被封禁。紀智輝提到,因爲抖音、快手、微信是内容與電商平台,所以主播必須提供高質量的内容。而 AI 生成的部分内容質量不高,平台就不給流量,最終導緻了東西賣不出去。所以數字人實現高銷量的帶貨,是需要配備運營團隊、好的貨盤等好幾個因素疊加才能把帶貨 ROI 做好。
至于大衆對于 AI 所引發的 " 換臉 "、" 永生 " 等風險的擔憂,李元表示:" 任何新技術的出現和應用都需要一些相應的規範,監管也在做出反應。今年 1 月份,有關部門就出台了 AI 生成内容的一些監管政策。市場内的正規廠商對此也很重視,這些廠商都有自我規範和要求。"
03 三個技術難題,數字人無法像人 " 生動靈活 "
值得注意的是,當下大模型驅動的數字人産品仍處于應用落地的早期階段。除了上述提到的成本制約因素以外外,業界普遍認爲現階段,技術成熟度和效率也仍然是數字人的難題之一。
有研究報告将數字人的特征總結爲 3 點,但技術在這些特征上的呈現均有許多不足之處。
一是數字人擁有人的外觀,具有特定的相貌、性别和性格等人物特征。
" 如果客戶不選擇超寫實數字人,即完全複刻一個真人的狀态,那麽數字人的外觀技術已經較爲成熟了,隻是數字人的表情、動作仍有卡點。但是在沒有真人動捕而是完全通過自我驅動的情況下,數字人很難呈現出自然的表情和動作。" 陳陽說道。
二是數字人擁有人的行爲,具有用語言、面部表情和肢體動作表達的能力。但不少數字人産品在語音、表情、互動表現上目前還比較生硬。
李元認爲,由于數字人缺乏情緒、情感的表達能力,例如在感到生氣或委屈時,無法用更豐富面部表情和更大的肢體動作來呈現,導緻數字人雖然擁有了人的外貌、聲音,卻無法像人一樣生動靈活的原因。
三是擁有人的思想,具有識别外界環境、并能與人交流互動的能力。
" 雖然 ChatGPT 的出現賦予了數字人大腦,但如果市場希望刻畫一個有特定個性,甚至有自己成長經曆、世界觀的一個角色,單純使用 ChatGPT 很難實現,目前整個技術還不能很好的支持這個事情。" 李元說道。
據悉,目前 AI 還不夠智能,這導緻智能驅動型(TTSA 人物模型)的交互型數字人隻能作爲補充型的角色存在(遊戲場景除外),市面上仍以真人驅動的爲主,比如在視頻直播和展台上的充當主播的數字人。
陳陽觀察稱,展台會用全息技術投訴一個角色與訪客互動。AI 驅動的數字人則主要是充當文旅導遊,同時在一些淘寶直播間也會出現,在真人主播無法覆蓋的時間段,會使用這樣的數字人,應用場景比較有限。
不過紀智輝認爲,随着 AI 技術發展,未來 AI 驅動型的交互型數字人市場可能會比較廣闊。真人驅動型數字人會更适合進 3D 空間實時互動,比如 3D 數字人實時互動直播、元宇宙這樣的應用場景。
從年初熱鬧至今,從業者與客戶們也觀察到,市場已經在呈現理性回歸狀态。一些喧嚣和割韭菜類的廠商與代理商等角色在加速出清,希望未來數字人真正爲企業實現降本增效。