圖片來源 @視覺中國
文 | 科技新知
ChatGPT 的橫空出世,算是接管了元宇宙的 " 瘋狂遊戲 "。由後者衍生出的數字人産業,雖然商業路徑屢受質疑,但如今借着 AI 東風,再次被炒得火熱。
除了百度、阿裏等大廠加碼布局外,不少上市企業更是聞風而動,迅速沖到了新市場的牌桌面前。天娛數科、萬達信息、藍色光标、奧飛娛樂等,均提到正在研發相關技術,并且試圖将數字人接入 ChatGPT。
落地到應用上,包括蒙牛、鍾薛高等消費品牌,紛紛推出數字代言人;衆多車企、銀行推出數字員工;薇娅背後的謙尋也在近期被曝出聯合虛拟偶像 " 星瞳 ",開啓直播帶貨的嘗試。
更爲直觀的感受是,打開短視頻平台的直播間,AI 數字人主播已經取代了不少真人主播,進行 24 小時無間斷帶貨,甚至像咨詢顧問劉潤等在更新視頻内容時,也都由數字人代替。
并且與此前不同,新一批的數字人,從外觀上看幾乎和真人一模一樣,口型也和所要說的内容保持一緻,隻是在互動上還常常答非所問,無法實現情緒共鳴。
順應趨勢,以抖音爲代表的各大内容平台,開始規範人工智能生成内容,發布行業規範,給出公開态度,這也意味着接下來的市場爆發或在眼前。
那麽,爲什麽已經 " 涼 " 過一次的數字人突然又爆火?進入 GPT 時代數字人會普及嗎?未來數字人發展還存在哪些難點?有替代真人的可能性嗎?
舊瓶裝了新酒
大多數人會以爲,數字人是伴随元宇宙的概念誕生的,但其雛形問世的時間還要更早。
2007 年,日本公司 Crypton Future Media 就借助 " 初音未來 " 這一 IP 角色在年輕人心中打上 " 虛拟偶像 " 的烙印。盡管 " 元宇宙 " 一詞可以追溯到 1992 年發布的科幻小說《雪崩》,但直到 2021 年 Facebook 更名爲 "Meta" 後," 數字人 " 的說法才開始真正走入大衆視野。
中國數字經濟百人會發布的《數字人:數字經濟新賽道》報告稱,整個 2021 年數字人相關企業融資共有 2843 起,融資金額達 2540 億元。
在元宇宙概念的加持下,大衆對數字人的熱情不亞于當初的初音未來。虛拟博主一夜暴漲百萬粉絲的案例比比皆是;更有數字人偶像參加綜藝選秀,甚至 B 站還專門開設了虛拟人直播區。
但風吹過後,有時也很難開出新花。
開發元宇宙業務本就是一項資本密集型的項目,而産業基礎設施目前尚不成熟,這也導緻諸多投資者損失重大。
僅一年多時間,以 Meta 爲代表的互聯網大廠開始因爲元宇宙入不敷出,在紮克伯格一句 " 我錯了,我對此負責 " 後,數字人市場也随之遇冷,逐漸淡出市場視線。
直到 2022 年底 ChatGPT 橫空出世,接棒元宇宙成爲全球科技領域的超級大風口。數字人作爲信息技術交叉融合的前沿呈現,再次被推到了聚光燈下。業内人士普遍認爲,将能夠産生長時間、多輪次、有邏輯文字互動的 ChatGPT 與數字人相結合,那麽一個無限向人類思維靠近的虛拟人即将誕生。
一些熱衷追逐前沿的個人或團隊,率先進行了嘗試。
" 這是我的首個數智人分身。" 在展示了一期由 " 本人 " 出鏡的短視頻節目後,數字經濟學者劉興亮告訴觀衆,視頻中與他形象、音色幾乎一模一樣,甚至同樣夾雜着山西口音的主播并非他本人,而是以他爲原型制作的數字人。
國内著名商業咨詢顧問劉潤更是将其視頻中幾乎所有真人出鏡部分内容,換成了 " 分身 "。
國外擁有 180 萬粉絲的 Snapchat 網紅 Caryn Marjorie,更是開發了 AI 版本的自己,結合 GPT-4,靠利用不同版本的 Caryn AI,和粉絲談戀愛,按分鍾收費。
除了視頻博主,線上講師、帶貨主播、導遊、導覽等職業,也成了數字人批量 " 上崗 " 的熱門領域,相關企業紛紛落地産品。
幾天前,萬達集團首批數字人亮相,這些數字分身采用真人主播形象,并且做到了一人化身多種角色;另外薇娅背後的謙尋也是開始加班加點培訓虛拟帶貨主播;甚至各種定制數字人的廣告都已随處可見。
當然,最讓行業興奮的還是,各大平台對數字人的态度開始轉變。
因爲不得到平台的肯定和支持,博主、商家心裏總會忐忑,擔心賬号有被封禁等風險,繼而讓服務商也無法順利推進和解決行業的需求。不過随着抖音率先公開表态,發布平台規範,預計接下來,會有更多互聯網平台跟進。
與元宇宙時期相比,現在的數字人明顯更加大衆化。一位業内人士直言," 去年數字人還隻是大企業或網紅專屬,現在基本上到了每個人都能有自己數字化分身的階段 "。而在「科技新知」看來,其中原因與大模型爆發、成本下降以及應用場景開拓相關。
供給側突破
從技術實現路徑來看,目前國内的數字人廠商主要以 NLP 技術、多模态融合交互、大模型、XR 技術爲底。
而随着 AI 技術的提升和數據資源的豐富,以及更加先進的機器學習算法和深度學習模型的引入,數字人的智能水平得到了大幅提升。其中多模态 AI 技術使得數字人的交互能力更上一個台階,感知能力、思維決策、内容輸出能力都得到顯著改善,在思想、語言、行爲上和真人更加接近、更加智能化。
此外,ChatGPT 的出現也爲業内提供了發展捷徑。無論在哪種場景下,交互才是數字人的核心。如果說精美的 CGI 僅僅爲這些數字人提供了一層漂亮的皮囊,那麽它還需要一個真正 " 有趣的靈魂 " 和 " 聰明的大腦 "。這就是大規模語言模型的用武之地。
數字人與生成式 AI 的結合,是整個産業發展的關鍵節點,二者正在産生相互作用。中國傳媒大學國家重點實驗室中心首席科學家沈浩認爲,生成式 AI 的引入将爲虛拟數字人賦予 " 最強大腦 "。業内專家也紛紛表示,虛拟數字人有望成爲 ChatGPT 應用的最佳化身和接口。
數字人和 ChatGPT 本質上皆是智能度相對較高的人機交互。虛拟數字人可以向 ChatGPT 發出請求,獲取 ChatGPT 的回答,并将内容呈現給用戶,對于企業來說甚至不需要單獨訓練,便可在短時間内批量生産數字人。目前已有企業在進行這方面的嘗試,例如虛拟技術服務商世優科技。
AI 技術除了給數字人帶來有趣的靈魂外,同時也覆蓋了數字人生産運營全流程,爲行業帶來了更低的成本和更高效率,成爲産品快速普及的基礎。
事實上,高昂的制作和運營成本一度讓不少中小企業望而卻步。以此前火爆的 " 美妝達人柳夜熙 " 爲例,公開信息顯示,其 3 到 4 分鍾的視頻制作周期爲一個多月,成本高達幾十萬元。曾經複雜的訓練樣本數據采集,也導緻數字人定制過程長,一定程度上限制了其快速應用落地。
如今,随着技術進步,數字人的制作時長和成本都在持續降低,甚至不少企業都開始了工廠式批量生産。
最開始,業内做一個數字人需要幾個月,去年是以幾周爲單位,今年做一些 2D 小樣本數字人已經可以達到小時級,并且成本降至千元級别。現在隻需要錄制幾分鍾的真人口播視頻、幾句語音素材形成一個 " 小樣本 ",再通過基于自監督機制的通用多模态模型經過大規模數據訓練,就能獲得與真人形象、語音近似的數字人。
在直播行業,數字人的成本優勢更爲明顯。一名采用數字人直播的企業負責人提到:" 一個 AI 主播定制費用是 8000 元,一年系統使用費 8 萬多元,而一個真人主播平均月薪兩萬元,一年也要 24 萬元,可以省下來 10 多萬元。二十個主播,一年就可以節省 200 萬元。" 這還不算 " 閑時流量 " 所帶來的效益。
更智能的表現以及更低的成本,也挖掘出更廣泛的應用場景。之前數字人主流應用可能僅局限在代言、虛拟偶像等輕度互動場景,現在除直播帶貨外,就連一些博主的日更都采用數字人,另外一些投資顧問、銷售甚至醫院醫師等都逐漸出現數字人的身影。
不過仍要注意,雖然快速低成本生成的數字人在服務性需求契合度上有較大成長,訓練完成基本可以接入應用場景;但客觀來說,更精細的打磨和團隊可控性等等,還都有待完善。
待填的空白
自人工智能問世,"AI 威脅論 " 的探讨就從未停歇。ChatGPT 火爆之際,也有人立刻列出了 " 最可能被 ChatGPT 取代的職業 " 清單,數字人帶貨的爆火也讓 " 取代李佳琦 " 成了直播行業關注的熱點。
不過現在鼓吹 AI 數字人将全面取代主播、大 V 等業态,還屬言之過早。
首先需要明白的一點,現階段的數字人主播,還算不上 " 真正的 AI"。
「科技新知」在浏覽多個數字人直播間後發現,幾乎所有 " 主播 " 隻能根據前期輸入的文本進行複述,動作也是循環播放的,交互能力和随機應變能力幾乎爲零。
另外,并非所有用戶都對數字人抱有好感。" 一旦發現不是真人在直播,我會立刻滑走。" 一位熱衷于在直播間購物的消費者爲此做出了解釋,自己通常是被主播極具特色的個人風格所吸引,而數字人主播即便再逼真,也很難複刻這種 " 人情味 "。" 一個很簡單的細節,你打在公屏上互動的語句,主播都看不懂、無法完成互動,甚至無法展示産品,那直播帶貨的意義何在?"
人機語音交互服務商一知智能 CTO 李一夫認爲,目前生成式 AI 通過大模型形成答案的速度還比較慢,而交互場景對于實時性的速度要求又非常高,所以當前生成式 AI 還不能直接運用到數字人的交互上,這個也是未來需要大模型去解決的問題之一。
從平台角度來看,雖然已經有平台明确爲數字人發放通行證,但平台強調的重點在于内容是否優質,然而在抖音、快手、視頻号上,這些 AI 直播在某種程度上算是經過了包裝的錄播和無人直播,既稱不上優質,也得不到流量扶持。
所以,未來數字人運營人員還是需要花費精力研究如何獲取流量,如何制定更好的内容,并把這些輸入小模型,以生成更好地運行腳本。
其次,數字人技術在應用時也需要十分謹慎。
2018 年圖靈獎得主 Geoffrey Hinton 曾表示,非常擔憂 AI 所帶來的虛假信息傳播。這并非空穴來風,國内外飽受 AI 變臉困擾的明星不在少數。網絡上曝出的以人臉、聲音合成技術爲手段進行詐騙的活動也屢見不鮮。甚至,如果數字人技術用在了直播現場,一旦出現黑客侵入等問題,可能會産生極大負面影響。
因此,在進一步規模化應用之前,數字人技術的安全性保障、數字人運營團隊權限的可控性、相關部門的立法監管等方面都有待完善。
經過元宇宙、GPT 的雙重洗禮,數字人雖已不是新生事物,但行業對其認識還存在不少空白。整體來看,數字人的進化路徑由拟人化走向同人化,最終将走向超人化,實現歸真超實。當然這個過程中,如何給用戶前所未有的情感體驗,讓用戶接納,如何建設好周邊生态,教育好用戶,如何建立行業規範标準,健全監管制度,都将成爲這個新生産業發展的關鍵所在。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App