圖片來源 @視覺中國
文 | 财經無忌,作者 | 白嘉嘉
近日,一則新年問候視頻刷屏了互聯網。
視頻裏,馬斯克、比爾蓋茨、貝克漢姆等海外名流用一口字正腔圓的漢語,祝賀大家新年快樂,話語間甚至用上了 " 一帆風順、兩全其美、三陽開泰 " 這樣 " 高端 " 的表達技巧。
評論區裏,除了 " 普通話說得真好 " 的褒獎,有一部分眼尖的人認出來,這組視頻其實是通過 AI 技術生成的。
作爲 AI 的分支,數字人堪稱 2023 年最炙手可熱的商業故事之一。隻要幾千元的成本,再花上一些時間錄制音頻和視頻,大模型就能訓練出數字分身,從嘴形、說話節奏到肢體語言,幾乎和本人一模一樣的。
然而,這片藍海最近起了一些波瀾——一家叫 Heygen 的數字人企業,遭到了行業頭部企業的聲讨。
Heygen 是它的美國名字,在國内,它叫詩雲科技。兩邊都注冊公司的直接收獲是,Heygen 可以分别在兩個市場開展業務,卻不需要履行相應的合規義務。
譬如,爲了防止 AI 技術被用于違法行爲,國内的企業在爲客戶提供服務時都需要進行身份認定,而 Heygen 卻沒有設立相應的機制,不僅破壞了行業的成本邏輯,還讓這個本就年輕的市場更加脆弱。
一個現象是,瞄準中小商戶的流量焦慮,大量投機者利用 Heygen 來制作數字人,并聲稱有技術和能力運營數字人直播,但真正開播後,商戶收到的卻是無盡的違規和封禁。
這個現象背後反映的問題是,數字人産業鏈嚴重割裂,部分掌握技術的廠商爲了擴大市場份額和影響力,故意放任下遊 " 野蠻生長 "。而商戶則被部分服務商過度吹噓數字人能力的話術蒙蔽,成爲了惡性競争的代價。
數字人亂象:貼牌、套殼、盜版 ......
2023 年 7 月,孫旭感受到了餐飲市場的寒意,他頻繁地在朋友圈刷到同行關店或轉行的消息,剩下的另一部分同行,正爲了自救猛烈地推出各種優惠活動。" 這個行業淘汰率一直不低,但今年(2023 年)明顯更高了 ",他說。
2023 年堪稱餐飲業的 " 死亡之年 "。 企查查數據顯示,2023 年 1 月到 9 月,全國餐飲累計吊銷 99 萬家,是 2022 年的 4 倍。其中僅 6 月就吊銷了 18.05 萬家,包括一些曾經在行業内有一席之地的頭部品牌。
眼見市場越來越卷,孫旭想找一些新渠道來爲店裏引流。直播是他的首選,但一上鏡就怯場,另招一名主播又太貴。後來又嘗試約了一些本地的小網紅來探店,但轉化率同樣堪憂。
或許是因爲算法 " 洞察 " 了孫旭的意圖,幾個數字人視頻被推送到了他的手機裏。
雖然當時還沒出現泰勒斯威夫特的爆款視頻,但那些被抛出來的成品已經足夠逼真,幾乎分辨不出來與真人的區别。這類視頻往往遵循同一個套路,在片頭讓觀衆猜接下來出現的幾個人中誰才是數字人,在片尾揭秘其實都是數字人。
如果追根溯源的話,這些視頻确實都由數字人技術制作而成。但推送這些數字人視頻到 " 孫旭們 " 面前的,卻未必是具備全鏈條能力的公司。
爲了降低用戶使用門檻,頭部數字人公司往往會提供一批公共數字人給不願意克隆自己形象的用戶選擇,就像在遊戲裏選擇角色那樣。同時,爲了讓更多人願意嘗試這項新技術,企業往往還會提供一定的免費時長。
這些 " 福利 " 爲大量不具備底層技術和運營、開發能力的公司提供了鑽空子的餘地。它們直接以個人的身份在頭部企業的官網定制視頻,并用來爲自己的公司招攬業務,更有甚者選擇直接搬運其他公司的視頻到自己的引流賬号上。
在尋找數字人公司的過程中,孫旭幾乎 " 挑花了眼 ","198 元 AI 虛拟主播數字人 "、"17.6 元虛拟主播教程 " 等廣告比比皆是。期間他也感到過不對勁,總感覺對方提供的樣品中有一些面孔很眼熟," 現在想起來可能是在短視頻上刷到過 "。
其實不光是用戶,頭部企業也對市場上的套殼、貼牌亂象頗爲頭疼。
成立于南京的矽基智能是國内頂尖的數字人廠商之一,與北京的風平智能一同被稱爲數字人界的 " 南慕容,北喬峰 "。
矽基智能創始人司馬華鵬曾在接受财經無忌采訪時表示,矽基智能的數字人視頻經常被其他人盜用去吸引客戶。 這些公司不具備後期運營能力,無法幫助客戶取得較好的收益,但很擅長通過營銷引流,用破壞市場的超低價來招攬客戶。
事實上,數字人行業的亂象已經在一定範圍内引起了社會的關注。定焦、自象限、AI 技術評論等多家媒體均展開過相關報道。
亂象叢生因爲數字人 " 太年輕 "?
數字人行業之所以顯得亂象叢生,本質上是因爲它還 " 年輕 "。
數字人年輕?可能許多從業者不會接受這個看法,如果從手繪數字人起算,這門技術已經發展了接近 40 年。
但很長的一段時間内,數字人制作隻能通過手繪、CG、動作捕捉等手段,成本高昂且智能水平不足,與其說它是數字人,更像是一個沒有靈魂的數字皮套。
2018 年雖然得益于深度學習算法的進步,數字人制作成本從萬元、幾十萬元降低到了千元級别,但本質上解決的仍是數字人的外形問題,沒有形成真正的生産力,因此 2019 年和 2020 年數字人創業潮很快就回歸了平靜。
直到 2023 年,以 ChatGPT 爲代表的大語言模型帶來了賦予數字人 " 靈魂 " 的曙光,行業才迎來了它真正的質變。來自清華大學的《數字人研究報告 2.0》顯示,2025 年數字人産業規模有望超過 1000 億。
前景廣闊的背面是市場缺乏對數字人的共識。
目前," 數字人 " 的概念非常寬泛,從動畫作品裏的虛拟角色,到微軟小冰,再到通過全息技術 " 複活 " 的鄧麗君,甚至是讓照片 " 動嘴 ",都被裝進了數字人的口袋。
消費者除非對數字人進行了深入的研究,否則很容易被賣家 " 數字人隻能這樣 "" 這就是數字人 " 的話術迷惑,認爲這隻不過是又一個商業噱頭。
年輕帶來的第二個問題,是市場也還在适應這項新技術,規則常常發生變化。
2023 年 5 月,抖音發布《抖音關于人工智能生成内容的平台規範暨行業倡議(以下簡稱數字人行業倡議)》,率先開放 AI 生成的圖片、視頻和數字人直播,但同時也意味着數字人要被 " 管 " 了。
《倡議》在圈裏掀起了不小讨論,作爲最容易變現的領域,許多企業都寄希望于用數字人來降本增效。但同時,随着數字人直播間的數量增加,質疑聲也越來越多,諸如效果太假、市場混亂、價格不透明等。人們開始關心,在已經信息爆炸的情況下,是否要允許 " 生育能力超強 " 的數字人來搶占大家本就已經碎片化的時間。
雖然目前還沒有其他平台跟進,但國家層面的立法卻從未停下,幾乎每個月都能看到新的規範或法規出台。
變換的市場規則考驗着上遊數字人供應商,即便有心踏實做生意,在團隊規模有限的情況下,也很難将服務做紮實。 目前,數字人直播間和賬戶被封仍是用戶反饋最多的問題之一。
專業才是數字人唯一的出路
在被封了 3 次之後,孫旭逐漸意識到,自己似乎被割了韭菜。
最初他對數字人員工很滿意,曾經用它連續 13 個小時賣門店的團購券。雖然過程中數字人對觀衆的提問置若罔聞,但當時他相信自己已經坐上了新時代的便車,數字人越來越智能隻是時間問題。
然而問題很快就出現了,因爲被判定爲錄播,孫旭的直播間迎來了它的第一次封禁。
錄播是目前數字人直播最容易踩的坑之一,它隻是根據提前錄入的腳本循環播放數字人視頻,與背靠大模型實時生成内容的數字人有本質區别。這些區别很難用肉眼辨别,但在數據監測後台上卻能被一目了然地辨認出來。
" 最早一批嘗試數字人直播技術的商家,很多是被錄播割了韭菜。" 數字人代理公司負責人張現說,很多商家此前沒做過直播,不熟悉平台規則,但對數字人很感興趣,花萬八千,從代理商那裏買到一款錄好視頻的數字人,但很容易被封 "。
除了錄播,數字人質量差、口型對不上、交互能力低下、視頻質量等問題均有可能導緻客戶的使用體驗下降,甚至封禁。雖然有些公司提供指導服務,會一步步教客戶如何解封直播間,但整體來說,仍沒有公司能保證不會被封号。
不過也有一些企業确實利用數字人實現了效率翻倍。
矽基智能透露,某酒旅行業頭部品牌的數字人直播間内,2023 年已經收獲了超過 10 億的 GMV(商品交易總額);某咖啡品牌的單一數字人直播間,僅在單日的 5 小時内,就收獲了 85.6 萬的營收。
爲什麽有的人能用數字人賺錢,有的人不行?
本質上,數字人仍舊是一款工具,而不是具有主觀能動性的人,它所能發揮出的潛力,與使用者對行業的理解程度高度相關。換而言之,隻有懂得 KnowHow 的人,才能用好數字人。
以最基本的交互爲例。爲了防止大模型幻覺導緻數字人在直播間内胡說八道,市場上 90% 以上的數字人公司使用的都是 " 關鍵詞匹配 " 技術。通過關鍵詞來匹配問題和答案,隻要觸發了關鍵詞,它就能匹配到并反饋給觀衆。
機械的匹配機制下,數字人直播間往往枯燥乏味。但如果直播間運營商儲備了相應的語料庫,知道主播說哪些話、怎麽安排直播節奏能調動直播間氛圍,即便同樣基于 " 關鍵詞匹配 " 技術,直播效果上也會呈現出較大的差異。
客觀來說,數字人直播的門檻其實并不低,它既需要客戶對技術有一定了解,能分辨錄播與真正的數字人之間的區别,還需要客戶對直播行業有基本的常識。
指數起量,打破真人直播的上限,24 小時無休……這些詞句常被用于介紹數字人的優點。與單獨的個體相比,數字人固然在 " 繁衍能力 " 和 " 勞動時長 " 上有先天優勢。但如果放到整個直播大盤中,24 小時無休和主播數量爆炸早已經在多年前就成爲了現實。
或許,直播平台并不在意屏幕前的那個是數字人還是真人,嚴密的平台規則和推薦機制已經注定,隻有 " 專業 " 才是突出重圍的殺手锏。