圖片來源:圖蟲創意
去年 8 月,楊先生得知,多年在外打工的二舅,在工地上意外去世。這個消息要瞞住外婆——她 90 多歲了,身體不好。
楊先生三十多歲,在南京一家互聯網公司做市場工作。他生活中另一次重要的人離世,是 2020 年 NBA 籃球明星科比的去世。楊先生是十幾年的科比死忠球迷,那天淩晨 3 點多鍾被國外的朋友電話驚醒,得知科比墜機,楊先生感覺 " 眼睛裏有東西在打轉 "。楊先生性格内斂,言辭嚴謹,這是他在采訪中少有的柔軟表達。
後來,楊先生用人工智能文生圖模型 Midjourney 生成了一張科比的圖像——科比的臉龐堅毅柔和,四周圍繞着夢幻般的多色油彩。他把這張圖作爲自己的微信頭像。這很簡單,也很便宜,跟畫一張畫的差别不大。
藍鲸财經記者用訊飛星火生成的科比頭像。圖片來源:訊飛星火
但要爲外婆瞞住二舅的去世,是另一回事。
因爲工作關系,楊先生對人工智能的了解和跟進本來就比普通人更多一點。而所有人都已知道,在最近這短短兩三年間,全球 AI 的發展就像脫缰的野馬。于是,在二舅去世之後,楊先生又想到了人工智能能否做點什麽。
他找到一個從事人工智能行業的朋友,基于人工智能的人體圖像合成技術,花了一萬元左右,做了一個數字人舅舅。然後,朋友通過 AI 扮成楊先生舅舅的形象,給他外婆打了一個視頻電話。
楊先生的外婆,等待這個電話已經很久了。
See You Again
去年 8 月楊先生的二舅去世之後,接連就是中秋節、國慶節、春節。
外婆在電話裏問:中秋節回不回來呀?國慶節回不回來呀?春節回不回來?
她不知道對面的兒子是 AI,母子之間話也不多。AI 二舅回答說:工地忙,工期趕,不能回來。
外婆就說:在外面工地工作,要注意身體啊。
視頻電話的場合,楊先生的母親都選擇避開,怕繃不住情緒,都是楊先生在一旁撐着場面。楊先生事先囑咐扮演二舅的朋友,話不要多,簡單問候外婆就行,言多必失。
另一案例中,一老人的兒子去世,用 AI 視頻電話騙老人說在外打工。圖片來源:" 超級頭腦 " 視頻号
用 AI 扮演二舅的這個朋友,是 AI 自媒體 " 超級頭腦 " 的博主張澤偉,他最開始是做 AI 課程,後來開始做用 AI" 複活 " 親人的業務。在張澤偉接收的客戶群中,像楊先生的業務屬于剛需類型,通常是客戶家裏有人去世、入獄之類,要瞞住家裏的老人或小孩,電話那頭的老人或小孩不知道對面是 AI。
因爲要瞞住,要 " 善意的謊言 ",所以對話短平快,以免露出破綻。
"AI 二舅 " 效果逼真嗎?
楊先生說,效果很不錯,能過關,至少外婆看不出來,母親也覺得很逼真。" 像我對人工智能行業有所了解,有一些方式去識破它。當你知道它是假的,你會千方百計去抓捕假的痕迹。但是如果普通人不知道這個技術的存在,你都不會朝這個方向懷疑,就以假亂真了。"
楊先生準備等到年後春天,天氣暖和了,外婆身體好一點之後,再告訴外婆關于二舅去世的消息。但越是到心裏預期的日子,楊先生心裏就越沒底。而外婆被母親接到南京家中,母親告訴她,二舅帶着妻兒到外地過年,外婆也感覺到有什麽事情瞞着她。
在二舅去世後,用 AI 來制作二舅的數字分身,是否符合倫理?
楊先生自己覺得,這事沒辦法說。" 我們互聯網從業者,相對容易接受這個技術。行外人或者老人,比較難接受。"
清華大學新聞傳播學院研究 AI 與大數據的教授沈陽告訴藍鲸财經,數字生命的陪伴能幫助在世者維持家庭結構的穩定性," 親人過世後,如果有數字生命,他每次回家會想,家裏還有個人等着我,還有親人的一個影子可以陪伴自己。"
死者是否享有安息權?沈陽教授表示," 已逝親人本身是否願意把自己的數字生命長期存留于世上呢?我們能否默認爲得到(已逝親人的)允許?這确實是個問題。那死去的人是否擁有安息權呢?他應該在生前決定。未來我們可能需要在民事法律中,做一些界定。"
而楊先生爲總計三次的 AI 舅舅視頻通話付出的價格在一萬元左右,大頭都是前期訓練和生成的 9800 元,每多一次視頻通話加 200 元。不過,這是比較早的價格。此後由于張澤偉工作室接單變多、成本攤薄,而 AI 技術卻在不斷進步,同樣的服務價格也正在下降。
一場心照不宣的心理咨詢與角色扮演
除了楊先生這種需要瞞着親人、互動方式短平快的 AI 視頻電話業務," 超級頭腦 " 博主張澤偉還有另一種業務:需要通過 AI 扮演去世的親人,與客戶進行深入的心理輔導——相比于技術服務,情感服務的成分更大。
有位女士在去年發私信給 " 超級頭腦 ",請求用 AI 技術 " 複活 " 在兩年前意外去世的男友,與男友告别:" 我男朋友兩年前意外離世,特别突然,前天晚上我們還一起吃飯呢。已經兩年了,我真的走不出來,接受過治療,也做過偏激的事。原本計劃好的生活一下全亂套了,我想制作一個和他的對話,正式告别,親口聽他說不要我了,也許我就可以重新開始了。"
張澤偉通過人體圖像合成技術(與 DeepFake 深僞技術原理類似),把自己的臉換成這位女士的男友的臉,聲音換成其男友的聲音,而他自己控制面部表情和對話。
張澤偉用 AI 扮演成女子的已逝男友。圖片來源:" 超級頭腦 " 視頻号
視頻電話開始了。女士看到男友的臉,便抑制不住地哭起來。
張澤偉扮演的 "AI 男友 " 說:" 不哭了啊,不哭了,一切都會好起來的。要不你跟我說說,是什麽事情惹你不開心了?我們一起來想辦法。我知道,這兩年你一定過得很辛苦,最苦最難熬的兩年,咱們都堅持過來了,不是嗎?"
女士哭道:" 你怎麽不打聲招呼就走了,我想你啊。"
"AI 男友 " 一直語氣溫柔和緩:" 我一直都在啊,我心裏一直都有你,我永遠都會陪在你身邊的。不哭了,你看你這麽年輕漂亮,會有人替我來愛你的,我已經很知足了,因爲在我心裏面,我已經娶過你一次了。"
最後當女士哭得不能自已時,"AI 男友 " 的語氣變得硬起來:" 你清醒一點,我今天就是想告訴你,我們已經分手了,我們結束了!"
像這類需要深度心理互動的業務,除了應用 AI 技術模仿人的外貌和聲音,張澤偉還會請心理咨詢師扮來扮演去世的親人。心理咨詢師的費用也是人力成本的一部分。
與楊先生的外婆不一樣,這類客戶也心知肚明,屏幕對面的親人是虛拟的、AI 制成的,這也是他們一開始向張澤偉提出的需求。
這是一場雙方心照不宣的角色扮演,一場心理咨詢。
張澤偉會提前跟客戶簽協議:一方面保護客戶隐私,一方面約定好虛拟數字形象不能用于任何違法違規的途徑。如果客戶要 " 複活 " 去世的親人,需要提供如戶口本等關系證明,來證明兩者之間的親人關系。
張澤偉最開始接收這種業務時,内心會複雜。他說自己是生活樂觀、性格簡單的人,沒有經曆過太多痛苦,一下子要接觸幾百名客戶的痛苦經曆," 對人的沖擊很大,最開始我晚上會夢到他們的事情。" 但他後來逐漸适應,業務做多了之後,承受力更強," 就跟醫生做手術一樣,一開始見血會暈,但事情經曆多了,人也麻了。"
清華大學沈陽教授向藍鲸财經表示:" 盡管目的是爲了心理支持,但 AI 模拟的親人不能完全代表真實的人。這種服務可能會讓一些客戶産生誤解,以爲他們真的能與已故親人溝通,也有可能引發心理創傷和依賴,或幹擾正常的哀悼過程。需要考慮這種服務在長期産生的影響,包括是否可能促成對已故親人的不健康依戀。"
對于去世的人,不可能活體采樣,所以客戶在世時留下的數據量是關鍵。張澤偉介紹,要制作 AI 視頻電話,去年需要的數據量,大概在 20-30 分鍾的聲音樣本、1-2 分鍾的視頻樣本量。由于大模型技術的升級叠代,今年隻需要 15 秒左右的聲音樣本和 10 秒左右的視頻樣本。當然,樣本量越高,數字形象的拟真度越高。
樣本量越少,所需的制作時間越長,人力與技術成本越高。張澤偉介紹,如果隻有一張照片、幾秒鍾的語音,那麽需要半個月才能達成将親人 " 複活 " 成視頻電話中的形象,技術 + 人力成本需要七八千元左右。
吃螃蟹的人:AI 在中國 To-C 落地的生意
" 超級頭腦 " 博主張澤偉稱,自己最開始收到客戶的想要 " 複活 " 親人的私信需求時,是免費爲他們提供服務的," 一兩個月時間裏,世界上無數種人間疾苦的案例向你湧來,你沒有辦法開口跟他們收費。" 另一方面,張澤偉也表示,起步階段做些免費的公益案例,也是打開市場。
這樣免費做了幾十上百單,張澤偉後來開始收費,每單價格在幾千到一萬元之間。張澤偉稱,每單毛利百分之五六十,淨利百分之三四十。
張澤偉會對客戶的咨詢進行篩選,看客戶的需求是否真實,接單的比例不到一半。截至 3 月中旬,張澤偉工作室的 " 複活 " 親人業務開展接近一年,已經接收近一千單,包括正在進行的單子,營業收入達到幾百萬。
張澤偉知道自己的業務是獵奇的,吸引媒體蜂擁報道,法國的法新社、TF1 電視台、新加坡的海峽時報也報道了。更多客戶湧入,向張澤偉咨詢。" 初步估計咨詢量有四五千,但沒有那麽多精力去統計這些,因爲這段時間對我們的曝光量實在太強了。" 張澤偉說。
張澤偉制作 AI 換臉視頻電話的過程。圖片來源:" 超級頭腦 " 視頻号
張澤偉工作室目前有 5 個人。做一個數字分身,成本一般在四五千元左右,工作量需要 7 天左右,算力 24 小時全開,訓練 7 天。如果樣本量過少,制作耗時也更長,甚至到半個月。從活人身上采樣越多,用更多樣本去訓練模型,優化數字人的情感和語氣,數字人就越接近本人。需要幾個月的樣本量,才能全方位模仿本人的情感;而以年爲單位采樣,才能無限趨近本人。
目前,張澤偉工作室使用了國外的一些開源軟件,來打包成自家核心軟件。但國外的開源軟件具體是什麽,張澤偉表示不能透露,是商業秘密。
在數字人的對話訓練方面,張澤偉工作室使用了百度的文心一言大模型 4.0 版本的接口,再用客戶的個人數據,去訓練生成專屬的對話小模型。算力方面,本地使用英偉達 RTX 4090 顯卡,線上使用阿裏雲。
商湯科技數字空間事業群首席架構師邢孝慈表示,目前生成一個數字人的成本不到萬元,但生成數字人之後,用大模型進行對話訓練還需要額外的計算成本。
獲客方面,張澤偉工作室目前 To-C 端的主要獲客方式是視頻自媒體曝光,吸引客戶前來咨詢。目前全平台粉絲總量 30 多萬。
不同社交媒體,視頻号、抖音、小紅書上推廣的效果不同。最開始在小紅書上流量非常好,但後來似乎被平台限流。張澤偉說," 小紅書很奇怪,一開始在小紅書數據非常好。一周不到的時間,每條視頻四五十萬播放量,粉絲 1 萬 7 千左右。之後不知什麽原因,限流了,我們去申訴,平台回應說你的賬号運轉正常。但其實我們知道仍然是限流的,因爲不可能同樣的内容,播放量原來有幾十萬,現在發出去隻有一兩百。" 後來張澤偉用小紅書的付費推廣工具 " 薯條 " 去投流加熱,結果提示發布内容不符合價值觀," 我們也沒搞明白爲什麽會限流。"
張澤偉推測,最開始在小紅書上流量最好,是因爲小紅書女性用戶比較多,共情能力比較強,而自己的視頻大多關于人間疾苦,需要用戶共情。
目前張澤偉認爲微信視頻号是窗口期,對創作者有流量扶持,還有一定的機會,但紅利期也快關閉了。在他看來,以短視頻平台的推薦邏輯,似乎不太容易将這些悲傷内容的視頻推薦給用戶," 如果是一個很悲傷的事情,首先用戶很少會去收藏、點贊、轉發。"
在用 AI" 複活 " 親人這一塊業務上,張澤偉的工作室是目前國内起步最早、規模做得最大的。淘寶、閑魚上有一些零散的數字 " 複活 " 親人的業務,但一般訂單量顯示在幾十左右。
相比于 To-C 業務,最開始張澤偉其實是以 To-B 業務起步,爲企業做 AI 課程培訓。浙江衛視《王牌對王牌》關于反詐的一期,張澤偉工作室作爲技術支持,給明星換臉。
在用 AI" 複活 " 親人的熱度火起來後,張澤偉的商單也變多。目前張國榮粉絲團、李玟粉絲團在與張澤偉商談給偶像做數字人的業務,張澤偉正在與張國榮、李玟的直系親屬協商授權事宜。上海最大的殡葬服務公司福壽園,也在與張澤偉洽談數字殡葬的合作,爲逝者做數字永生人,雙方已達成初步合作意向。
從人才成本到算力成本,訓練 AI 大模型都極其燒錢。大廠可以自己燒錢做研發,創業公司則需要大筆融資。目前中國做大模型的公司,落地商業化主要在 To-B 端定制企業服務,像張澤偉這樣能在 To-C 端的細分商業化場景,自我造血掙到錢的,并不太多。
投資人朱嘯虎在接受騰訊新聞《潛望》采訪時表示,to B 馬上能商業化,基本不用燒錢,AIGC 方向的投資,最重要是 PMF(Product/Market Fit,産品 / 市場匹配)," 你(投)十個人找不到(能做到 PMF 的),投一百個人同樣找不到。和人數、成本沒關系的。不要去砸錢做 AIGC,關鍵是找不找得到 PMF。你如果找到 PMF,不用砸幾千萬美金去砸個大模型,成本不高,拿 LLaMA 訓練兩三個月足夠了。"
張澤偉向藍鲸财經表示,他了解到很多大公司也想做 AI" 複活 " 親人的業務," 但我們從商業上判斷,大公司很難去直接做這一塊東西,因爲這裏面的東西太複雜了。"
張澤偉所說的 " 複雜 ",一方面牽涉到中國的傳統文化," 比如清明作爲一個節日,大家去墓地祭拜,更多是對自己的解脫。"
另一方面是客戶個體的心理需求,就像之前張澤偉用 AI 扮演那位女士的已逝男友,讓她放下過去。" 要根據用戶的需求來定制,短期内沒法把流程标準化。"
Deepfake 造 " 假 ",數字人逼 " 真 "
除了 " 複活 " 去世的親人,張澤偉的另外一塊業務是,爲在世的人制作數字分身。通過在世的人留下的影像、音頻、文字數據,來制作數字分身,有與本人相同的面貌、聲音,甚至相似的思維與對話習慣。
商湯科技在 2024 年會上 " 複活 " 了其創始人湯曉鷗教授,是今年年初驚豔世人的一個數字人案例。喜歡在晚上睡前聽相聲的湯曉鷗以往每年都會上台說一段脫口秀,今年的 " 湯曉鷗 " 一如既往地幽默,有着脫口秀的說話節奏,左右走動的悠閑步伐,還會自然地停下來喝口水——隻是,這是數字人湯曉鷗。
2024 商湯年會上,數字人湯曉鷗在脫口秀中途喝了口水。圖片來源:商湯科技視頻号
很多人說,如果不是視頻裏湯曉鷗提到春節檔電影《熱辣滾燙》,都以爲是真人湯曉鷗回來了。
湯曉鷗數字人背後的制作過程,是小樣本訓練和大模型的結合。
在 3 月 14 号騰訊研究院的對談會上,商湯科技數字空間事業群首席架構師邢孝慈介紹,訓練湯曉鷗數字人的數據來自湯曉鷗生前公開的視頻資料。在語音訓練上,挑選了四五段湯曉鷗生前的音頻,每段 3-4 秒鍾左右,每段風格不同," 有些是調侃幽默的,有些是深情款款的 ",邢孝慈說。接着用這些不同風格的音頻,使用小樣本學習(Few-shot Learning),還原本人的形象和聲音。在對話生成上,用湯曉鷗生前的文字對話數據去訓練大模型,讓生成的文案内容與讓湯曉鷗的性格貼合,形成幽默的對話風格。
對于生前資料中缺失的部分,如說話時的笑聲,沒法從原有素材中找到一模一樣的,就需要用到視頻生成模型。" 剛開始,湯老師家屬也會發現,笑容不夠自然,後來我們不斷調試參數,用到目前商湯在研發中的視頻生成技術,來抓取到他笑的神韻。"
" 超級頭腦 " 博主張澤偉說,數字人這塊的業務目前還在教育市場的階段," 其實數字分身跟以前我們拍照片留影像是同樣的邏輯。拍照以後,不管活着還是死去,人們都會看照片留戀。從照片上升到數字分身,要培養用戶的産品性習慣。"
這個時代的數字人變得不一樣了。如果說大模型之前階段的數字人,類似 Deepfake 這樣将個人的聲音、面部表情及身體動作拼接合成虛假内容,它有與當事人一樣的皮囊,但并不擁有當事人的意識,而是被其他人假冒,操縱着對話。
而大模型發展之後的數字人,有可能成爲未來的、各種科幻作品裏描繪的 " 數字生命 "。" 數字生命 " 不僅僅有與當事人一樣的皮囊,還能通過學習當事人留下的文字數據,模仿其對話習慣,甚至擁有一定程度的意識,以與當事人相似的思維去與真人産生新的交流。
到了那時," 數字生命 " 引領的整個商業模式将與現在拍照片、制作數字人的情況完全不同,AI 将迎來一個全新的市場,甚至讓人類進入一個全新的時代。