商湯首次揭秘,如何用 AI 跨次元複現湯式幽默?
在年會上來段兒脫口秀,是 " 被 AI 耽誤的脫口秀演員 "、商湯創始人湯曉鷗在每年商湯 " 春晚 " 上的保留節目。
不久前,當那個熟悉的身影和他的 " 湯式幽默 " 重現在商湯線上年會時,不少員工還以爲這是湯曉鷗本人過去的視頻,直到屏幕中的他提到春節檔電影《熱辣滾燙》,大家才确信:" 這真的是湯老師的數字人!"
商湯創始人湯曉鷗數字人推薦了《熱辣滾燙》
這場跨次元的重逢令許多熟悉湯曉鷗的人淚目。大家動容的同時,不禁感慨視頻中的細節:舉手投足間,他的每一個細微動作都惟妙惟肖,中場時他還很自然地拿起瓶子喝了口水,就連東北口音和特有的 " 湯式冷幽默 " 也被生動還原。
" 大家都說:感覺湯老師回來了。" 商湯年會後的一周,在北京理想國際大廈對第一财經記者回憶起制作湯曉鷗數字人背後的故事,以及與湯老師共處的過往時,商湯科技數字空間事業群數字文娛事業部總經理栾青紅了眼眶。
用 AI 數字人 " 複活 " 逝者,不僅意味着 AI 在技術上的突破,也承載着人類情感的延續。它讓人們看到了超越生死界限的可能性,也引發了關于生命、死亡以及技術倫理的深刻思考。數字人雖然可以模拟出人類的外貌和行爲,但能否真正理解和體驗人類情感?數字永生是否會破壞人的身份認同?如何确保 AI 數字人的真實和安全性?這些問題沒有簡單的答案。
" 大家好,我們又見面兒了。"
視頻中的湯曉鷗一開口,仿佛拉回與老友重逢的場景。在這 9 分多鍾的視頻背後,栾青透露,整個視頻内容真正去操刀執行人物生成和聲音生成的,其實就 1 至 2 個人,文案調校涉及和家人、朋友對于内容探讨等,大家花了一天多的時間完成了第一版的視頻,此後經過反複打磨以求達到最好效果,直到年會那周才敲定最終版本。
而讓湯老師身影重現,是商湯的一次集體共同決策。
栾青對第一财經記者回憶,過去每一年年會,創始人湯老師都會說上一段脫口秀,他喜歡從大家的生活日常和流行元素中汲取靈感,以诙諧幽默的方式分享自己對于工作事業和人生的感悟,将年會氛圍推向笑聲的高潮。然而去年湯老師意外離世,所有人都深感傷心和遺憾。
約在一個半月前,由徐立(商湯科技董事長兼 CEO)、技術團隊、品牌市場傳播部等組成的年會工作委員會在構思節目時,大家很快達成共識:征得湯曉鷗家屬同意,在如影數字人技術的支持下,讓湯老師重現年會,讓他的精神繼續激勵大家前行。
徐立對湯曉鷗老師的數字人有更高的要求,他希望超越數字人本身,不是以同一個或幾個動作表情、講述的狀态出現,而是以更高的還原度呈現,讓大家覺得:這就是湯老師,和其他高管在線上年會中一樣真實。
商湯科技數字人領域已有一定積累,栾青告訴記者,不隻是湯曉鷗,商湯所有高管都有自己的數字人版本,常常用在一些他們無法親自出席的場合,因此,将這一技術應用于年會來重現湯曉鷗的形象,成爲了一個切實可行的方案。
不過,AI 數字人技術并不是簡單地将一個人 " 複制粘貼 " 到虛拟世界中,而是通過複雜的算法、數據以及深度學習、自然語言處理等技術,模拟出人的外貌、聲音、動作甚至是思維模式,從而創建出一個高度逼真的數字人。
栾青說,東北人、段子手和冷幽默是湯曉鷗老師在大家心目中特别重要的直觀感受,他說話中還有很多輔助詞如 " 嗯 "" 啊 "" 是吧 "" 這樣 " 等等,這些細節在逼真還原中是第一重要的,這得益于大模型在語音方面的技術突破才得以實現。
這其中也有挑戰,比如湯老師不可能再配合進行聲音的錄制,因此團隊在制作過程中,花了很長時間尋找湯老師以往四五種不同風格的語音素材,每個截取了 3 到 4 秒作爲 prompt(提示詞),讓 AI 去生成他的說話風格,有些是調侃式的,有些是深情款款的。栾青說,大模型語音的生成讓她自己都感到驚歎。" 比如‘嗯’‘這樣’等語氣輔助詞都不是靠我們人工打字進去的,而是 AI 學習後自己生成了他說話時常用的習慣,非常自然。"
除了大模型語音生成技術外,在湯曉鷗數字人生成中還使用了比較多的動作生成和場景的自然過渡等新技術,這些視頻生成中的技術,包括動作的自動匹配,生成和選取等。
" 包括湯老師的笑,肯定沒有辦法和現有的素材裏找到剛好一模一樣的。" 栾青透露,一開始的版本中,湯老師的笑并不夠自然,團隊用參數化的方式和學習的方式進行不斷的複現和調整,終于調到合适的參數抓住了他笑的神韻,其中用到了商湯還在研發中的新的視頻生成技術。
除了動作、神情等外在," 湯式幽默 " 如何生成,也就是文案的調整,是花費時間最多的地方。
湯曉鷗曾在一次公開演講說自己每天晚上睡覺前,都是一邊聽着于謙老師的相聲,一邊在想:" 機器怎麽可能超過這樣有趣的靈魂?" 而在年會上複現 " 湯式幽默 " 的過程,也的确不隻靠 AI。
栾青向第一财經介紹,這支視頻中湯曉鷗的演講内容由幾個熟悉湯老師的人共創完成,他們通過細緻研究過往的視頻及文本資料,頭腦風暴後不斷叠代和優化,盡可能地還原湯氏幽默。例如,湯老師每年都會推薦電影,而《熱辣滾燙》的段子是年會前一天徐立建議加的。" 還是要讓大家意識到原來這是湯老師最新的(視頻),不然大家會以爲這是之前錄的。"
包括視頻中小火車在苞米地裏前行的創意,以及随後 " 往前看,别回頭 …… 在 AI 這條路上往前開吧 " 的寄語和推薦春晚小品的場景,也是熟悉湯曉鷗的人們一起創意出的結果。
例如,他調侃今年春晚最好笑的變成新疆人了,他作爲東北人有點兒不服氣,推薦了一部小品《吃面條》并介紹了這背後的花絮:正是因爲當年編導最後開播前确定讓演員上場,才有了春晚史上的第一部小品。他借此來表達:堅持原創這件事,是留給有勇氣的人做的;而真正支持創新的人,是有勇氣擔責的。
他還談到,以前的喜劇之所以那麽好看,是因爲時間的沉澱才成爲經典。也許前路一片迷霧,而他們隻是一群選擇出發,并堅信趕路的人。
" 這很湯式風格。" 一位熟悉商湯的人這樣對記者評價。
栾青也對此感觸頗深,聊着聊着紅了眼眶:" 按照我的理解,這其實是讓大家不要在風雲變幻的市場或者各種各樣的市場噪音下擾亂自己的心智,隻有沉下心來做事,堅持中國的原創技術,把最經典的東西留給大家,曆久彌新,這才是我們正确、該做的事。"
在商湯用 AI" 複活 " 湯老師之前,音樂人包小柏用 AI" 複活 " 去世女兒的故事也曾令網友淚目,他用 AI" 複活 " 女兒給妻子唱了生日歌,感慨 "AI 就是寄托思念的工具,也是一種對思念的表達方式。"
這些場景,如同電影《流浪地球 2》照進現實。電影中,科學家圖恒宇通過量子計算機 " 複活 " 了其因車禍去世的女兒圖丫丫,讓她在數字世界中度過完整的一生。
目前市場上對于數字人的主要需求來自直播、視頻制作等娛樂産業以及醫療、教育、金融保險等行業。在湯曉鷗的視頻發出之後,栾青團隊接到來自企業客戶和個人類似親人數字人的訴求更多了。從技術本身來講,隻要哪怕十幾二十秒的連貫性視頻素材,就可以制作一個簡單的數字人。
不過,她并不認爲這意味着 "AI 數字人複活逝者 " 馬上要迎來爆發期了,AI" 複活 " 湯曉鷗和包小柏女兒的時間點,隻是 " 巧合 " 地都趕在了近期。
在虛拟世界中,人們可以再次感受到逝者的幽默和智慧,仿佛他從未離開。但 AI 數字人複活逝者不隻是一個技術問題,更是一個倫理道德問題。技術是否可以成爲人類情感的一種寄托?在數字化時代,我們如何重新定義和塑造人與人之間的聯系?AI 數字人能否理解人類的情感、是否會給親人帶來二次創傷?如何避免這項技術被濫用?這些問題沒有标準答案,也令從業者更加深入地思考人類的本質和技術的邊界。
栾青對記者表示,在 AI" 複活 " 數字人的背後,目前 AI 大腦能不能更好地符合每個人的心智,包括從倫理道德角度、技術角度等等諸多問題都還在不斷探索,這也是 " 逝者數字人 " 這件事過去多年尚沒有形成一個産業的重要原因。
她告訴記者,商湯對于 " 逝者數字人 " 持觀望态度,并沒有非常積極地去推進,暫時還處在一個先了解需求的階段,更希望先看到上下遊有更豐富的相關服務做起來。" 相比之下,主播數字人或是其他商業性用途數字人更像是 " 強工具性應用 ",不需要過于複雜的情感。
" 我們究竟去哪個行業,其實并不是關鍵的,而是看你解決了大家什麽樣的問題,不一定是殡葬業,也有可能是比如親人之間的陪伴,甚至是偶像明星用這種方式去陪伴自己的粉絲等等。" 栾青說。
她同時提到,在推廣和應用數字人技術時,必須建立嚴格的倫理準則和監管機制,包括使用範圍、保護個人隐私、尊重死者和家屬的意願等。此前,在中國信通院的研究機構牽頭下,商湯等多家 AI 公司共同制定了 " 可信虛拟人生成内容管理系統技術要求 " 的标準,制作一個數字人首先需要得到家人或者被當事人授權,同時商湯數字人有相關的鑒定機制,在商湯這個平台上制作的數字人裏,有一系列看不到的 " 編碼 " 藏在其中。
對于數字人的商業化落地,栾青認爲,過去傳統的數字人市場技術成熟、應用場景明确,競争非常激烈。但是現在的競争逐漸已經進入深水區了,也就是說相關的服務如何能夠真正幫助用戶解決實際問題,目前還有很多方面的技術有待突破。
例如,在情感陪伴層面,數字人不僅需要具備高度自然的語言交流能力,還需要能夠實時生成與對話内容相匹配的動作和表情。這需要業界在大模型對話能力、動作生成技術等方面進行持續投入和探索。
還有一些直播數字人,人們仍會覺得 " 假 ",動作複雜度、實用性比較有限,這是因爲,對于複雜動作的生成,現有市面上各類視頻生成技術還難以做到對細節動作、表情的精确控制,這使得數字人在表現一些複雜情感或動作時顯得力不從心。" 到了現在這個階段,生成式大模型能不能使得這種自然度、真實感進一步突破,這是未來需要跨越的一個關鍵。"