你能想象趙本山一口純正倫敦腔嗎?
在 AI 時代,一切皆有可能。
近日,不少郭德綱說英文相聲、趙本山倫敦腔接受采訪、馬保國狂飙日語化身馬大佐的視頻開始在互聯網風靡,這背後的核心技術來自于一款 AI 視頻工具。
據悉,這一技術支持 300 多種聲音、40 多種語言,不僅可以準确卡點,音色與講母語時候的音色類似,甚至連口型都能對上。
在來勢洶洶的 AI 浪潮下,這次 " 被失業 " 的又是誰?
賽博法師讓趙本山、郭德綱說英文,AI 取代人類進程加速?
從上周開始,郭德綱說英文的視頻就開始在抖音、微博等平台瘋傳,在這些視頻中郭老師不僅用英文接受采訪,還用英文說相聲。而這些的視頻并非簡單的配音或者 AI 變聲,而是高度貼合人物聲線和風格、甚至連嘴型都匹配,以假亂真程度讓圍觀者大爲震驚。
本周一趙本山倫敦腔接受采訪的視頻以同樣的原因在全網爆紅。在這兩例娛樂性極強的案例的啓發下,有網友認爲在未來翻譯的工作極有可能被 AI 取代,而好萊塢罷工所擔憂的 AI 取代演員危機似乎也初見端倪。
藍鲸記者采訪到了其中多條爆款視頻的制作者 UP 主賽博法師,他告訴藍鲸記者,這些視頻的爆火在他的預期之中," 在發作品之前,還在制作過程中的時候我就知道會火。" 他表示,自己本身是傳媒、新媒體行業出身,進行 AI 相關内容創作也有半年多,認爲自己的網感和對 AI 發展的情況都有一定自信," 在作品還在制作中的時候,我都在不禁感歎,實在是太像了。我們這些 AI 相關的創作者更了解現在的 AI 發展到哪一步了, 阈值比普通人更高,連我都感歎的東西,普通人看到也一定會贊歎。"
除了技術本身帶給大家的震撼,這類爆款視頻的主人公也是精心選擇的結果,賽博法師表示," 主要是反差感。趙本山和郭德綱都是老派語言類表演藝術家,他們在公衆前的形象都是比較有鄉土氣息的,并不那麽洋氣,那麽設想一下,當觀衆們看着他們兩個突然飚出一口英文會怎麽樣?我就是想抓住這個反差感,讓他們第一時間吸引觀衆的耳朵和眼睛。"
不過從 AI 孫燕姿起,版權就像一把達摩克利斯之劍懸在創作者頭上,賽博法師也不免有此擔憂,他告訴藍鲸記者,自己雖然同步在 B 站與抖音都發布了相關視頻,但趙本山和郭德綱并沒有在抖音火起來,很大程度上是因爲被限流了," 還是比較擔心版權問題的,目前這還隻是翻譯了原視頻,我要是直接修改人物發言内容,造成名譽受損、造謠等後果那就太嚴重了。"
AI 郭德綱技術來自深圳創業公司,已實現盈利
據賽博法師介紹,AI 郭德綱的實現主要基于一款 AI 視頻工具 HeyGen,用戶隻需上傳視頻,選擇語言,就能生成自動翻譯、音色調整、嘴型匹配的視頻。
而 HeyGen 背後則是一家在深圳創立的 AIGC 企業。
HeyGen 的開發團隊爲詩雲科技,司如其名,公司名中的 " 詩雲 " 取自劉慈欣科幻小說《詩雲》,寓意人的創造性無法被科技取代,但創作的過程和效率卻可以被機器極大優化,而現實中詩雲科技要做的也是用 AI 生成内容,讓用戶以更低成本完成内容創作。
據天眼查 APP,詩雲科技的法定代表人爲徐卓,目前公司已完成兩輪數百萬美元融資。其中 2021 年 3 月,詩雲科技宣布獲得紅杉中國種子基金和真格基金的天使輪投資;同年 8 月 30 日,詩雲科技宣布獲得數百萬美元 Pre-A 輪融資,由 IDG 資本領投、紅杉中國種子基金和真格基金跟投。
徐卓英文名 Joshua,他本科畢業于同濟大學自動化專業,後前往卡内基梅隆大學攻讀計算機碩士學位。作爲明星應用 Snapchat 前 100 号員工 ,徐卓從 0 到 1 搭建了 Snapchat 廣告平台、推薦算法系統以及機器學習平台 Barista,并負責 AI camera 的技術及産品研發,經驗十分豐富。他的創業合夥人梁望此前在字節跳動擔任北美設計主管,二人同屬大廠精英。
HeyGen 于 2022 年 7 月正式推出,據 36 氪報道,HeyGen 在 7 個月内實現了 100 萬美元的 ARR(年度經常性收入)。
HeyGen 的收入主要來自于付費,據賽博法師介紹,這款應用分年付和月付,月付最低 29 美元包含 15 分鍾生成時間,再往上還有幾個檔次,主要是包含的生成時間不同。對于這樣的收費,賽博法師認爲對于普通用戶而言并不便宜,"29 美元 / 月的起步價對于美國人來說可能不算什麽,對于國内來說就太貴了,畢竟換算下來兩百塊出頭了。"
但同時他也肯定了 HeyGen 的技術:" 半年前的 AI 技術,還需要 20-30 分鍾的人聲素材,才能訓練出一個聲音模型,而 HeyGen 隻需要幾十秒,而且目前沒見到同類産品能做到像 HeyGen 一樣對口型。"
從 AI 孫燕姿到 AI 郭德綱,AIGC 是玩具還是工具
自從 ChatGPT 在國内掀起 AI 浪潮後,大廠悉數投入戰鬥,但現實來看,當初對标 ChatGPT 的大模型類應用或尚未面世,或并未掀起太大水花,相反一系列具體的落地應用反而成爲了一個個小爆款。
2023 年 5 月 AI 孫燕姿全網爆紅,背後的黑科技爲 "SO-VITS-SVC"。
"SO-VITS-SVC" 源于 2021 年 6 月 11 日發布的 "VITS" 的開源項目。"VITS" 是一種語音合成模型,可以實現 " 文生音 " 的效果。但 "VITS" 模型需要海量的訓練數據,并高度依賴于人們對語料數據的文本标記,應用門檻很高。2022 年 8 月 26 日,一位名爲 "Rcell" 的 B 站用戶在 "VITS" 的基礎上,結合了 Soft-vc、VIsinger 等,開發出了 "SO-VITS-SVC" 模型。"SO-VITS-SVC" 可以理解是一個音色轉換的 AI 模型,僅需十幾分鍾的音頻數據,便可以拟合成具備特定主體音色的工具。
2023 年 8 月,國内首個 AIGC 爆款應用妙鴨相機引爆網絡,這是一款以 AI 大模型爲基座的 App,是由阿裏大文娛投資的一個創業項目。該産品公布後,一些高峰期排隊、個人隐私相關話題引發關注。
2023 年 10 月,憑借 AI 郭德綱與趙本山,HeyGen 走入大衆視野。
縱觀在國内激起大衆輿論層面關注的幾款 AIGC 應用可以發現," 玩具屬性 " 似乎是走紅的基礎,當初對标 " 第四次工業革命 " 的 AI 創業浪潮則并沒有在大衆層面給生産力環節帶來相應的驚喜。AIGC 究竟會在多大程度上真正影響我們的生活?
對此,賽博法師認爲,一個技術從出現,到被大家熟知,需要一個過程。以 " 玩具 " 的形式出現在大衆眼前,不一定是一件壞事,同一種技術,既可以做成玩具,也可以做成工具。" 比方說我之前做過攝影師,在我手裏我覺得單反相機更好用,手機隻是圖一樂,拍不出相機的效果。但在普通人手裏,相機還真沒有手機好用,使用門檻的高低直接決定了适用人群,玩具也可,工具也可以,主要是看誰來用。"