文 | 袁滢靓
編輯 | 鄧詠儀
《智能湧現》獲悉,智能數字人平台開發商「向量方程」,此前完成近千萬元天使輪融資,由真成資本(已投資得到 APP、印象筆記)領投,北京極信管理咨詢和上海天使彙跟投。資金将用于豐富數字人産品技術的研發。
「向量方程」成立于 2024 年 3 月 14 日,創始人 &CEO 沈仁奎爲原得到 / 羅輯思維 CTO,曾先後就職于騰訊和百度,聯創團隊具有百度、美團等互聯網研發經驗。産品「石榴數字人」爲聚焦于亞洲人的一站式 AI 數字人視頻創作平台,于今年 6 月開始商業化運作。
短視頻早已成爲流量獲客的王者,AI 數字人更添一把火。海外 AI 視頻生成公司 Heygen,年化收入在 14 個月内從 100 萬美元快速增長到 3500 萬美元。國内預計到 2025 年,虛拟數字人的核心市場規模将達到 480.6 億元人民币,騰訊、阿裏、字節等也紛紛入局。
沈仁奎向《智能湧現》透露,早在四年前他就萌生了做數字人的想法,隻是一直在等到技術拐點的到來。
" 當看到一篇論文中提出的數字人新架構時,我意識到這就是自己一直在等待的、可商業化的技術。" 他提到," 以往采集建模數據通常一天起步,現在 3-5 分鍾就能迅速生成一個數字人。"
數字人賽道正從上一代的 3D 引擎等技術棧向大模型靠攏,數字人的生産效率有很大提升——即便是低價位數十元做出來的數字人效果,也比以前一百多萬的效果要強。
在沈仁奎看來,因爲技術負債少,公司 " 新 " 反而是優勢。而在巨頭的競争中,新一代創業者的機會依舊存在。巨頭的主要賽道是信息分發,而不是信息生産,并且他們即使入局也難以通吃标準化産品和服務。
「石榴數字人」是典型的信息生産産品,能夠将文本信息轉爲數字人視頻,爲内容創作提效。畫面上,它的仿真程度高,能 1:1 重現真人視頻的人物、場景、服裝和動作。高質數據訓練得到的優質底層模型,可以促進不同語種的嘴型對齊等任務,并大幅減少所需的數據量。
與目前頭部的視頻生成廠商相比,「石榴數字人」錄制視頻所需時長較短,從以往的 30 分鍾大幅縮短至了 30 秒。同時,「石榴數字人」更适應中文環境,在戶外走動等動态場景中表現出優勢,還可以實現多個數字人在同一畫面中互動。
能打籃球、能騎車、會說多國語言的石榴數字人
聲音上,TTS(Text To Speech,文本轉語音)的機械音問題得到了解決,現在的發聲更真實自然、抑揚頓挫。售價千元級的自研高階版聲音對标業内十萬級别,可以個性化定制口音與發聲習慣,更高質,也更适配場景。
沈仁奎向《智能湧現》介紹,「石榴數字人」已實現全流程自動化定制數字人。一方面,用戶在錄制視頻時無需注意對口型的細節,臉部扭動角度不超過 30 度即可。另一方面,系統能夠處理中英文混排和複雜的數字場景,通過智能斷句和上下文分析,實現自然流暢的輸出。因爲去除了人工幹預成本,平台隻按視頻生成時長收費。
對于高客單,「石榴數字人」還會提供 AI 助手,在微信對話窗口中實現抓字幕、改寫和生成視頻等交互功能。
當前,國内許多産品聚焦于創作者生态,「石榴數字人」也推出了一鍵式視頻創作服務,這是現階段應用最廣泛的場景。然而,沈仁奎認爲,面向企業級市場的機會更大,且市場尚未飽和,是公司更關注的方向。
在這條賽道上,「石榴數字人」爲企業提供創新的視頻解決方案,借助數字人和自動化技術,幫助企業快速生成大量視頻内容,提升運營效率并加速效果優化。
此外,「石榴數字人」計劃拓展至互動視頻領域,讓數字人能夠與觀衆進行實時互動,不再局限于靜态展示。
互動視頻并不等同于直播,直播隻是其中的一個應用場景之一。盡管數字人直播是未來的發展方向,沈仁奎表示當前仍在等待技術進一步成熟。
" 數字人直播的核心挑戰不僅在于技術,更在于對行業需求的深刻理解,關鍵在于快速提煉出可操作的行業經驗,并将其轉化爲用戶友好的産品體驗。" 他補充道。
目前,「石榴數字人」已成功實現商業化運營。未來,公司将持續優化産品功能,擴大市場布局,并吸引更多優秀人才,推動進一步發展。