【TechWeb】4 月 28 日消息,Sora 爆火後,掀起了全球競逐 AI 視頻生成的熱潮。近日,國内一支 AI 生成的視頻短片引發關注。該視頻來自生數科技聯合清華大學最新發布的視頻大模型 Vidu。
根據官方介紹,該模型采用團隊原創的 Diffusion 與 Transformer 融合的架構 U-ViT,支持一鍵生成長達 16 秒、分辨率高達 1080P 的高清視頻内容。
比如,輸入 " 畫室裏的一艘船駛向鏡頭 " 這樣一句簡單的指令,Vidu 就可以生成效果逼真、鏡頭連貫的一段視頻。視頻的整體質感可以與 Sora 相媲美。
除了可以生成複雜、細節豐富的場景,Vidu 還可以虛構場景以及想象超現實主義的畫面,具有多鏡頭語言,更好地理解生成熊貓、龍等富有中國文化特色的形象等。
據證券時報報道,基于在機器學習和多模态大模型的長期積累,生數科技團隊在兩個月時間裏突破了長視頻表示與處理的多項關鍵技術,成功研發推出 Vidu 視頻大模型。
公開資料顯示,生數科技成立于 2023 年 3 月,核心團隊來自清華大學人工智能研究院,此外還包括來自北京大學和阿裏巴巴、騰訊、字節跳動等科技公司的多位技術人才。截至 2024 年 3 月,生數科技員工總數超 70 人,其中近 90% 爲研發人員。
生數科技由清華系 AI 公司瑞萊智慧 RealAI、螞蟻集團和百度發起的 BV 百度風投聯合孵化創立,緻力于打造可控多模态通用大模型。去年 3 月,生數科技開源了全球首個基于 U-ViT 框架的多模态擴散大模型 UniDiffuser。
去年 6 月,生數科技獲得螞蟻集團、BV 百度風投、卓源資本的近億元天使輪融資;8 月,完成了數千萬元天使 + 輪融資,本輪融資由錦秋基金獨家投資。
2024 年 3 月,生數科技完成新一輪數億元融資,由啓明創投領投,達泰資本、鴻福厚德、智譜 AI、老股東 BV 百度風投和卓源亞洲繼續跟投。
證券時報報道稱,在三輪融資總計數億元人民币的資本加持下,生數科技已成爲目前國内多模态大模型中估值最高的初創公司之一。(周小白)