Text-to-Video文生視頻,繼作文、繪畫之後 AI 殺入的又一領域,有越來越多産品湧現。根據讀者爆料,一款主打 AI 生成視頻的産品,已經在小圈子内被頻頻提及,還是國産的。
量子位迫不及待淺扒了一段關于曹操的介紹,喂給它,得到這樣一段視頻:
在不經任何替換和幹預的情況下,生成的視頻畫面符合人物、時代背景和部分文案提及的場景,效果還算不錯。
最最重要的是,用它制作一段視頻,幾乎不存在 " 剪輯 "這個步驟,比以往圖文轉視頻的産品門檻更低,耗費的時間也更短。
但要評判這款産品到底是騾子是馬,還得多次體驗,再往深處挖一挖。
什麽樣的産品?
這産品名叫一幀秒創,本次體驗的主角是它最基礎常規的 " 文案一鍵生成視頻 "。
開頭關于曹操的簡介視頻,是用該功能這樣生成的——
點擊該選項後,會跳出一個文本框供輸入标題和正文,底端可以選擇最終的畫面呈現形式是橫屏還是豎屏。
這一步驟實測下來,标題部分對後續内容生成影響不大,現階段可以不用輸入,後續 AI 會自動提取補充。相對而言,第二個需要輸入文案内容的部分非常重要。
量子位做了如圖文案輸入:
點擊右下角 " 下一步 ",可以更改 AI 對文案進行的分類,也可以修改文案的分割。分割成 n 個小段的文案,承擔分鏡頭腳本文案的功能,以便後續 AI 從素材庫裏匹配對應的視頻片段。
在這方面,AI 的分割效果沒有出太大纰漏。
但從下圖可以看到,此處 AI 把曹操 title 中的 " 書法家 " 單獨作爲一個分鏡頭文案,量子位對其進行了合并。
接下來就會進入最後的調試界面,分出兩大闆塊,即左半部分的調整界面和右半部分的預覽界面。
通過左側的工具欄,在最頂端的場景部分,AI 爲文案匹配了 12 個視頻片段。
12 個視頻片段中,原本 AI 爲片段 8 生成的視頻中出現了現代社會的外國人。也就是說,在畫面内容和文案内容的匹配度上,AI 能力還有所欠缺。
最終量子位通過小藍框中的替換素材功能,在素材庫中選擇了更符合文案的視頻畫面。
12 個鏡頭整體拉片式通看一遍,直觀感受是視頻質量算不上精緻。雖然并非完全不相關,但還是與人類剪刀手的視頻編輯水平有明顯差距。
敲定視頻片段後,在音樂闆塊挑選國風類型的 BGM,又選擇了 " 磁性渾厚 " 的解說男聲,Logo 和字幕都是默認選項。
一切确定,點擊生成視頻選項,就能在預覽闆塊看到這一套搭配下來的視頻效果,最終生成文章開頭的視頻。
曆史分類的 AI 視頻效果不錯,那是否在每個分類下都有同等水平的效果呢?
又陸續還嘗試了科普類(量子位文章,扔進去)、美食類(宮保雞丁菜譜)等多種類别的文案,甚至還把谷歌 Phenaki 效果驚豔的小企鵝沖浪視頻的 6 句文案丢給了它。
結果顯示,科普類和美食類,生成視頻的表現都還算文案和畫面貼合。
但,小企鵝沖浪文案的生成效果就有些拉胯:
看遍視頻畫面的每一秒鍾,從未出現過一隻企鵝,連影子都沒有……
Excuse me???
雖然部分畫面也和文案有所關聯,比如出現人在沙灘上走的第一視角視頻片段。但和曹操視頻的效果相比,可以說大相徑庭,實在有點出乎意料。
無獨有偶,國外有個 Quickvid 同樣主打 AI 生成視頻的功能,同樣在小圈子裏走紅。而目前開放 Beta 測試的Youtube Shorts功能,和上述國内産品功能類似。
爲了測試,把相同的小企鵝沖浪文案喂給了 Quickvid。結果是,Quickvid 生成的視頻裏,仍然不見企鵝的蹤影,一幀也沒有!
(谷歌 Phenaki 聽後狂喜)
當然,Quickvid 之所以走紅,并不是因爲生成的視頻質量驚人。除了成爲文本生成視頻賽道的 " 早鳥 " 外,與背後的開發者密切相關。
開發者小哥名叫Daniel Habib,此前在 Facebook 的虛拟現實部門 Oculus 工作。
Quickvid 走紅是從今年 2 月開始的,當時它正式從内測轉爲 Beta 測試,僅 2 月 23 日一天,就有 2 萬 2 千多人成爲用戶。本月 ChatGPT 開放 API 後,Daniel 把它接入了 Quickvid,成爲了第一批 ChatGPT 生态内開發者。
量子位的視頻編輯對兩款産品也進行了試玩,用戶評價是這樣的:暫不認爲這東西能威脅自己的就業。
但對于 AI 生成視頻展現出的趨勢,多少有點心有凄凄焉。
因爲你不得不承認,用這玩意兒做視頻,完全不需要懂得剪輯知識。而且做一條同等質量的視頻,相比人工剪輯,用 AI 生成,時間和資源投入顯著降低。
不完美的視頻創作 AI 工具
不僅僅是 Quick 接入了别人家的 API,事實上,今天體驗的一幀秒創也接入了 GPT-2 的 API,還用上了開源 Stable Diffusion 模型。
這不是猜測,是我們直接找到背後開發者 " 對質 " 後得知的結果。
一幀秒創背後的公司叫做新壹科技。
這個名字或許比較陌生,但這個 " 新的一 " 是 " 一下科技 " 的 " 一 "。
一下科技,曾經多次站在視頻風口上的公司,一直播、秒拍、小咖秀,都出自一下科技之手,這是移動互聯網時代視頻領域響當當的玩家。背後的團隊,也是源自搜狐視頻 - 酷 6 網 - 新浪視頻一脈的視頻内容老兵們。
其創始人兼董事長韓坤,在創立一下科技之前,以聯合創始人的身份把酷 6 網打造成中國第一家在美國納斯達克上市的視頻網站。
新壹科技是韓坤手下孵化出的最新公司,現有團隊在 2020 年年中開始籌備,領隊人雷濤,現任新壹科技 CEO,也是一下科技的創始團隊成員。
團隊正式組建的 2020 年 12 月,距 ChatGPT 出生還有一年,連 DALLE-2 和 Stable Diffusion 代表的 AI 繪畫也還沒有名聲大噪,但春江水暖鴨先知,一下内部這支團隊感知到了 AI 對于視頻内容創作的方向性改變。
因爲視頻内容的傳統和基因,新公司誕生之初,新壹并沒有把自己定位爲一個人工智能公司。
他們希望從首先解決創作者需求切入,讓 AI 介入視頻生産全流程,盡可能降低視頻内容創作門檻。
通過 AI 能力,讓用戶以低成本制作視頻,還能用秒拍平台上的視頻爲 AI 匹配提供一個龐大的素材庫,形成規模壁壘。
把秒拍作爲現成的數據庫,這對新壹算是一個地利,不僅因爲秒拍有 10 億級規模的視頻素材和數據,更因爲秒拍能爲一幀秒創進行版權授予,讓 AI 生成的視頻有版權保障。
後者簡直解決了 AIGC 方面一直争論不休的大問題。
所以首款産品一幀秒創,有了明确的應用場景,也有了面向視頻内容創作者、視頻自媒體營銷的方向。
這是一個集合多種 AIGC 能力的工具,但是,無論是文生圖還是 AI 幫寫,最終的目的都歸于一處——把它們作爲素材應用到視頻生産流程,讓視頻生産更加高效。
爲了高效和低門檻,一幀秒創盡量做到去剪輯化,創作視頻的過程從開放式變成了填空式。
雖然距離産出極緻和精彩的視頻還有距離,但最直觀的是,哪怕完全不懂剪輯知識的人,也能上手制作視頻——甚至是批量制作。
△社交平台的剪輯小白用戶評價
目前,一幀秒創方面也知道,自己生成的視頻還不能和人工剪輯的視頻媲美,但是足以應對一些應用場景,如科普類視頻生成效果是最好的,批量生産内容可以應用到抖音本地生活推廣。以及除了面向 C 端的高階功能訂閱模式,一幀秒創還有來自 B 端的商業合作,比如跟 360 搜索的合作,已經獲得了不錯的反饋。
對于一幀秒創當前的初創狀态,新壹也透露正在通過一些具體的解決方案改進。
比如創作者集中的内容類别,投入更多的素材分析和标注成本;又比如推出私有化素材庫,提高匹配率和視頻片段替換率。
雷濤表明了一幀秒創的思路,稱作爲産品公司,新壹科技雖然沒辦法讓技術和硬件等基礎條件實現跨越式的發展,然而,能夠在每一階段适時提供符合當時階段水平的應用," 這已經足夠去忙了 "。
他多次以智能手機時代開啓後,移動互聯網的産品開發機遇舉例,也多次用新能源、智能車變革進程中的理想造車模式類比,話裏話外,追求的不是一步到位,而是與技術基礎設施和整個行業生态一起成長進步,而最關鍵的是,必須躬身入局,不能站着觀望。
這其中自然有視頻老兵對新周期的敏銳洞察,但也多少有些不甘心。
如果你對 2015 年以來的互聯網江湖還有記憶,應該多少能感知這種不甘心的合情合理。在如今字節獨大或抖音快手的雙雄格局之前,秒拍和一下科技,才是短視頻領域最火爆的明星公司。然而商場如戰場,如今的結局和市場份額,已經再清楚不過了。
或許 " 赢回來 " 的最好方法就是赢在未來、赢在下一個時代。
而下一個時代就是 AIGC。連比爾 · 蓋茨都說,背後不亞于互聯網的發明。
面向這個全新的創新創業賽道,已經分出了兩撥創業者,走出不同條路線。
一條是技術路線,訓練大模型,把底層技術牢牢掌握在自身的手裏,做底層,做平台。但門檻極高,創業公司在底層大模型方面取得突破的難度和成本都會很高。
另一條就是面向需求和場景,走産品、應用、工具平台的路線,集成開源和開放的現有技術,先入場再發展壯大,這也是更多中小創業者和開發者最可見的機遇。
這兩種路線也不稀奇。
一如當初蘋果做出了 iOS 系統,有人對标 iOS,要研發新手機系統,建立新生态;也有許許多多的開發者基于 iOS 做各種創造,在遊戲、開發、創作、工具類别下瘋狂推出各種适配 iOS 系統的 App。
所以技術和應用兩條道路,都能有玩家走到最後,完成商業化閉環,選擇不同而已,沒有優劣之分。
從來沒有事實能笃定表明,其中某一種能一統天下。
據透露,走産品應用路線的一幀秒創,已經快速積累了近 200 萬用戶,每日的視頻生成量在 10 萬級——這算不算 AIGC 時代的船票還不好說,但至少讓外界看到變數發生的可能。
— 聯系作者 —