Sora 有多火?
馬斯克、楊立昆、賈揚清、Jim Fan、謝賽甯等各路大佬都在讨論,周鴻祎更是喊出,Sora 的誕生意味着 AGI(通用人工智能)的實現或從十年縮短至一兩年。
不少 " 普通人 " 也提前嗅到商機,圍繞 Sora 搞錢的生意先火了。有媒體報道,一張網傳截圖顯示,某機構已售出 2 萬多份 Sora 培訓課程,輕松到手 200 萬。
如今,距離 2 月 16 日 OpenAI 發布文生視頻大模型 Sora 已經過去快一周,但讨論依舊熱烈,這實在是因爲它過于優秀。
功能上,它能生成長達 60 秒的視頻内容,遠超其他文生視頻工具幾秒至十幾秒的限額;它還能進行自我編輯和擴展,将兩個不相關的内容過渡在一起,能轉換主角周圍的風格和環境等;
前景上,Sora 不僅是視頻生成工具,它更被視爲世界模拟器;
創始團隊上,也堪稱傳奇,核心成員包括 12 人,成立尚未超過 1 年,由兩名剛剛畢業的博士生帶隊,其中還有 00 後。
在興奮之餘,Sora 的強大也讓一些内容創作者有了危機意識,有網友評價," 長短視頻、遊戲行業的朋友們一整年都不會快樂了。"
多位業内人士指出,以目前 Sora 生成視頻的長度來看,它的到來最先會沖擊到短視頻領域。一旦大範圍推廣,Sora 将大大降低短視頻創作門檻,豐富短視頻平台的内容供給,但随之而來的問題是,AI 生成内容的增多可能會影響平台的内容生态,同時 Sora 還會和剪映、快影等工具搶奪用戶,讓此前的大筆投入付諸東流。
Sora 朝短視頻領域扔下了一枚重磅炸彈,考驗創作者和抖音快手們的時刻到了。
1 Sora 降低了門檻,也增加了競争
雖然市面上已經有不少文成視頻工具,比如 Pika、Runway,用戶輸入文字就能得到一段幾秒到十幾秒的視頻内容,但目前它們并未被廣泛使用,主要原因還是效果一般。
某 MCN 機構負責人大成告訴「定焦」,他使用過 Runway," 我們還從外部購買了優質素材,但最終生成的内容不夠精良,根本用不了。"
看到 Sora 後,他十分激動," 時長能達到 60 秒,内容還合乎邏輯,感覺和之前的工具不在一個層次上。"
"Sora 與此前的同類産品相比,效果好了不止 10 倍。" 人工智能在讀博士、做過相關大模型研究的牛小博表示。" 目前 Sora60 秒的穩定生成效果,将對短視頻行業帶來革命性影響。"
研究 AI 的阿涅也表達了相同觀點," 創作者的門檻被降低,哪怕視頻的可信度還沒那麽高,甚至會出現一些錯誤,但不仔細很難看出來,将來技術也會很快叠代。"
綜合多位從業者的說法,Sora 直接解決了文生視頻領域的兩大難題,準确性和一緻性。
AI 研究者 Cyrus 的感受是,與之前的工具相比,"Sora 就像三體人打原始人 "。
所謂準确性,指生成的視頻能準确識别用戶輸入的文字需求,一緻性是指,在運動過程中,主角在多視角運動變化中内容連貫,不會發生形變,同時其變化還能遵循物理規律。最明顯的表現是,主角和背景的互動符合邏輯。
一年前,牛小博和團隊還在探讨生成式 AI 無法了解空間尺度,比如生成圖尺寸不對,但他們覺得,Sora 的出現已經解決了這個問題。
有人用視頻還原物理空間模型,發現也能夠對應上,牛小博覺得這證明了 Sora 的空間計算能力基本正确,而人對空間的感知很大一部分也依靠視覺。
從這個角度看,Sora 生成的視頻背後,有物理空間的邏輯支撐。
綜合多位受訪者的觀點和多位科技界大佬的公開發言,盡管還有瑕疵,但 Sora 給視頻乃至整個人工智能領域的重大突破在于,這是一個更智能、甚至具備一定思維能力的模型,其生成的視頻能理解物理世界的客觀規律。
這也讓一批做短視頻内容的從業者開始思考,Sora 到底會不會搶自己的飯碗?
我們把現有的短視頻簡單分爲兩類,一類由真人出鏡,往往真人就是一個賬号甚至一家公司的 " 核心資産 ",Sora 對這類内容的沖擊并不大;另一類由素材集合而成,考驗拍攝、創意能力。Sora 的出現,将大大提升這類視頻的生産效率。
一些想要提高産量的創作者,非常期待 Sora 的到來。
大成表示,這類工具完全可以取代公司的低端勞動。" 我們公司體量小,爲了節省成本招了很多大學生,但他們剛畢業,半天憋不出一個文案,用了 AI,幾分鍾就能寫出上百條。"
去年他和團隊就開始大規模使用 AI 工具了," 雖然這些工具還不成熟,但處理文案和粗剪,都很好用。作爲一家視頻生産商,一定要提高效率。" 他表示。
對于一些有創意的團隊來說,則認爲短期内 Sora 不會對他們産生威脅。
頭部 MCN 機構負責人達克告訴「定焦」,"Sora 還沒有開始公測,該技術離成熟還有很長一段時間,而且我們的視頻主要靠人的創意、頭腦風暴,包括拍攝也是講究創新的,鏡頭如何設計、如何過渡,都有思考。雖然 Sora 很強大,但完不成我們目前的創意設計需求。" 他還透露,目前公司沒有使用任何 AI 工具。
不過,這些創作者們必須面對的問題是,Sora 的出現降低了短視頻創作門檻,會有越來越多的人加入,跟他們搶奪流量和變現機會。
一名新媒體從業者表示,他們有内容創作能力,但苦于沒有合适的視頻拍攝、剪輯團隊,新的工具出現,就是他們的機會。
綜合多位業内人士的觀點,在類型上,目前 Sora 對真人出鏡類短視頻影響較小,對動漫類、解說類内容影響比較大,甚至會淘汰很多沒有創意、隻蹭熱點的批量做号公司。在崗位上,部分做機械性重複工作的人員可能會面臨淘汰,但創意類人員會被提至更高位置。
總之,未來做短視頻,參與者更多,競争也更激烈。
2 抖音快手們會慌嗎?
Sora 的出現,将給短視頻平台帶來更加豐富的供給,但同時也讓抖音快手們面臨新的考驗。
從業者表示,一方面,AI 生成視頻過多,會對短視頻平台原有的内容生态造成沖擊,另一方面,Sora 的火爆,會搶走一部分抖音、快手旗下剪映、快影等工具的用戶。
達克告訴「定焦」,AI 生成的内容在上傳短視頻平台時,需要特殊标注。
去年 5 月,抖音就發布了《抖音關于人工智能生成内容的平台規範暨行業倡議》,這一倡議提出,要對該類内容進行顯著标識,虛拟人使用者需要實名認證,同時對利用 AI 工具創作、發布侵犯肖像權、弄虛作假等内容進行嚴格處罰。
快手、小紅書等平台也有相關的限制。今年 2 月,小紅書官方發布 AI 創作内容的規範,要求創作者主動聲明 AI 創作内容、不能用 AI 創作内容虛構使用體驗進行商業變現等。
多位從業者表示,他們能夠明顯感覺到,平台在控制該類内容,甚至會限流。
"AI 創作的内容同質化嚴重,且創意性不高,用戶一旦刷到太多相似内容,就會變得不耐煩,甚至轉戰其他平台。" 一位互聯網行業觀察者表示。
他還覺得," 如果平台對這類内容不做限制,越來越多創作者也會圖省事使用 AI,這會嚴重影響到平台各類内容占比,最直觀的是,一些獨有的、稀缺的視頻會減少。"
以及還有可能會誕生大量虛假視頻。Sora 能快速生産大量逼真的短視頻,也讓造假變得輕而易舉,一些用戶對該類内容難辨真僞,一旦被騙,平台公信力也會受到嚴重影響。去年,利用文生圖、AI 換臉等 AI 生成内容進行詐騙的案件就被曝出不少。
在 Cyrus 看來,如果平台扶持 AI 創作類内容,很像 " 爲他人做嫁衣 " ,結果就是影響用戶留存。" 設想一下,如果小紅書上全是字節豆包大模型生産的内容,用戶爲什麽不直接刷抖音呢?反之亦然。"
Cyrus 預測,抖音、快手、小紅書、B 站上,不會大量推薦 AI 創作的内容。除非是平台自己做的文生視頻大模型,在自家進行大範圍推廣後,進行單獨變現。" 比如當其優化到一定程度,可以直接走用戶付費模式,但各家的産品目前都不具備這一能力。"
不止一位業内人士推斷,Sora 和其他 AI 視頻創作工具之間的差距會越來越大,此前,"Sora 會不會殺死剪映 " 的話題就曾引發熱議。Sora 如果被大規模應用,大多數 AI 工具可能會被市場抛棄,其他公司前期的大筆投入将付諸東流。
爲什麽差距會拉大?
周鴻祎曾公開指出,國内的大模型發展水平表面上看接近 GPT-3.5,實際上離 4.0 還有一年半的差距。牛小博從技術端給出解釋,Sora 不是一個點狀技術,而是一個複雜的系統工程。即便外界知道其核心技術是 transformer 注意力算法 +diffusion 的擴散算法等,但其背後是 OpenAI 給予的資金支持和積累的超強數據。
OpenAI 通過積累的 GPT 通用語言模型加上 DALL-E3 圖像生成模型,發展出視頻能夠理解圖片内容,到 Sora 的時候,又提升了一緻性和物理空間理解能力,這每一步的積累,缺一不可。
更大的預測更是讓抖音們前路難料。有影視從業者認爲,Sora 被大範圍使用後,有可能會出現比抖音更大的新平台。
在一部分人看來,Sora 降低了用戶門檻,必然導緻内容創作者數量級猛增,而抖音這樣的短視頻平台,其體量、内容創作和推送的邏輯規則,能否承載該類内容很難說,很可能會誕生一個與 Sora 更相符合的平台。
牛小博通過觀察互聯網行業的發展,也贊同這一觀點。" 互聯網在早期是專業用戶使用,後來 PC 的普及擴大了用戶,接着智能手機出現,人人可以聯網,以至于服務各類人群需求的平台都出來了。也許随着 Sora 使用人群的增加,會有新的生态出現。"
3 Sora 影響巨大,但不必神化
目前,Sora 還沒有開放公測,隻有一些視覺藝術家、電影制作人、OpenAI 員工等人士獲得了訪問權限。一部分原因是,Sora 并非完美無缺。它對短視頻的沖擊,還沒有完全展現。
AI 訓練師小剛指出,Sora 存在大模型普遍存在的 " 幻覺問題 ",它在理解物理規律、人與物體交互等方面還存在缺陷。
比如 OpenAI 官網公布了一些缺陷視頻,包括蠟燭吹不滅、投籃時籃球在下落過程中爆炸,以及挖出來的椅子直接漂起來等不符合物理規律的内容,這是因爲 Sora 的理解還不夠成熟,誤以爲從沙子裏挖出來的東西,一般都比較輕。
而具體到短視頻行業,小剛認爲 Sora 最重要的一個不足是,還做不到人物固定。
舉個例子,比如創作者用 Sora 生成了一條 60 秒的視頻,畫面中主角爲 A,但其在生成下一個視頻後,主角很可能就換成了 B。
相比 Pika、Runway,大家能看到 Sora 的空間能力很強,但内容再短,做不到人物固定就沒有意義,用戶持續在短視頻平台觀看内容,無論是真人還是動畫,都需要一個中心人物保證故事的延續性。
以及算力問題,也讓很多人擔憂 Sora 的普及速度。畢竟技術突破再大,如果成本過高,還是難以被大衆接受。多名業内人士認爲,這是目前 Sora 面臨的最大困難。
" 目前 OpenAI 沒有公布 Sora 具體的算力、能源消耗需求以及參數量。初步判斷,它需要的數據量、算力以及大量的能源消耗将是巨大成本,而這與其下個階段的廣泛推廣必然存在矛盾。" 牛小博認爲。
每一次新技術的出現,都會引發一場新舊交替的大讨論。
虛拟拍攝技術剛誕生時,爲影視行業節省了拍攝成本,但傳統的拍攝方式至今仍然存在。OpenAI 推出 ChatGPT 一年多以來,文字從業者也沒有被替代,反而讓更多人意識到優質内容創作者的價值。
同理,Sora 對市場上同類 AI 工具帶來了沖擊,但它再強,淘汰的更多是沒有創意、隻想走量的短視頻從業者,或是不會使用這類工具的人。
至于 Sora 是否會颠覆整個短視頻行業,會不會誕生下一個超級平台,目前大家還在觀望,需要看 Sora 能否迅速解決現有問題,以及國内有沒有新的挑戰者誕生。
* 封圖及文中配圖來源于 Sora 官網。應受訪者要求,文中達克爲化名。