圖片來源 @視覺中國
文 | 蔚然先聲,作者 | 張從白,編輯 | 劉漁
正月還未過完,科技界便發生 3 件大事。
一是英偉達推出 Chat With RTX,将每個人的電腦變成本地化系統大模型;
二是谷歌 AI 推出了 Gemni1.5 版本,與 GPT-4 相比,可處理超過 100 萬個 token 的輸入窗口;這兩件事似乎與普通人的日常生活還有一定距離。
但第三件事卻刷爆了每個人的朋友圈—— Sora 的發布。它是 OpenAI 推出的全新生成式人工智能模型。
網傳世界将被改變
2 月 16 日淩晨,OpenAI 發布了重磅更新,推出了首個文生視頻模型 Sora。用戶通過文本指令,可使 Sora 直接生成長達 60 秒的視頻,包含精細的背景、主體,靈活的多角度鏡頭,以及多個富有情感色彩的角色。
Sora 發布後短短 2 天内,迅速成爲全球互聯網熱議的焦點,關于其将徹底改變影視業和短視頻行業的預測層出不窮。
Sora 還沒有對公衆開放,據《MIT Technology Review》報道,OpenAI 目前沒有計劃向公衆發布 Sora,能夠使用 Sora 的隻有相關程序人員、安全測試人員以及經過 OpenAI 挑選的少量創作者和藝術家。
除了應對監管與潛在危害的風險,OpenAI 的當務之急是将 Sora 交予視覺藝術家、設計師和電影制作人進行測試。可以看出,這套文生視頻模型将優先面向影視相關行業,OpenAI 也希望通過專業人員的評估獲得相關反饋,以推動模型進步。
此前,生成式 AI 已逐漸通過利用自動化、個性化和優化技術,重塑了媒體、廣告、金融和教育等多個行業的運作方式,提高了生産效率、優化了決策過程。而 Sora 的誕生意味着 AIGC(人工智能生産内容)的時代或許已經來臨,Sora 這類工具也或許将深遠地颠覆未來的内容創作與商業格局。
我們注意到 OpenAI 已經更新了 48 個由 Sora 生成的視頻 demo,在經過我們反複觀看與分析後得出了以下看法:
1. Sora 脫穎而出是因爲它克服了 " 物理難題 "
相較于同類産品 10 秒的創作上限,Sora 生成視頻長達 60 秒,其生成内容的精細畫面已經達到與現實世界難以區分的程度。此外,Sora 生成内容的主體與背景環境的一緻性更是令人震撼。
但最關鍵的地方還是在于 Sora 對于世界模型的掌握。通過學習,Sora 能了解現實世界的運行常識與物理規律。而以往的擴散模型隻能實現文本與 3D 模型的普通轉換,無法直接嵌入在一個虛拟的物理世界中。
簡單來說,以往用文生視頻給人的感覺更像是 " 會動的圖片 ",其中視頻背景與主體之間缺乏動态交互,無法跨越 " 真實 " 的門檻。
而以 Sora 生成的視頻「海盜船在咖啡杯中纏鬥」爲例,其水面流體動力學以及運動規模比例的物理難點都得到解決。
英偉達高級研究科學家 Jim Fan 甚至表示:"Sora 是一個數據驅動的物理引擎 "," 是一個可學習的模拟器,或「世界模型」"。
2. Sora 的升級速度會快得吓人
Sora 這類 AIGC 工具的能力基于大數據訓練,和此前的 Chat GPT 一樣,具有網絡效應,這種效應使得其叠代進化的速度異常迅速,且這種速度無法用摩爾定律來準确衡量。
但與 Chat GPT 不同的是,Sora 生成的 AI 内容對普通人來說更爲直觀,更容易在大量用戶與從業者之中獲取反饋。由于短視頻是當前世界的主流娛樂方式和信息媒體,其廣泛的信息來源和傳播渠道爲 Sora 的自我學習和提升提供了有力支持。
雖然早期 Sora 也出現過對物理的錯誤理解,如「果汁從杯底灑出」,但這也能表明 Sora 正在不斷地自主探索物理世界,這種通過糾錯與學習的升級方式,更符合未來人們對 " 智能 " 的理解。
所以 Sora 對于創作的内容理解将不斷升級,綜合水平已經大大超越了此前熱門的 Runway 和 Pika,随着大數據的不斷累積,Sora 的發展前景目前看不到盡頭。
360 創始人周鴻祎表示,一旦 Open AI 的人工智能把所有的電影、視頻都看一遍,這就離 AGI 真的就不遠了,不是 10 年 20 年的問題,可能一兩年很快就可以實現。
3. 普通人使用 Sora 的創作質量并不會輸于多數專業人士
曾經,拍攝一張照片需要購入昂貴的相機,學習調整各種參數,而沖洗照片則涉及複雜的化學試劑和多個步驟。然而,随着數碼相機和智能手機的出現,每個普通人都能随時随地拍攝和觀看照片。這使得傳統的攝影師的專業性逐漸隻能通過構圖、采光、個人風格等抽象因素來展現。
如今,Sora 也将帶來這樣的改變。随着其大模型的完善和自我學習能力的增強,Sora 能讓一個完全沒有影視制作和藝術設計經驗的普通人直接生成一段符合他描述的視頻,而這段視頻所帶來的效果和科幻大片高成本制作的特效不相上下。
這意味着,未來的網文作者在寫作文章的同時,也可能獨自完成一部小說改編的玄幻短片。而對于特效制作和虛拟場景搭建的專業人士來說,如果高成本制作的畫面最終與草根作者的作品相差無幾,這無疑會給他們帶來不小的壓力。
4. 對于短視頻創作者而言,真實的、富有情感的内容價值将無限上升。
短視頻創作者應當深入思考的是,在 Sora 等工具推動 AIGC 發展的背景下,短視頻作爲主流的信息獲取渠道,其中必将充斥大量由 AI 生成的内容,而整活、風景、叙事等視頻分類更是生成内容的 " 重災區 "。
并且随着 AIGC 技術的不斷進步,用戶已難以辨别内容是否由 AI 創作,這使得用戶和創作者去區分内容真實性的重要性降低。
但不論 Sora 有多麽 " 理解 " 世界,也無論其生成的視頻内容有多麽逼真,它們始終是數字模拟的産物,無法替代真實拍攝所展現的現實。因此,爲了在未來避免被生成視頻内容的洪流所淹沒,短視頻創作者如果專注于真實拍攝,并通過深入的情感展現來觸動觀衆,将會取得更好的效果。
對 Sora 的預測
自 Sora 發布以來,影視行業首先受到了廣泛關注。尤其是 Sora 生成視頻的特效最爲驚豔,與好萊塢大片相比也毫不遜色。很多人認爲 Sora 能降低影視行業視覺特效的制作成本,從而改變影視行業的制作模式和産業鏈。
我們團隊也迅速将 Sora 生成的幾段視頻分享給了影視和攝影行業的從業者。幾位視效專家表示,對于寫實類的視頻,Sora 的生成效果并不真實。普通人可能隻會覺得有點怪,因爲大部分的失真問題都出在光影方面。
對于 Sora 生成的 CG(計算機動畫)類小場景視頻,他們表示整體上很到位,甚至目前很多相關 CG 制作公司的作品完全不能與 Sora 相比。
盡管 Sora 在生成 CG 方面表現出色,同時能以極低的成本制作出震撼的 60 秒視頻内容,但一部電影并非由多個 60 秒的片段簡單拼湊而成。
影視行業往往需要制作宏大且連貫的場景,而目前的 Sora 還無法滿足這種需求,此外,Sora 生成的内容在細節方面也很難經得起專業的考驗。
60s 短視頻對叙事的要求與長視頻電影完全不同,類似的是,AI 可以寫出一個還不錯的段子笑話,但很難寫出幾十上百萬字的優秀小說。
我們認爲,盡管 Sora 有強大的生成與學習能力,但在要求表達大量内容和細節的場景時仍顯得力不從心。目前,Sora 還無法完全替代人工來接替影視創作的工作。然而,不可否認的是,Sora 是一個出色的概念創意工具。尤其是其在小場景視頻中的優勢,預示着它将對廣告行業、創意行業産生深遠的影響。
另一個備受關注的領域是視頻平台。數據顯示,目前國内短視頻用戶的規模在 10 億以上,其中抖音 2022 年的年收入達到了 700 億美金以上,快手也實現了 900 億人民币的年收入。
然而,面對這樣一個龐大的市場,在 Sora 發布之前,所有的視頻生成工具都未能達到商業化或工業化生産的标準。
與 Pika 和 Runway 相比,Sora 不僅提供了精美的畫質,其視頻内容也更爲豐富多樣,同時視頻時長也增加了十多倍。如果用于短視頻創作,這将極大提升用戶的新鮮感。然而,當衆多創作者都選擇利用 Sora 輸出内容從而被動 " 同質化 " 時,如何确保自己的作品質量出衆,這才是使用 Sora 真正的問題。
AIGC 的興起降低了整活、追熱點和段子視頻化的門檻,導緻單純依賴生成視頻不足以維持創作者的競争力。目前看來,小說、叙事類自媒體可能更能充分發揮 Sora 的優勢,因爲 Sora 尚無法生成具有獨特調性和核心創意的視頻。
因此,對于視頻平台的内容創作者來說,Sora 并不能替代他們自身的創意和靈感,而隻能作爲輔助工具來提升創作效率和質量。
就 Sora 目前所生成的視頻而言,優秀作品主要集中在動物、遠景建築和幻想場景等領域。這些視頻在過去往往需要創作者支付高昂的版權費用以使用。因此,Sora 的出現很可能首先颠覆素材版權行業。
Sora 的強大生成能力同時伴随着對社會秩序的潛在巨大破壞力,因此,不可避免地會吸引一些居心叵測的人利用其進行詐騙、勒索、诽謗等不法行爲。
可以預見的是 Sora 的正式推出不但要面臨自身的叠代優化,還要面臨世界多個國家和地區的嚴格監管,我們認爲短期内 OpenAI 并不會向公衆發布 Sora。但無論 Sora 何時向用戶發布,它都将進一步證明 AI 已經成爲人類社會不可或缺的一部分。
Sora 的出現無疑是 AI 發展的一個巨大成功。它在人類現有知識基礎和世界模型的基礎之上,疊加了相關的自我學習技術,這無疑是 AI 發展的正确道路之一。AI 企業将很容易利用這種模式打造各行業的超級工具。
前些年,元宇宙、VR、人工智能等概念風起雲湧,但始終沒有具象化的産物出現。如今,Meta 頭顯已經擁有千萬銷量;英偉達通過 AI 概念市值達到了 1.7 萬億美元;蘋果公司也發售了自己的頭顯設備 Apple Vision Pro;OpenAI 旗下的人工智能産品也在不斷更新換代。可見,一個圍繞虛拟與人工智能的時代正以不可逆的架勢向我們襲來。