威爾 · 史密斯再次貢獻了梗圖,上回是奧斯卡的一巴掌,這回是意大利面的吃播。
2023 年 3 月,一位 Reddit 網友用 AI 制作了威爾 · 史密斯吃面的搞笑視頻,面目猙獰,五官變形,看得人胃口全無。
2024 年 2 月,OpenAI 發布 Sora 的兩天後,威爾 · 史密斯本尊在 Instagram 發布了一條吃面的對比視頻,人變帥了,進食動作也體面了。
你以爲下半部分的視頻是由 Sora 生成的?不,面就是威爾 · 史密斯真人親口吃的,整了個活而已。
前腳被 Sora 的官方演示震撼,後腳看到這條動态,人們陷入了我是誰、我從哪裏來、我到哪裏去的人生懷疑。
雖然 Sora 還沒有對外開放,但互聯網已經變得越來越荒謬了:AI 視頻越來越接近真實,越來越多的真人視頻卻假冒 AI。
能不能殺死好萊塢不知道,Sora 先把我大腦幹燒了
Sora 穩定發揮的視頻,我們或多或少都看過了,同時 OpenAI 也把翻車視頻大方發布出來,其中有些在社交媒體熱度更高,尤其下面這個提示詞是「考古學家在沙漠發現一把普通的塑料椅子,小心地挖掘并除塵」的視頻。
椅子好像是個會呼吸、有想法的異世界生物,不被重力和人力無法束縛,憑空出現、變形,還偷偷帶走了一個人類。這或許并非 AI 的錯,畢竟提示詞裏沒有寫明,他們是否在地球上。
如果視頻被分發到社交媒體,可能會打上這樣的标簽:# 意識流、# 超現實主義、# 人類早期馴服野生椅子的珍貴視頻 ......
OpenAI 認真地解釋了爲什麽出現 bug:Sora 未能将椅子建模爲剛性物體,即外力作用下不改變形狀和體積的物體,所以導緻物理交互不準确。
Sora 這個摔碎杯子的視頻,仿佛也是吃了毒蘑菇才能看見的藝術,杯子竟然無風自動,液體先像果凍一樣閃現玻璃才摔碎,每個步驟都在意料之外。
另外,還有倒着用跑步機的運動健将、怎麽也吹不滅的生日蠟燭、憑空出現又消失的狼群 ......AI 在不經意間,做出了人腦和特效都想不到的事。
Sora 官宣以來,AI 大佬們就在争論它能否理解物理世界,OpenAI 的技術報告沒有明确表态,隻是提到,Sora 可以模拟現實世界中人、動物和環境的某些方面,但可能難以準确模拟複雜場景的物理原理,比如混淆左右、咬了餅幹後沒有咬痕。
趁 AI 還未進化到完全态,不妨腦洞大開。還不穩定的 AI 視頻,完全可以作爲靈異、懸疑、恐怖、幻想題材的素材庫,爲創作提供新的靈感,越要掀牛頓棺材闆的,表現得就越藝術。
就像「挖掘椅子」和「摔碎杯子」,已經可以用到 MV、廣告、電影、遊戲裏,看起來還是個大制作,效果縱然詭異,卻意外得很絲滑,完勝 B 站「學了五年動畫」系列。
盡管内容已經如此魔幻,還是有網友猶豫了一秒:「不露 bug,我都懷疑它是拍的。」「這是在玩魔術嗎?」
這是因爲,哪怕是 Sora 的翻車視頻,時長、畫質、穩定性也依然能夠吊打 Pika、Runway 等「前輩」。
當其他工具生成的視頻不過 3 到 4 秒、盡量保持單鏡頭穩定時,Sora 把上限拉到了 1 分鍾,實現多鏡頭的無縫切換,相對準确地保持畫面主體和視覺風格的一緻,仿佛會用鏡頭語言和叙事節奏講故事。
乍看之下,好像現場真的有攝像機跟拍,人、物體和場景都在三維空間裏移動,同個角色還能有多個視角。
▲ Sora 可以實現多個視角 .
有人開玩笑說,這是 AI 生成視頻從「動圖」到「視頻」的飛躍。
翻車的 Sora 視頻當然也可以算入其中,就像亂七八糟寫了一堆代碼,但恰好能運行。
360 董事長周鴻祎在微博談到一個很有意思的觀點:Sora 工作原理像人類的做夢,我們會夢到奇奇怪怪的東西,但依據的是我們在生活中眼睛看到的東西、積累的經驗,不用像影視工業那樣 3D 建模然後一幀幀地渲染。
從某個角度看,生成式 AI 确實像一個夢境機器,越來越接近人類的思維方式,用各種提示詞有概率地制造合理或者不合理,不論對錯,它一定會給你一個答案。
其實從 ChatGPT 開始,人們就想借着 AI 将夢境落地,小紅書上有不少将夢境可視化的帖子,雖然無法真正還原腦海的效果,卻也将部分精神世界的幻影帶入了現實。
未來的 Sora,可能更讓夢境或者說人類的創意生動起來,輸入文本、圖片或視頻,就能「一鍵」加入光影變化、調整畫面角度甚至配上音效 ......
好萊塢的精英會不會失業不知道,網友們已經躍躍欲試,除了搞黃色的本能,腦洞也有了安放之處。
自嘲一敗塗地的人類,将模仿 Sora 當成流量密碼
翻車視頻之外,Sora 的其他視頻乍見驚豔,但也經不住放大鏡式的審視。店鋪招牌的亂碼、貓的第五條腿、模特踏錯的步伐 ......
Bug 或許是 AI 和現實的最後一堵牆,但人類自己想把它推倒。
雖然 Sora 還沒有開放給公衆使用,但賣課和賣芯片的賺錢了,玩梗的樂子人們也找到了渾水摸魚的辦法,發明了一種新的引流方式。
他們在社交媒體發布視頻時,往文案裏加入「由 Sora 生成」和像模像樣的提示詞,僞裝成是 AI 制作的,就像威爾 · 史密斯模仿 AI 如何模仿自己。
各個賽道的短視頻博主都參與其中。曬萌寵的、打遊戲的、安利偶像單曲的、給産品打廣告的 ...... 真的不是給 Sora 提供就業靈感嗎?
其中最讓人真假難辨的當屬寶萊塢電影,印度警匪片的情節和特效尤其驚人,對人類來說太超前了,也讓物理學不存在了,連 AI 都要向他們拜師學藝。
如果不是熱心群衆添加注釋,附上了 11 年前上傳的 YouTube 鏈接證明印度電影非人的先鋒性,誰也不敢打包票。
甚至 Netflix 印度官方賬号也來湊熱鬧,從印度抗英神片《RRR》截取了個片段僞裝是 Sora 生成,按照印度大片一貫的浮誇,頭幾秒确實可能會騙到觀衆。
這些假冒 AI 的視頻固然由人類整活,AI 混在其中都顯得平平無奇,但 AI 未必不能效仿。
混淆視聽、自作自受,傷害還是人類自己,猜疑鏈已經出現了。
網友們開始擔心,當 AI 生成和真人實拍真的傻傻分不清楚,自己沒做過什麽,卻可能「證據确鑿」。
這就是懸疑英劇《真相捕捉》上演的情節:情報機關爲了給罪犯定罪,僞造了監控錄像。
他們認爲,僞造監控錄像,隻是将竊聽材料等非法證據,「重演」爲合法證據,事情的确發生了,罪犯的确犯罪了。
但是誰也不知道,使用技術的人會不會越界,從移花接木走向無中生有。
辨别 AI 的應對之法,也可能換個角度,用來當作金蟬脫殼的妙計。
因爲 AI 不擅長畫手,所以之前有個梗圖是,犯罪分子戴着假手指犯罪,看起來有六根手指,就可以污蔑監控錄像是 AI 生成、沒法作爲呈堂證供。
AI 接近現實,同時人類假冒 AI。AI 僞造呈堂證供,也能被利用讓證據無效。一個魔法打敗魔法的魔幻世界,可能真的要到來了。AI 還沒法主動作亂,打破信任的還得是人類自己。
AI 還未必能模拟世界,但已經影響了我們看待世界的方式
關于 AI 讓真實與虛假更難分辨的問題,當我們說到 Deepfake 換臉時,其實已經讨論太多了。Sora 又能有什麽不一樣?
最近,OpenAI 做了一個意想不到的舉動——開設 TikTok 賬号,上傳 Sora 的作品。
OpenAI 不僅爲每個視頻貼心地标注了 AI 生成,怕人們混淆現實,還附上了提示詞。
「一段逼真的視頻,展示了一隻可以在水下遊過美麗珊瑚礁的蝴蝶」「 一片葉子的微距拍攝,顯示微小的火車在葉脈中移動」「低至地面的攝像機密切跟蹤叢林中的螞蟻」......
這些視頻混迹在真實的短視頻信息流中,配上了背景音樂,如果稍微不注意,手指滑得快了些,就可能被認爲是真實的。
網友們半開玩笑半認真地在 OpenAI 評論區囑咐:「你最好制作水印之類的東西,否則人類就注定要滅亡。」
Sora 還沒落地,其實所有人都在猜測,視頻内容從業者可能是最淡定的一批人,因爲他們更加專業,也更懂商業化,Sora 的 Demo 一堆問題,内容的一緻性和準确性不夠,做不到甲方精細的要求,技術就很難被引入工業流程。
但我不是很樂觀,AI 影響的早已不隻是真假,而是我們看待世界的方式,它并非直接代勞某個剪輯軟件、某個腳本、某個導演。
AI 從業者 @Kwebbelkop 猜測,OpenAI 目前隻在 TikTok 發布 AI 短視頻,可能是爲了收集觀看次數等相關用戶數據,對模型進行來自人類反饋的微調,未來甚至再造一個 AI 版 TikTok。
短視頻的算法已經非常能猜你喜歡了,如果再加上生成式 AI,讓視頻内容更加定制化,又會發生什麽?
未來,我們的觀影體驗也可能發生質的變化,不依賴于電影院和流媒體,可以用大語言模型和視頻生成模型決定故事内容和主演陣容。
然而,OpenAI 對 AI 産品的期待絕對不隻是陪你聊天、制作視頻,更深入的野心是讓 AI 學習人類的自然語言和世界的物理規律。
哪怕局限在視頻領域,就讓 Sora 能做粗糙的概念片,也已經很厲害了。制作視頻的方式、内容的風格,甚至我們對内容的喜好,或許都将因爲 AI 而發生改變。
先不說 AI,幾乎人人持有的手機,其實已經影響了視頻的拍攝和制作方式,讓人人成爲自己生活的導演。
對着鏡頭邊說話邊化妝的美妝視頻、展現個人生活碎片的 Vlog 等,就是在這種影響之下,很多博主在卧室用手機就能拍攝的産物。短視頻的井噴,也讓我們越來越習慣用手機上下滑動,耐心更少,注意力更分散。
盡管相比 Sora,Runway、Pika 等視頻生成工具能力有限,也已經有人結合 Midjourney 等圖片生成工具,用它們做了電影預告。
因爲穩定性較差,所以視頻風格也有了取舍,以快速剪輯爲主,搭配旁白,注重節奏感和視覺沖擊,但缺少人物的對話和更複雜的場景。
▲ AI 科幻短片《Borrowing Time》.
相比之下,Sora 可以支持更複雜的場景、角色動作以及角色和周圍世界之間的交互。有人用 Sora 的樣片,再用 AI 語音工具 ElevenLabs 配音、用 iMovie 剪輯,就做出了一個更加流暢的、仿佛「一鏡到底」的「電影預告」。
Sora 對外展示的兩類視頻,大概可以分爲兩種,一類是創意腦洞,宇航員站在寒冷的星球、兩艘海盜船在咖啡中決鬥、卡通人物跳迪斯科,一類是接近現實,淘金熱時期的加州、火車車窗上的倒影、2056 年尼日利亞的戶外 ......
火車車窗上的倒影,很像 Vlog 會拍攝的鏡頭。尼日利亞的戶外,鏡頭從露天市場平移到城市景觀,也非常像新聞視頻的空鏡,已經有人打算将數字人和這條視頻結合。
拍攝甚至在有些時候顯得沒有必要了。Sora 可以通過提示詞,直接制作某個旅遊景點的鳥瞰圖,和人類飛無人機的鏡頭相差不遠。我們的眼睛和大腦知道聖托裏尼島長什麽樣,AI 同樣也「知道」,那麽就可以交給 AI 代勞。
之前有個很有意思的比喻,這個世界就是個巨大的「地球 online」,由太陽系開發的大型多人在線角色扮演遊戲,擁有最優秀的 3D 裸眼和 VR 系統。
OpenAI 提出的「世界模拟器」的概念,某種程度上是把一切當作信息輸入,汲取着文字、圖像、視頻,然後又輸出信息,把文字變成繪畫,把圖片變成視頻,仿佛「地球 online」的主宰,但我們未必了解其中的原理,可能隻是給出要求,然後得到結果。
這樣的未來應該還很遠,至少眼下,Sora 的視頻看多了,也會讓人覺得無聊,走在東京街頭的女性,眼睛裏沒有情感,感受不到人的氣息,但我們刷短視頻時有時也是這樣,世界需要精妙的電影,也接受巨大的冗餘,就像《黑客帝國》主角的反抗也是設計好的。
AI 參與感越來越強的未來将要到來。下次看到一個疑似的 bug,我們可能不會直接判斷是假的,我們或許像做閱讀理解一樣想,AI 在這裏是不是有什麽用意。我們也許不會喜歡,但不得不接受。