"Sora 隻是小試牛刀,它展現的不僅僅是一個視頻制作的能力,而是大模型對真實世界有了理解和模拟之後,會帶來新的成果和突破。"
2 月 16 日,360 創始人周鴻祎發布微博提到自己對 Sora 的看法,周鴻祎認爲,Sora 的誕生意味着 AGI(通用人工智能)實現可能從 10 年縮短至一兩年。
周鴻祎認爲,科技競争最終比拼的是讓人才密度和深厚積累," 很多人說 Sora 的效果吊打 Pika 和 Runway。這很正常,和創業者團隊比,OpenAl 這種有核心技術的公司實力還是非常強勁的。有人認爲有了 AI 以後創業公司隻需要做個體戶就行,實際今天再次證明這種想法是非常可笑的。"
此外,AI 不一定那麽快颠覆所有行業,但它能激發更多人的創作力。周鴻祎表示,很多人擔心 Sora 對影視工業的打擊,在他看來,機器能生産一個好視頻,但視頻的主題、腳本和分鏡頭策劃、台詞的配合,都需要人的創意,至少需要人給提示詞。一個視頻或者電影是由無數個 60 秒組成的。今天 Sora 可能給廣告業、電影預告片、短視頻行業帶來巨大的颠覆,但它不一定那麽快擊敗 TikTok,更可能成爲 TikTok 的創作工具。
談到 Sora 最大的優勢,周鴻祎表示,以往文生視頻軟件都是在 2D 平面上對圖形元素進行操作,可以把視頻看成是多個真實圖片的組合,并沒有真正掌握這個世界的知識。但 Sora 産生的視頻裏,它能像人一樣理解坦克是有巨大沖擊力的,坦克能撞毀汽車,而不會出現汽車撞毀坦克這樣的情況," 這次 OpenAI 利用它的大語言模型優勢,讓 Sora 實現了對現實世界的理解和對世界的模拟兩層能力,這樣産生的視頻才是真實的,才能跳出 2D 的範圍模拟真實的物理世界。"
周鴻祎提到,有了大模型技術作爲基礎,再加上人類知識的引導,可以創造各個領域的超級工具,例如在生物醫學、蛋白質、基因研究,包括物理、化學、數學的學科研究上,大模型都會發揮作用。
" 一旦人工智能接上攝像頭,把所有的電影都看一遍,把 YouTube 上和 TikTok 的視頻都看一遍,對世界的理解将遠遠超過文字學習,一幅圖勝過千言萬語,這就離 AGI 真的就不遠了,不是 10 年 20 年的問題,可能一兩年很快就可以實現。" 周鴻祎感慨。
他還提到,盡管國内大模型發展水平表面看已經接近 GPT-3.5,但實際上跟 4.0 比還有一年半的差距。OpenAl 手裏應該還有一些秘密武器,無論是 GPT-5,還是機器自我學習自動産生内容," 奧特曼(OpenAI CEO)是個營銷大師,知道怎樣掌握節奏,他們手裏的武器并沒有全拿出來。這樣看來中國跟美國的 AI 差距可能還在加大。"
2 月 16 日,OpenAI 宣布推出全新的生成式人工智能模型 "Sora"。據了解,通過文本指令,Sora 可以直接輸出長達 60 秒的視頻,并且包含高度細緻的背景、複雜的多角度鏡頭,以及富有情感的多個角色。
據介紹,Sora 是基于過去對 DALL · E 和 GPT 的研究基礎構建,利用 DALL · E 3 的重述提示詞技術,爲視覺模型訓練數據生成高描述性的标注,因此模型能更好的遵循文本指令。Sora 能夠生成具有多個角色、特定類型的運動以及主題和背景的準确細節的複雜場景。不僅了解用戶在提示中要求的内容,還了解這些東西在物理世界中的存在方式。同時,該模型對語言有深刻的理解,使其能夠準确地解釋提示并生成表達生動情感的引人注目的角色。
運用 Sora 也可以生成高清圖像。 圖片來源:OpenAI 官網
這意味着,繼文本、圖像之後,OpenAI 将其先進的 AI 技術拓展到了視頻領域。OpenAI 亦表示,Sora 是能夠理解和模拟現實世界的模型的基礎,這一能力将是實現 AGI(通用人工智能)的重要裏程碑。
對于 OpenAI 視頻生成模型的出現,業内其實早有預期,但仍有人評價稱 " 比想象中來得更快 ",亦有人振奮地表示 " 我們真的看到新工業革命來臨 "。
2 月 16 日,業内分析人士對《每日經濟新聞》記者表示,Sora 無疑是人工智能領域的一次重大突破,該技術不僅展示了 AI 在理解和創造複雜視覺内容方面的先進能力,而且對内容創作、娛樂和影視制作行業帶來了前所未有的挑戰和機遇。
每日經濟新聞綜合周鴻祎微博、每日經濟新聞(記者:熊嘉楠、可楊)
每日經濟新聞