OpenAI發布首個視頻生成模型Sora，周鴻祎：意味着AGI實現将從10年縮短到1年

"Sora 隻是小試牛刀，它展現的不僅僅是一個視頻制作的能力，而是大模型對真實世界有了理解和模拟之後，會帶來新的成果和突破。"

2 月 16 日，360 創始人周鴻祎發布微博提到自己對 Sora 的看法，周鴻祎認爲，Sora 的誕生意味着 AGI（通用人工智能）實現可能從 10 年縮短至一兩年。

周鴻祎認爲，科技競争最終比拼的是讓人才密度和深厚積累，" 很多人說 Sora 的效果吊打 Pika 和 Runway。這很正常，和創業者團隊比，OpenAl 這種有核心技術的公司實力還是非常強勁的。有人認爲有了 AI 以後創業公司隻需要做個體戶就行，實際今天再次證明這種想法是非常可笑的。"

此外，AI 不一定那麽快颠覆所有行業，但它能激發更多人的創作力。周鴻祎表示，很多人擔心 Sora 對影視工業的打擊，在他看來，機器能生産一個好視頻，但視頻的主題、腳本和分鏡頭策劃、台詞的配合，都需要人的創意，至少需要人給提示詞。一個視頻或者電影是由無數個 60 秒組成的。今天 Sora 可能給廣告業、電影預告片、短視頻行業帶來巨大的颠覆，但它不一定那麽快擊敗 TikTok，更可能成爲 TikTok 的創作工具。

談到 Sora 最大的優勢，周鴻祎表示，以往文生視頻軟件都是在 2D 平面上對圖形元素進行操作，可以把視頻看成是多個真實圖片的組合，并沒有真正掌握這個世界的知識。但 Sora 産生的視頻裏，它能像人一樣理解坦克是有巨大沖擊力的，坦克能撞毀汽車，而不會出現汽車撞毀坦克這樣的情況，" 這次 OpenAI 利用它的大語言模型優勢，讓 Sora 實現了對現實世界的理解和對世界的模拟兩層能力，這樣産生的視頻才是真實的，才能跳出 2D 的範圍模拟真實的物理世界。"

周鴻祎提到，有了大模型技術作爲基礎，再加上人類知識的引導，可以創造各個領域的超級工具，例如在生物醫學、蛋白質、基因研究，包括物理、化學、數學的學科研究上，大模型都會發揮作用。

" 一旦人工智能接上攝像頭，把所有的電影都看一遍，把 YouTube 上和 TikTok 的視頻都看一遍，對世界的理解将遠遠超過文字學習，一幅圖勝過千言萬語，這就離 AGI 真的就不遠了，不是 10 年 20 年的問題，可能一兩年很快就可以實現。" 周鴻祎感慨。

他還提到，盡管國内大模型發展水平表面看已經接近 GPT-3.5，但實際上跟 4.0 比還有一年半的差距。OpenAl 手裏應該還有一些秘密武器，無論是 GPT-5，還是機器自我學習自動産生内容，" 奧特曼（OpenAI CEO）是個營銷大師，知道怎樣掌握節奏，他們手裏的武器并沒有全拿出來。這樣看來中國跟美國的 AI 差距可能還在加大。"

2 月 16 日，OpenAI 宣布推出全新的生成式人工智能模型 "Sora"。據了解，通過文本指令，Sora 可以直接輸出長達 60 秒的視頻，并且包含高度細緻的背景、複雜的多角度鏡頭，以及富有情感的多個角色。

據介紹，Sora 是基于過去對 DALL · E 和 GPT 的研究基礎構建，利用 DALL · E 3 的重述提示詞技術，爲視覺模型訓練數據生成高描述性的标注，因此模型能更好的遵循文本指令。Sora 能夠生成具有多個角色、特定類型的運動以及主題和背景的準确細節的複雜場景。不僅了解用戶在提示中要求的内容，還了解這些東西在物理世界中的存在方式。同時，該模型對語言有深刻的理解，使其能夠準确地解釋提示并生成表達生動情感的引人注目的角色。

運用 Sora 也可以生成高清圖像。圖片來源：OpenAI 官網

這意味着，繼文本、圖像之後，OpenAI 将其先進的 AI 技術拓展到了視頻領域。OpenAI 亦表示，Sora 是能夠理解和模拟現實世界的模型的基礎，這一能力将是實現 AGI（通用人工智能）的重要裏程碑。

對于 OpenAI 視頻生成模型的出現，業内其實早有預期，但仍有人評價稱 " 比想象中來得更快 "，亦有人振奮地表示 " 我們真的看到新工業革命來臨 "。

2 月 16 日，業内分析人士對《每日經濟新聞》記者表示，Sora 無疑是人工智能領域的一次重大突破，該技術不僅展示了 AI 在理解和創造複雜視覺内容方面的先進能力，而且對内容創作、娛樂和影視制作行業帶來了前所未有的挑戰和機遇。

每日經濟新聞綜合周鴻祎微博、每日經濟新聞（記者：熊嘉楠、可楊）

每日經濟新聞