" 幾隻巨大的毛茸茸的猛犸象正踏着白雪皚皚的草地走來,它們長長的毛茸茸的皮毛在風中輕輕飄動,遠處覆蓋着積雪的樹木和雄偉的雪山,午後的陽光下有縷縷雲彩,太陽高挂在天空中。"
隻需輸入文字,便可生成一段長達 60 秒的高清視頻。龍年伊始,OpenAI 一款王炸級的文生視頻大模型再次讓世界感受到了人工智能的強大。就連馬斯克也感歎:" 人類認賭服輸。"
OpenAI 推新款大模型 Sora
可根據文本生成 60 秒視頻
16 日淩晨,OpenAI 在其官網發布文生視頻模型 Sora。
該模型可以生成長達一分鍾的視頻,生成的畫面可以很好的展現場景中的光影關系、各個物體間的物理遮擋、碰撞關系,并且鏡頭絲滑可變。
OpenAI 表示 Sora 能夠生成複雜的場景,不僅包括多個角色,還有特定的動作類型,以及對對象和背景的準确細節描繪。
除了能夠僅從文本指令生成視頻外,該模型還能夠利用現有的靜止圖像從中生成視頻,精确地将圖像内容動畫化,也可以利用現有視頻進行擴展或填充缺失的幀。
簡單概括下來,Sora 功能包括 " 文生視頻、圖生視頻、擴展原視頻 ",長度最高可達 60 秒,視頻更高清,細節更逼真,表現力更豐富。
除了上述的猛犸象外,OpenAI 還公布了多段演示視頻,例如
" 一位時尚女性走在充滿溫暖霓虹燈和動畫城市标牌的東京街道上。她穿着黑色皮夾克、紅色長裙和黑色靴子,拎着黑色錢包。她戴着太陽鏡,塗着紅色口紅。她走路自信又随意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去 "。
該視頻長達 60 秒,近乎百分百的還原了文字内容,人物、背景、光影效果的精細程度以假亂真。視頻後半段,就連女性面部的毛孔和瑕疵也清晰可見,Sora 似乎在以這種方式訴說着自己的強大。
更多案例:
中國龍年舞龍的視頻
兩艘海盜船在一杯咖啡中航行時相互争鬥
賽博朋克背景下機器人的生活故事
然而作爲一款初代文生視頻大模型,Sora 目前也存在諸多問題,OpenAI 承認該模型可能會混淆提示的空間細節,例如混淆左右,并且難以精确描述随着時間推移發生的事件,例如遵循特定的相機軌迹。
據界面新聞援引外媒消息,OpenAI 據悉已經完成了一筆交易,這家人工智能公司的估值達到了 800 億美元,在不到 10 個月的時間裏,其估值增長了近兩倍。
周鴻祎稱差距還在加大
馬斯克說人類願賭服輸
Sora 的橫空出世引發了全球的關注,網民紛紛驚歎于人工智能的高速發展,一衆大 V 也發表觀點。
360 創始人對 Sora 給予了極高的評價,他認爲,Sora 的誕生意味着 AGI(通用人工智能)實現可能從 10 年縮短至一兩年。
周鴻祎認爲,科技競争最終比拼的是讓人才密度和深厚積累," 很多人說 Sora 的效果吊打 Pika 和 Runway。這很正常,和創業者團隊比,OpenAl 這種有核心技術的公司實力還是非常強勁的。有人認爲有了 AI 以後創業公司隻需要做個體戶就行,實際今天再次證明這種想法是非常可笑的。"
他還提到,盡管國内大模型發展水平表面看已經接近 GPT-3.5,但實際上跟 4.0 比還有一年半的差距。OpenAl 手裏應該還有一些秘密武器,無論是 GPT-5,還是機器自我學習自動産生内容," 奧特曼(OpenAI CEO)是個營銷大師,知道怎樣掌握節奏,他們手裏的武器并沒有全拿出來。這樣看來中國跟美國的 AI 差距可能還在加大。"
胡錫進也表達了自己對 Sora 的看法。他表示,這的确是爆炸性進展。到今天中午,在賈玲現實主義電影《熱辣滾燙》的引領下,中國今年春節檔的票房突破 70 億。但是 Sora 在點亮 AI 影像制作未來的同時,也給全球現實主義電影的前途抹上了陰影。" 讓老胡接着看春節檔電影都有些心神不甯了。"
Sora 發布後數小時,馬斯克在社交媒體上回複了 "gg humans",gg 爲 Good Games 縮寫,代指 " 打得好,我認輸 " 。之後馬斯克還稱,通過 AI 增強的人類将在未來幾年創造出最好的作品。
Sora 對未來影響幾何?
哪些人會因此失業?
Sora 的誕生意味着,在文字、圖片之後,AI 的技術已經突破到了視頻領域。雖然在此之前,Runway Gen 2、Pika 等 AI 視頻工具已經發布過類似的模型,但相較之下,别家的大模型還在緻力于突破幾秒内的連貫性,OpenAI 已經可以實現 60 秒的超精細視頻制作,這一技術可以說是史詩級别的突破。
那麽這史詩級的技術變革會給人類帶來哪些影響?
中國企業資本聯盟副理事長柏文喜對藍鲸記者表示,Sora 作爲一種強大的視頻生成工具,可以極大地降低視頻制作的門檻和成本,使得更多人能夠輕松創建高質量的視頻内容。這将對影視、廣告、遊戲、新聞、教育、VRAR 等諸多行業産生深遠的影響,具有廣泛的應用前景。
例如在影視行業,人人都是導演的時代即将來臨,Sora 可以快速生成逼真的場景和特效,幫助制作人員更好地實現創意,提高制作效率。在廣告行業,Sora 可以根據品牌需求和營銷目标,快速生成高質量的廣告。
内容創作的方式變革後,文學創作領域也将迎來複興,小說可以直接生成動漫、電視劇。視頻内容集中爆發,自媒體行業也将迎來重新洗牌。随着技術的不斷深挖,未來 Sora 會将在更多領域得到推廣應用。
不可否認,技術的變革是把雙刃劍,在關注應用前景的同時也有不少人擔憂會被 AI 搶了飯碗。那麽視頻模型 Sora 的出現會對那些崗位産生沖擊?哪些人會因此失業?
從上述專家的分析來看,目前最容易受到影響的或許是影視行業的從業者。
例如視頻剪輯師、後期制作這類崗位,視頻模型 Sora 能夠自動或半自動地生成視頻,這可能會導緻傳統的視頻制作和編輯職位的需求下降。後期制作包括剪輯、特效、音效等環節,這些工作也可以通過 AI 技術進行自動化或半自動化處理。
再比如新聞主持人這一崗位,Sora 模型可以根據輸入的文本自動生成視頻新聞報道,一些簡單的新聞報道任務可能會被 Sora 模型所取代。
此外,遊戲動畫師、廣告創意和設計崗位、内容創作者等崗位都有可能受到大模型的沖擊。
一覺醒來,AI 行業變了天,Sora 的出現猶如一記重磅炸彈,讓世界看到了人工智能的無限可能。2024 年第一塊堅實的裏程碑落下了,帶給人類的依舊是希望大于絕望。