IT 之家 3 月 13 日消息,近日,YouTube 頻道 WVFRM Podcast 在其節目中,邀請了 OpenAI 旗下文生視頻模型 Sora 的核心團隊成員參與訪談。
IT 之家注:三名成員包括 Bill Peebles、Tim Brooks 和 Aditya Ramesh,均爲 Sora 項目負責人。
這三名負責人談到了 Sora 何時可供用戶使用的問題,其稱目前 Sora 仍處于反饋獲取階段," 還不是一個産品,短期之内不會向公衆開放。"
對于什麽時候把它變成一個産品,我們目前甚至沒有任何時間表。我們正處于獲取反饋階段。我們肯定會改進它,但我們應該如何改進它是一個懸而未決的問題。
談及 Sora 的原理時,負責人表示,其工作原理是分析大量視頻數據、學習生成逼真的視頻,工作方法融合了 GPT 等大語言模型及 DALL-E 等擴散模型的技術,架構類似于 " 介于兩者之間 " —— 架構上更像 GPT,訓練方式類似于 DALL-E。
而對于 Sora 的訓練數據來源問題,負責人則稱不能透露太多細節,僅表示是基于公開可用的數據、OpenAI 授權數據的組合進行訓練的。
據 IT 之家此前報道,Sora 能夠根據文本快速生成相對高質量的視頻,但業内人士認爲,目前這類 AI 工具仍存在局限性,無法完全取代人類創作者的工作。
" 很多人說好萊塢完了," 電影概念藝術家和插畫師 Reid Southen 表示," 但我并不這麽認爲。好萊塢的制作流程非常複雜,這些視頻也存在很多問題,尤其是時間一緻性和額外肢體等瑕疵。"