編譯 | Vendii
編輯 | 漠影
智東西 8 月 22 日消息,據 VentureBeat 8 月 20 日報道,專注于 3D 内容生成技術的 AI 初創公司 Luma AI 發布了 Dream Machine 1.5。該版本提高了 AI 視頻生成效果,在逼真度、運動追蹤及 prompt 理解等方面有所提升。此次升級距 Dream Machine 首次面世已過去 2 個月。
Dream Machine 能夠在 120 秒内生成包含 120 幀的高質量視頻。用戶隻需簡單輸入相關提示,點擊生成按鈕,系統便會在 1 至 2 分鍾内完成視頻渲染。工具目前對所有公衆開放,每個用戶每月有 30 次的免費生成額度,但生成結果不可商用。
Luma AI 當日在社交平台 X 上宣布:"Dream Machine 1.5 來了!它的文生視頻、圖生視頻效果都得到了提升,prompt 理解更爲精準,自定義文本渲染能力也得到了改良!"
值得注意的是,新版本尤其增強了渲染文本的能力,這是 AI 視頻生成技術一直面臨的難題。這個進步爲動态标題序列、動畫标識設計和演示幻燈片制作等任務開辟了新的可能性。
體驗地址:https://lumalabs.ai/dream-machine/creations
一、會 3D 文字渲染、能理解阿拉伯語,視頻生成隻需 2 分鍾
一直關注 AI 領域的平面設計師 @aziz4ai 在社交平台 X 上分享了 Dream Machine 1.5 的應用實例,展示了該模型在創造複雜視覺效果方面的能力。在其中一個實例中,該模型生成了 " 彩虹色液體 3D 文本 ",以 "LUMA" 字樣呈現,展現出流暢且精緻的視覺效果。
▲ @aziz4ai 用 Dream Machine 1.5 生成的彩虹色液體 3D 文本 "LUMA"
此外,Dream Machine 1.5 在處理非英文 prompt 方面取得了進步。在 @aziz4ai 分享的另一個應用實例中,prompt 使用了阿拉伯語輸入,其中包含一個要求:一個男人在木闆上切肉,然後将這些肉塊以電影化手法變成 " 每日現切 "(" يحضر يوميا ")字樣。
▲ @aziz4ai 用 Dream Machine 1.5 生成的阿拉伯語字樣
生成的視頻很好地将阿拉伯語文字融進了畫面,既展現了 Dream Machine 1.5 的文本渲染能力,也體現了它的多語言處理能力(Multilingual Processing)。
此次模型優化還提升了視頻生成速度,約 2 分鍾即可生成一段長達 5 秒鍾的高清視頻。這一效率提升,尤其适用于需要快速生成大量視頻作品的内容創作者和市場營銷人員。
二、業界率先公測,已積累大量用戶反饋
盡管 AI 視頻生成領域的競争日益激烈,但 Luma AI 将産品開放公測的策略使其脫穎而出。
相較而言,OpenAI 的 Sora 雖然擁有強大性能,但自今年 2 月 16 日公布以來仍處于内測階段,僅供部分合作夥伴使用,這種排他性限制了它的實際測試和應用。另一方面,快手的可靈于今年 6 月 6 日推出、7 月 24 日全面開放内測,短時間内便獲得了衆多關注。
而 Luma AI 的 Dream Machine 早在 6 月 12 日就開放了公測,因而積累了龐大的用戶基礎,并收集了大量的應用反饋。這使得 Luma AI 能夠針對各類實際應用場景進行模型優化。結合廣大用戶反饋和實際應用數據,Luma AI 得以解決具體的用戶痛點,并進一步增強大部分用戶最需要的功能。
一些行業分析師認爲,開放公測能催生更爲穩定可靠且功能豐富的 AI 視頻工具。來自各行各業的用戶創作的内容,爲 Luma AI 提供了豐富的數據集,使得其模型叠代速度有機會超過内測的模型。
誠然,這種公測策略也帶來了挑戰。随着 AI 視頻生成變得越來越普及,如何防止濫用,如深度僞造和誤導性内容,成爲了行業面臨的主要難題。尤其需要強有力的監控機制以及倫理規範加以約束。Luma AI 對此尚未明确表明立場。
結語:愈演愈烈的 AI 視頻生成大戰
自 Sora 發布以來,國内外的視頻生成新模型新工具密集發布。據統計,僅國内,當前便有約 20 家公司推出了自研 AI 視頻模型。
前有快手可靈發布後 1 個月就實現 3 次重大升級,後有 Luma AI 2 個月叠代 Dream Machine 新版本 …… 盡管有飛快的更新速度,AI 視頻生成仍面臨着可生成長度過短、畫面形變等問題。在越來越卷的賽道上,誰将成爲最後赢家?
來源:VentureBeat