在更強大的 AI 及相關技術的加持下,遊戲行業将出現怎樣的變革?
4 月 13 日周三,方正證券分析師楊曉峰發表了題爲《遊戲的 AI 革命:StableDiffusion 到 Nerf》的行業研究報告。
在這份報告中,方正證券表示,遊戲行業能夠根據現有的 AI 模型—— GPT、Stable Diffusion 以及 Nerf,實現 " 無中生有做 3D"。
GPT 文本生成神器的功能已被大衆所熟知,這裏方正證券着重介紹了 Stable Diffusion 和 NeRF 模型。
AI 生成 2D 作畫:Stable Diffusion
據方正證券介紹,Stable Diffusion 是一個文本到圖像的潛在擴散模型,可以實現 "文生圖" 功能。不過,當前的輸入内容類似于程序代碼,具有一定的門檻。
Stable Diffusion 提供開源模型,用戶可對其進行進一步訓練,風格多樣化。
同時,使用 controlnet 插件可以使 Stable Diffusion 生成多視角圖片。
AI 推動 "2D 到 3D" :NeRF 模型
NeRF,全稱爲 Neural Radiance Fields ( 神經輻射場 ) ,是一項利用多視角圖像重建三維場景的技術,即利用 2D 圖片搭建 3D 場景。
當前基于 NeRF 技術構建的模型主要有谷歌的 Mip-NeRF、Block-NeRF、LOLNeRF,英偉達開發的 instant NGP。
據方正證券稱,instant NGP 可以極大的提高 NeRF 的效率,在某些情況下速度可以提升超過 1000 倍。
Instant NeRF 可在單 GPU(RTX3090)環境下實現秒級的 3D 場景生成。在高清分辨率下,合成甚至真實 場景可以在幾秒内訓練,幵以 60 幀 / 秒的速度渲染。
另外,3D 建模軟件服務商 Luma AI 近期開發了 NeRF 相關的 APP,目前已上線 APP Store,極大的降低了 NeRF 的使用門檻:
僅需要一部手機,通過 APP 導引進行場景的拍攝,就可以随時随地渲染三維場景,輕松使用 NeRF。
2023 年 3 月 24 日,Luam 獲 2000 萬美元的 A 輪融資,英偉達爲其投資方之一。
GPT → Stable Diffusion → Nerf:無中生有做 3D
據介紹,目前由文字到 3D 模型,存在兩種路徑。
使用 " 文生圖 " 模型 +NeRF 生成 3D 模型,GPT 在其中可以發揮重要作用。例如,使用 stable diffusion+controlnet 插件,生成多視角的 2D 圖,再由 NeRF 形成 3D 建模。但由于目前文生圖模型的 prompt 仍有一定的門檻,因此或可訓練 GPT,使其掌握,進而實現自然語言生成滿意的多視角 2D 圖。
使用文字生成 3D 模型。這一類模型往往是,文本到圖像擴散模型和 NeRF 的結合。其原理爲,先通過文本到圖像的擴散模型生成 2D 圖,再通過 NeRF 将 2D 圖生成 3D 模型。
AI 推動降本增效
目前,國内常見的遊戲美術制作方式有四種,分别是 3 渲 2 制作、3D 現世代制作 ( 傳統手繪 ) 、3D 傳統次世代制作和 3D 次世代制作。
但總體來看,當前制作一個 3D 遊戲角色的周期在 30-45 天左右,需要的步驟較多,參與的人員衆多。
使用 NeRF 可以快速建模,從而提高效率,節省成本。
時間上,AI 生成圖片的速度相對手畫來說,大幅度提高;而 NeRF 建模也可一次性完成上文中步驟的多個, 在時間上有極大的提高。
人力上," 文生圖 " 和 NeRF 可以完成多個角色的工作,同時也更加快速。
本文主要觀點來自方正證券楊曉峰,原文标題:《遊戲的 AI 革命:StableDiffusion 到 Nerf》
楊曉峰持證編号 S1220522040001