以大模型爲代表的新一代 AIGC 技術将在哪裏落地?
我們相信,遊戲将會擁有廣闊的天地和應用前景。
MMO 遊戲接入 AI 是一種嘗試,《西部世界》的多蘿西(Dolores)是一種夢想,《頭号玩家》的綠洲(OASIS)是一種未來。
AIGC 時代,遊戲廠商是怎樣爲創意插上 AI 的翅膀?
更好玩的遊戲,更豐富的感官刺激是如何創造的?
量子位智庫特地邀請了各類遊戲行業的從業者及遊戲技術領域的專家學者,向廣大遊戲玩家分享 AIGC 技術是怎麽改變我們的遊戲的,未來遊戲會如何突破我們的想象力。
本文爲量子位智庫「AIGC+ 遊戲」系列深度訪談欄目,更多内容請關注即将發布的「AIGC 遊戲産業全景報告」
訪談人物介紹
尹學淵,博士,連續創業者,機器學習、人工智能領域專家。
△尹學淵 受訪者供圖
2013 年,聯合創立龍淵網絡,推出了多款受到全球玩家歡迎的産品,如「多多自走棋」(Auto Chess)等。
2020 年創立行者 AI,緻力于用人工智能和機器學習技術提高遊戲和文娛行業的生産力,提供遊戲全生命周期的解決方案。
憑借自研算法,先後推出了 AI 虛拟玩家、AI 安全、AI 美術、AI 音樂等多項産品。
作爲一位連續創業者,16 歲即考入四川大學計算機系,尹學淵的每一次創業都與他所熱愛的遊戲有關。
本文中你将可以看到他以行者 AI的創始人兼 CEO 的身份,談論有關遊戲與AI的一切。
精彩觀點
策略類或競技類,AIGC 技術對不同類型遊戲的影響沒有本質區别
AI 的畫再漂亮,和你想要的目标風格不一樣,也是沒辦法進入遊戲生産流程的
如果你一味地赢,你會覺得這個遊戲沒有挑戰性……
遊戲是一種交互式的内容形态,我希望未來大家不僅僅把它當成娛樂
訪談實錄沒有什麽主流的 AI 遊戲技術
量子位智庫 :實際的遊戲研發過程中,存在哪方面的遊戲元素最适合用 AI 來做,或者說使用 AI 的效率提升會最大嗎?
尹學淵 :我覺得目前2D 遊戲美術使用 AI 的提升效率是最大的。其實就是 AI 繪畫,現在應用的範圍比較廣、深度也還可以。可以說從全類型的遊戲來講, 2D 遊戲美術的這種生産力的提升和成本的降低都算是非常明顯的。
當然目前也有很多用大模型的方式去做智能 NPC 的嘗試。這種嘗試可能等到像元宇宙這樣的開放世界玩法成熟之後,會帶來很多改變,但目前爲止在産業界,我認爲還是處于一個非常非常早期的階段,遠沒有到商業化應用的程度。
量子位智庫:在不同類型的遊戲裏 AI 的效果會有不同表現嗎?
尹學淵 :不同的遊戲對 AI 的需求是不同的,但對于 AIGC 來說,其實并沒有明顯的區别。
整個遊戲的研發和制作還是一個相對來講比較複雜的系統工程,絕對不是說我把某一個環節打通了之後,整個遊戲研發就一下變了天一樣,對吧?其實是很難的。
量子位智庫 :目前在 AI 美術裏大家存在常用的采樣方法嗎?
尹學淵 :這個沒有。
你的意思是說擴散模型的采樣方法現在可能差不多有接近二十種是吧?我覺得可能最主要還是幾類。比如是經典的 Euler;具有随機性的 Euler a、DPM2 a 這帶 a 的種祖先采樣器;然後就是 DPM 及其變種,比如側重速度的 DPM++ 2M Karras 或者側重質量的 DPM++ SDE Karras 采樣器;以及最新的 UniPC 這種新穎且質量不錯的。可以根據不同的需求和優先考慮來選擇不同的采樣方法。
但其實在實際的生産過程中,樣本、模型、提示詞、參考圖、ControlNet 任何一個都對出圖質量影響更大,而采樣器的影響沒有那麽大,你用習慣了喜歡哪個就可以用哪個。
AI 美術的一緻性、可控性和高精度
量子位智庫 :現在很多圖片生成模型生成手方面效果比較差,圖形擴展也有很大的問題。在 AI 美術的領域,這是共同攻克的問題,還是說我們針對遊戲行業能有特殊方法?
尹學淵 :所以說這些問題反而是我們的機會和賣點。如果說我們的産品跟 Midjourney 沒有多大的區别,大家也不可能采購我們的産品和服務。
在我看來,像 Midjourney 這種它能解決一部分的問題。比如你在項目的立項階段,或者在主美做創意的時候,那 AI 可以幫你去啓發創意,幫你生成參考圖,這個是它擅長的。但是它不太擅長美術風格的一緻性、可控性和高精度。
△受訪者供圖
而這是一個 AI 工具,它能否成爲工具的一個非常大的區别點。
就比如您剛講的,我希望它換什麽地方,結果我想換的地方它沒換,不讓它換的地方它反而換了,這個就代表它不可控。不可控你就沒辦法成爲一個真正的工具,因爲我永遠不知道我鼠标點下去他會出什麽。
在 Midjourney 裏面,有的時候它的畫會非常漂亮,但再漂亮,和你想要的目标風格不一樣,也是沒辦法進入生産流程的。
我再舉個例子,就是我們在做 3D 建模之前,你要去做一個人物的正面、背面和側面。那這三視圖,如果你分别用 AI 工具去出,你就會發現有時候這三張圖它甚至都不是同一個人。
那在這種情況下,我們圍繞着遊戲工業化的美術流程,去做一些專業的設計,反而能做到一緻性和可控性。
最後就是高精度。現在我們能通過算法的優化,做到用 AI 去做16K 的高精大圖,才可以滿足更多的場景。
量子位智庫:剛才說這個可控性方面,我們會用一些「專業設計」,它具體是包含什麽内容?
尹學淵 :比如說我的遊戲畫風已經定下來了,角色和設定也定下來了,裏邊可能有幾個角色:「小美」、「小明」、「小黃」。在任何一個場景、任何一個設定上隻能出現這三個角色。我們的一鍵訓練模型功能,支持上傳素材,要畫「小美」,就不會畫成「小紅」。
在真實的遊戲工業裏,小美可能會有一個「人設」,假設是「可愛」的那種,那她就不能穿太「性感」的衣服。在繪制的過程中就要沿着「可愛」的風格,而且這種風格不僅僅是可愛兩個字就夠了,遊戲的畫風是有很多的細節和講究的,在這個情況下就一定要有自己的模型。
△受訪者供圖
量子位智庫:我現在要做一個 CG,裏面隻有我的三個主角,我是通過什麽方法去告訴我的工具的呢?
尹學淵 :就是選模型,我們會有不同的模型給大家去用,而且很多時候是多個模型配合使用,不同的 Diffusion 底模配合上層的 LoRA 和 VAE。
量子位智庫:就像那種 Python 的庫一樣,已經給你集成了?
尹學淵 :對,在我們這其實就是一個選項。你就是拖一下,就是這個地方我要「小美」,就好了。我們會提供訓練模型,你可以自己在上面訓練「小美」這個模型。
AI 音樂與遊戲音樂的營銷屬性
量子位智庫:對一個遊戲來說音樂還是挺靈魂的一個部分,現在 AI 音樂可以根據這個遊戲的内容、玩法獨立制作出合适的配樂或主題曲嗎?
尹學淵 :現在 AI 音樂是完全能獨立地去做主題曲的,但我們的輸入可能和大家想象的有偏差。
我們不是通過類似文生圖、圖生圖那種方式去生成音樂,是通過不同的參數和不同的輸入去生成不同的音樂。
在實際的生産中,我們可以先選擇風格,給一些引導詞再結合畫線來生成旋律,然後完成編曲和演唱。比如說我這個場景是一個帶有科技感、賽博朋克的場景,我們會先用 AI 工具去生成 BGM,生成完之後再配回來。
雖然說可以做圖像分割和語義理解,但是AI 目前其實還是很難非常好地理解遊戲的内容和玩法到底是什麽樣的,中間需要我們的工程師或者策劃,還是有人工操作的這一個過程。就好比 AI 繪畫本質上來說也是人來确定要畫什麽畫,其實是人在指導 AI 畫。AI 生成音樂也一樣。
目前我們真正服務的客戶其實是營銷類的偏多,遊戲本身對 AI 音樂的需求量不大。第一是像戰鬥的音樂、城市的音樂、在野外的音樂,主要是營造氛圍感,氛圍到了就夠了,數量的需求量沒有那麽大;第二是音樂人和他們做的音樂對遊戲本身來講也是一個宣傳點,有附加價值。
爲什麽遊戲裏會遇到那樣的 AI 隊友?
量子位智庫 :AI 虛拟玩家生成和遊戲當中的 NPC 生成是不是有一些相似的地方?
尹學淵 :不太一樣。雖然從字面意思來看,虛拟玩家也是 Non-Player Character,但是我們定義的虛拟玩家和 NPC 從技術角度來講,是完全不同的。
第一是場景,它們面對的是兩個完全不同的應用場景;
第二是技術邏輯,它們是兩套完全不同的技術邏輯。
比如說我們所指的虛拟玩家,更多意味着它是在扮演玩家,需要很多的操作。像行者 AI 的虛拟玩家,我們更多的是把它應用在對戰場景,比如說在競技遊戲裏邊。
如果你一味地赢,你會覺得這個遊戲沒有挑戰性;如果你一味地輸,你就會挫敗感非常強,就會覺得不好玩。
我們追求的是玩家能獲得一個更好的體驗,那就是他要麽去扮演你的隊友,要麽扮演你的對手,讓你覺得這一把玩得「欲罷不能」嘛。其實就是因爲水平相當的時候,你才是玩得最爽的。
舉個例子我們常看到的一些 MOBA 遊戲裏面,虛拟玩家更多時候是扮演你的隊友或者是你的對手,從表現形式來講,他是跟玩家完全是對等的。現在技術上也能完全做到遊戲的操作和體驗上對等。
而傳統的遊戲行業對 NPC 的定義實際上來講它和玩家就不是絕對對等的。除非如果有一天我們真正能做到大家對 AI 的想象裏的這種 AGI(通用人工智能),那它可能完全對等。
現在我們看到已經有廠商嘗試将 基于大模型的 AI NPC 放進 MMO RPG(遊戲)裏面的,這類應用場景更多是讓 NPC 有一些自主的行爲,玩家和 NPC 的互動也是一類新的玩法。未來想象空間也很大。
量子位智庫 :這兩者在技術實現上有什麽不同?
尹學淵 :比如我們剛剛說到的這個競技遊戲的 AI 虛拟玩家,它更多的是基于深度強化學習,它的技術底棧,類似 Alpha Go 的,這樣的技術底棧所使用的深度強化學習,它的重點是說這個其實還有很多玩遊戲的 Action。
那像我們說基于大模型的智能 NPC,它更多的是在于交互。就是它是通過大語言的方式去給到這些 NPC 一些人設、語言和交互。但至今爲止僅基于大模型的這類 NPC,它們更多的是在交互上強化,讓 NPC 和 NPC 之間、NPC 和玩家之間産生一些關系,而并非對遊戲的操作控制行爲。基于大模型的 NPC 可能短期内還很難學會 MOBA 之類的強操作的遊戲。
量子位智庫 :如果我們要爲王者榮耀這樣的競技遊戲去設計 AI 隊友或對手,實際過程中是怎樣開發的?會通過分析玩家數據再調整虛拟玩家行爲這樣的方法嗎?
尹學淵 :強化學習可以不依賴曆史數據,舉個例子,像 MOBA、掼蛋、鬥地主等各種各樣的競技類型遊戲裏,那實際上我們不太需要玩家的曆史數據去訓練,這裏面其實整個算法的邏輯更多的是強化學習的原理。如果你有一些數據當然更好了,收斂會更快也能避免一些「不像人」的行爲。
比如說我們訓練一個 AI,我們就把它叫做一個 Agent,可以理解爲說的就是那個 AI,這個 Agent 我們把它放在一個環境裏面,環境其實就是我們的遊戲。然後此時我們會怎麽去訓練這個 AI?就我們去給它設定一些 Reward,Reward 就是「獎勵」。
假設我們拿王者榮耀來舉例,如果這個 AI 它把對方的塔推掉了,就可以設定加 100 分;把對方的英雄打敗了,設定加 50 分,他被打敗就扣 200 分。諸如此類,通過在環境中不斷地獲取這些 Reward,最後 AI 它自己就會去叠代,它就其實就學習到了如何去玩這個遊戲。大緻就是就這麽訓練出來的。
一般來講,我們可能更多地是去統計分析一些玩家的行爲,然後去如何去設定這個 Reward,讓它快速地去收斂。
從理論上來講,其實我們隻需要給這個 AI 設定兩個條件,你把對方的塔和基地摧毀,你就赢了;當你的塔和基地被對方摧毀,你就輸了。設定之後從理論上來講,當計算規模無窮,時間等成本都無限的時候,我們可以訓練到一個非常非常高的水平。但事實上這些成本都不可能無限,所以我們會分解這個任務目标,比如打敗一個小兵加多少分,分解目标的目的就是爲了提高收斂速度,快速把這個 AI 給訓練出來。
大概強化學習是這個邏輯,大模型的 Transformer + RLHF 裏的 RL 也是強化學習的縮寫。
量子位智庫 :其實很多時候冷啓動階段,我們就要接入虛拟玩家,那個時候沒有太多這個遊戲的相關數據,我們會怎樣選定什麽是獎勵?什麽是懲罰?
尹學淵 :從虛拟玩家這一部分來講的話,它還是跟遊戲的研發經驗有關,某種意義上來講,需要看你對這個遊戲的理解和手感。在這個過程當中,就算你沒有玩家的數據,實際上大家也能設計一些非常好的機制出來。
量子位智庫:現在我們的這個虛拟玩家和普通玩家他在決策方面會有什麽區别嗎?
尹學淵 :理論上來講虛拟玩家做好了之後,它的決策就沒有太大的區别。完成訓練之後,它基本上是非常像人的,替代性還是挺高的,就是正常來講訓練到一定的程度,其實玩家是很難感受到你的對手是 AI 的。
量子位智庫:目前投放進遊戲裏的虛拟玩家,當它和某一個玩家對戰的時候做出了一個決策,這個決策是能夠持續的反饋到我們這個訓練當中嗎?
尹學淵 :目前從理論上來講,是可以做一個實時收集反饋的,就相當于就玩家每次打對戰都是在幫你做訓練。但是實際上真正上線之後,業界的做法大都還是批量處理,有版本更新之後,通過收集一段時間的數據反饋,再來做一次模型的叠代。
量子位智庫:在不同的遊戲環境裏,比如對 MOBA 或 RPG 遊戲,我們要重新去訓練虛拟玩家嗎?
尹學淵 :強化學習對它的 Reward 和環境的依賴其實是非常大的,每一個遊戲其實它都是一個全新的環境,通用性實際不高。但是底層的一些東西是可以複用,隻不過訓練的這個過程肯定是重新開始的。
量子位智庫:在實際的生産過程中,AI 工具對效率的提升是怎麽樣的?
尹學淵 :行者 AI 的産品服務涵蓋的範圍比較廣,除了機器人以外,我們還會有一些像 AI 美術、 AI 音樂音效、 AI 安全服務等全方位的工具。比如說 AI 美術,基本上我們現在能做到大概一倍的效率提升,然後成本降低一半,也是客戶給我們的反饋。
△受訪者供圖
公平公正的發牌員
量子位智庫:我們在識别遊戲裏面不安全的内容,包括灰産之類的時候會用到什麽樣的識别方法?
尹學淵 :都是我們自己做的一些神經網絡的模型,不同的應用場景還是會稍微有一些不一樣。
AI 安全我們分爲兩個大的模塊,第一個模塊是反灰産。
比如說有些灰産它會租很多的雲手機,然後用腳本,在遊戲裏面去「薅羊毛」。我們研發了一些模型,對抗機器人、識别機器人,以攔住這些薅羊毛的。
那第二個模塊是内容審核。
防止破壞遊戲聊天生态,營造幹淨友好的遊戲環境,我們也會有很多算法。不管是文本、語音、還是圖片、視頻,都支持審核。目前來講 AI 技術在審核上已經完全達到人工的标準,我們識别率能做到非常高。
量子位智庫 :拓展一個小問題,就是像自走棋之類的遊戲,它會有什麽樣的外挂或者腳本存在?
尹學淵 :在自走棋一類的競技遊戲裏,更多的還是存在違規言論。競技遊戲中外挂比集中在資源産出型。另外資源産出型外觀在 SLG 和 MMO 裏面也比較多,灰産會去用腳本去打怪,然後去囤資源、賣資源。競技遊戲一般是不存在這種囤資源的問題的,而更多是簽到,比如建立很多小号,每天用腳本簽到,做每日任務領獎,如果一個号養很長時間,比如 2 年,光簽到就能領很多金币鑽石等各種東西;其次就是聊天中打小廣告。
量子位智庫 :所以說其實發牌員就是挺公平公正的?
尹學淵 :對,那肯定是公平公正的。
其實 AI 就算陪你打,也是在靠技術而不是靠發牌員。比如,鬥地主經常給玩家發 4 個 2,玩家會明顯覺得:「你作弊?」這種體驗是很差的。
從實際商業化過程中,我們的合作夥伴和客戶,現在的做法就是真随機。
可能有一些卡牌遊戲裏會存在保底概率,但競技遊戲裏一般都會選擇真随機。
3D 建模與西部世界那樣的 NPC
量子位智庫:那您也是一個老遊戲玩家了,除了之前談到的,在遊戲的其他元素裏,還有沒有您覺得說我們 AI 還可以去做的?
尹學淵 :暢想一下未來,有兩個大的方面。
第一個方面就是 3D,現在大家用 AI 比較多的還是以 2D 的爲主, 3D 我們能解決一部分的問題,但是現在還做不到像 2D 這麽好的效果。
第二個我們剛剛說到的 AI NPC,它未來的空間還是非常大的,如果真正能夠實現《西部世界》,對遊戲的玩法來講是颠覆性的。但目前全行業都需要突破這個問題,還達不到我們想象中的樣子,現在還是處于一個非常早期的階段。
量子位智庫:那這兩方面我們現在有沒有什麽布局?
尹學淵 :我們一直有在做 3D 部分,但目前這是全世界的難題。我們現在能解決一些問題,像常見的一些場景角色、花草樹木、道路、房子我們 AI 都能造了,但 AI 造出來這些東西,還達不到很高藝術标準和需求。很長時間内,應該都會是一半人工,可能一半智能。
量子位智庫:您現在覺得這個 AI 技術對遊戲開發,就剛剛我們聊到那些遊戲開發整個環節的滲透率有沒有超過 50%?
尹學淵 :目前爲止完全沒有。
我們這個上半年拜訪了很多的遊戲産業鏈上的客戶。雖然很多公司都用 AI,但是真正的進到工業化流程的這些公司并不多。我覺得還是有一段路要走。
但我個人還是比較樂觀的。雖然這個過程需要一些時間,但這我覺得未來大家肯定會全面擁抱 AI 技術,确實有很多地方都可以降本增效。
量子位智庫:确實好用。
尹學淵 :對。
遊戲應該有更廣闊的應用空間
量子位智庫:最後關于「行者 AI」、關于遊戲行業,您還有什麽想和我們分享的嗎?
尹學淵 :我最後給大家分享一個點,就是爲什麽「行者 AI」要立志于去做遊戲的全鏈條的生産力工具?
因爲我有一個執念, 遊戲過往的應用場景相對來講是被低估了的。
過往幾乎所有人都在拿遊戲去做娛樂,但是遊戲它作爲一種交互式内容媒體形式,作爲第九藝術,它有更廣闊的應用空間。比如說老年人的陪伴、兒童的教育、抑郁症的治療等,各種各樣的功能性的需求,都可以通過遊戲這種交互式内容形式去滿足。
目前「行者 AI」也跟一些知名的醫院在合作,爲老年人去開發遊戲,預防阿爾茨海默病。因爲我們開發了一站式的 AI 産品矩陣,所以能快速地去做一些遊戲,降本增效。
爲什麽過往的遊戲商業模式很難觸達這些更廣闊的場景?核心還是因爲遊戲研發成本非常高的,它作爲一種内容産品,成功率也很低。高成本低成功率,導緻開發者都非常擔心,不得不隻瞄準這一個方向,去做好玩的遊戲、商業化掙錢的遊戲。
但是遊戲,它是一種交互式的内容媒體,它的特點是 " 參與 ",整個遊戲内容、遊戲進程、遊戲中的其他角色,遊戲的一切都是圍繞遊戲者及其所扮演的角色進行的,它能非常好地完成千人千面的體驗,而不是單向的接收。
遊戲是一個非常好的内容形态,我們應該把它發揚光大。路徑就是降本增效。
所以這就是我的執念,也是「行者 AI」的執念。
我們希望把這些工具做出來之後,讓整個遊戲服務更多的人,服務更多地這種這個場景,而不僅僅是玩。