文 /Wenlon
ChatGPT 于 2022 年 11 月 30 日由 OpenAI 推出。5 天後,用戶數量過百萬,兩個多月後(2023 年 1 月),ChatGPT 的用戶數超過 1 億,成爲增長最快的消費者應用程序。這家公司已經深耕 8 年,而他們也僅是 AI 生态中的公司之一,AI 生态這個龐然大物還未真正浮上水面。
或許可以說,GPT4 預示着 AI 生态的時代已經慢慢拉開了帷幕。
在遊戲領域,AI+ 遊戲有怎樣的應用可能,對商業價值、用戶價值、制作開發人員的價值幾何,值得我們思考。
01
AI 在遊戲生态中的應用
遊戲 PME 飛輪
遊戲方面化繁爲簡,可以抽象爲三大模塊,前兩個模塊爲生産制作、營銷觸達,以及第三個最終服務的對象:玩家體驗,三者構成飛輪循環。
在 PME 三端我們可以進一步細分,從目前主流的崗位職能角度解析 AI 在每個模塊的具體應用場景,現階段 AI 與遊戲生态内容如下圖所示:
AI 生态在遊戲 PME 端的應用
1. P 生産制作端:增效爲主,美術是第一突破口
玩球少女(雷)-MidJourney
制作部分來看,當下美術是第一突破口,這次的 AIGC 美術浪潮不亞于照相機的發明。目前來看,AIGC 的美術資源在意向圖繪制、概念設計方面表現出衆,例如 Midjourney,幾秒鍾的時間幫助遊戲美術設計師嘗試不同的抽象内容,一方面可以幫助美術設計師汲取靈感,另一方面可以爲沒有美術功底的策劃等其他崗位,提供輕松制作意向圖的路徑,快速與美術設計同事對齊,極大降低了前期設計和對齊成本。
而在完全的标準化商業使用方面,穩定性和變化度還有明顯不足。
StableDiffusion 更加開放的參數暴露相對表現更優。目前主要的生産方式爲:
(1)簡單出圖:文生圖、圖生圖(線稿),結合不同的主模型輸出,得到初稿,後續手繪修正;
(2)姿态出圖:Open pose 等工具繪制姿态,Controlnet 根據姿态精準輸出形體,結合文本 Prompt 确定内容傾向,配合 Lora 精調例如面部、服飾、首飾等細節,或結合局部重繪工具修正,最後用 SD 自帶的或外部的超分辨率工具輸出;
(3)專業手繪出圖:精準手繪線稿輪廓,Controlnet 填色繪制,得到初稿後用 Ps 塗大色塊方式調整姿态、細節,返回用圖生圖等方式持續叠代;
(4)風格切換出圖:MidJourney 出概念圖,導入 StableDiffusion 重繪至指定風格,或 StableDiffusion 出參考圖,導入 MidJourney 發散不同風格。
總的來說,美術通用資源部分初步具備了 AIGC 管線生産的能力,問題即提升空間和機會。
玩球少女(金)-StableDiffusion
音頻方面,筆者測試了多款 AI 技術工具,除變音類的例如 Voice AI 較爲實用外,AI 生成音頻,例如 Amper Music、MuseNetAI 生成背景音樂等,成果尚不成熟,拼湊感強烈,不能很好的通過音樂傳達情緒,考慮到有信息局限,以及篇幅原因不再展開。
AI 撰寫遊戲文檔大綱
策劃和程序方面,在一些标準化程度較高,已經有成功案例和資料的方面可以替代 " 重複造輪子 " 的工作。這裏 ChatGPT3.5 表現一般,GPT4 在多次輸入,完善上下文和邊界後表現不錯。例如基礎的數值設計、世界觀框架設計、玩法方案設計,都能得到還不錯的、合乎邏輯的方案,但創意性相對不足。在基礎的程序代碼方面類似,可以充當較好的多種語言實現 " 翻譯工具 ",以及代碼輔助工作,在小模塊的功能方面能節省很多字符輸入成本,測試下來仍會有較多 bug,但和策劃案類似,将有問題的部分返回 GPT 提示修正後,基本能得到正确的方案。
GPT4 輔助生成代碼
2. M 營銷端 :自動化的分析,降低門檻
傳統的輿情分析、信息采集需要通過爬蟲等方式搜集海量的信息,再通過 NLP 情感分析、聚類分析等方式處理,并對内容進行彙總解讀,相對門檻和成本較高。大語言模型例如 ChatGPT 很大程度上優化了整合了上述流程,配合插件等方式完全聯網後,多語種、全渠道的公開數據分析将極高效率的輔助對玩家和市場情況進行洞察,對輿情和異動情況進行有有效的自動報表分析。
此外 AI 強大的總結、提煉語言信息的能力,在該方面着手成效,非公開數據在投喂後進行分析、制作報表呈現、預測,提煉和總結的效率将很大提升。同時,我們需要警惕信息的洩露問題,注意保密信息的安全。
3. E 玩家體驗:AI 促進新玩法的産生,叙事類、UGC 類、大世界 AI 玩法類将首先受益
《極樂迪斯科》 對話探索解密類遊戲
AI bot 技術中的對抗 AI 和社會生态 AI 一直是遊戲行業研究和應用的重點,這次也更大程度的曝光到大衆視野之中。而人類的信息決策和 " 智慧 " 很大程度是對自然語言的接收、分析、處理,大語言模型将助推 AIbot 多維度呈現更爲鮮活的表現。例如改變了玩家的交互方式,玩家通過自然語言交互的方式将能夠傳達更多、更爲開放的信息,可以被 AI 接收處理,提升 AI bot 的信息收集能力。并且 AIbot 通過語言輸出作爲反饋,打破了玩家非此即彼的交互選擇。
進一步的技術提升後,可作爲 AI bot GOAP 目标建立的依據,技術原理上類似 HuggingGPT,由中樞驅動驅動 AI 的行爲表現更爲智能,給玩家帶來更生動的 AI 體驗。
超參數 GAEA (圖片來源于超參數官網公開資料)
目前階段的案例,例如超參數公司最新發布的 GAEA,其要點在于打造有 " 生命 " 的 AI NPC,以及建立反饋機制。反饋機制的建立筆者認爲依賴三種途徑:環境的标簽和數值、交互行爲的标簽和數值(PvP/PvE/EvE),以及大語言模型(LLM)逐漸成熟後的語言交互的标簽和數值,這種整體性的系統一旦耦合完成,最終的效果可能遠超我們的期待。
4. PME 整合:PME 和 AI 的全面整合,将改寫遊戲的生産方式,進一步可能推動生産關系的變革
PME 端各部分結合泛 AI 後,在生産效率、标準化方面将有顯著的提升機會,并促進新玩法的産生,帶給玩家新的體驗。可能會是新設備載體(XR)普及前最大的助力,而 PME 和 AI 的全面整合,将可能改寫遊戲的生産方式,進一步可能推動生産關系的變革。
舉例來說,20 年前建築領域基本以手繪圖紙、施工圖爲主,而現在基本已實現全面的數字化和信息化,現在的遊戲行業生産方式可能相當于 20 年前的手繪時代。而這種進步和改變,使得準入門檻和生産成本極大降低,更加提升創新和思維能力的占比,UGC 的遊戲參與方式可能從一種 " 玩法方式 " 變爲一種 " 生産方式 + 玩法方式 " 的融合,web3 倡導的個體價值(去中心 + 所有權)的實現有了具體載體,UGC 定義将會重塑。
02
遊戲制作中 AI 工具的具體運用
生産制作端現有 AI 工具
1. 策劃:隐形助手
AI 對策劃方面的提升目前主要集中在兩個方面:一是作爲基礎計算工具的整合,二是幫助牽引靈感,給出大的框架設計。
前者是指複雜的多軟件、多數據的處理整合過程,可以交由 AI 處理,例如需要調整一張複雜數值表格的某些參數。其中計算實驗部分很多,例如需要反複數十次的調整各項數值,達到 " 平衡 "。可以将整體數據輸入 ChatGPT,清晰描繪數值調整需求,由 AI 給出不同的計算和調整方案,作爲多方案預覽,極大節約時間成本,後續再通過手動校正的方式逐步達到落地需求。
後者例如文案 / 叙事策劃,則可以給定關鍵詞,交由 ChatGPT、文心一言、通義千問之一的大模型,由 AI 幫助撰寫,獲取靈感,然後在此基礎上調整、拓展,還可将每一章節交由其提煉關鍵詞并生成 Prompt,輸入到 MidJourney 中生成對應的插圖,形成圖文并茂的策劃案。
2. 美術:擁抱直至成爲一部分—— AIGC 的發展階段
AI 與美術的應用前文中有提到部分管線流程,而對于整體的發展,筆者認爲有幾個階段:
(1)技術突破爲主,美術效果:" 又不是不能用 ";
(2)" 玩家共創 ",前鋒跑步入場,叠代完善美術效果—— " 澀澀是第一生産力 ";
(3)專業化人員進入大衆視野,"Prompt/AIGC 工程師 ",多技術融合,插件如雨後春筍,技術和品質提升全面加速;
(4)深度融合,美術自訓練 AI 模型成爲标配," 請提供你的 Portfolio" 變爲 " 請提供你的 SD 模型集 ";
(5)鏈條打通,AI 2D、3D 工具完善,分化爲兩條路徑,一是極度便利的自然語言輸入,生成各類概念性、非标性美術内容,二是極度複雜,海量參數暴露的 " 參數化美術 " 專業發展路徑。
目前來看(2023 年 4 月)處于 2.5 階段,着重闡述一下階段 4 的模型訓練原理:
我們可以類比美術師的成長訓練過程,以人體爲例,美術師需要對頭、手、腳、軀幹各部分進行 " 分模塊練習 " 和 " 整體組合練習 ",并對臉部五官、手重要部分進行 " 強化訓練 ",基本的繪制形體功能練成後,逐步對不同人物的體态、神态進行 " 泛化訓練 ",由寫形逐步提升到寫神,最後經過海量的數據和訓練,可以達到默寫,而後進行藝術創作。這一過程無疑是以 " 年 " 爲單位進行的,而 AI 技術的優勢在于,我們将各個 " 部件 " 繪制成果一次輸入多組即可,而後的對不同對象的組合、泛化交由 AI 操作,極大省去了協同過程中的試錯和反複成本——我們将腦海中的 " 意象 " 繪制出來與 " 甲方 " 同步," 甲方 " 認爲和其腦海中的 " 意象 " 不一緻,反複調整的成本。
顯而易見的,AI 生态的融入,很大程度上對美術這一崗位進行了一次大面積篩選,繪畫功底越深、駕馭的美術風格越成熟,或者風格越獨特的能更大的放大自身的價值,且在更複雜的場景領域存在很多機會。通過 AI 的杠杆将隻有 " 一雙手 " 的生産力擴大化,而單純隻是充當繪制勞力的人力,則面臨叠代。
3. 客戶端:我打敗我自己
雖然 AI 目前無法完全代替程序員來編寫複雜的遊戲客戶端,但它可以幫助程序員生成一部分簡單的代碼或基于已有的代碼進行拓展。運用 AI 來輔助編寫遊戲客戶端代碼已經起到了不錯的成效,例如 GitHub Copilot 工具,使用方法和步驟如下:
工具準備:
GitHub Copilot 是一款基于 AI 技術開發的代碼補全工具,可以借助它來輔助編寫遊戲客戶端。GitHub Copilot 以 OpenAI 的大型代碼庫爲訓練基礎,能夠理解大量編程語言和框架,如 Python、JavaScript、Unity 和 Unreal Engine 等。
步驟:
(1)準備好環境,并安裝 GitHub Copilot,GitHub Copilot 将整合到編程環境裏(如 Visual Studio Code);
(2)編寫遊戲邏輯:當你在編寫過程中遇到需要幫助的地方時,可以借助 GitHub Copilot。隻需輸入一些相關的關鍵詞或注釋,GitHub Copilot 就會根據其理解生成相應的代碼建議;
(3)優化代碼:AI 生成的代碼不一定完全符合我們的需求,因此需要進行檢查、修正并調整至期望的解決方案。沒百分之百完美的代碼,審查與驗證依然是一個重要的過程;
(4)測試與叠代:運行客戶端進行适當測試。如果出現問題修複錯誤并優化代碼。如果是剛寫的這部分出現問題,可以試着提交給 ChatGPT 幫助檢查。
目前類似 GitHub Copilot 輔助編寫遊戲客戶端代碼的工具百花齊放,雖然目前無法完全單獨完成編寫任務,但随着技術的發展,AI 輔助将在遊戲開發領域扮演越來越重要的角色。
4. AI 與遊戲帶來的玩法更新
玩法 | 更新 |
RPG/ 大世界 | RPG 的世界感知通過 AI 對話将被塑造的更爲清晰具體,例如與 NPC 關系的養成、NPC 對話對世界的了解、NPC 交互行爲的多樣性豐富,RPG 世界将更爲鮮活,可能延伸與 NPC 更深度的交易、社交、對抗等玩法。例如霍格沃茲、夢幻西遊。 |
Party 社交 | 鵝鴨殺類社交 Party,AI 對話使得 AI 玩家成爲可能,因傳統對真人數量湊齊門檻較高,且玩家數過多體驗可能降低,AI 玩家的出現解決該類問題,可能延伸出更爲複雜的玩法變體。 |
虛拟人 | 例如湯姆貓 +ChatGPT,原神角色 +ChatGPT,人物、動物養成類玩法因 AI 對話賦予了新的交互和情感表達,催生 " 便攜 " 的獨立玩法,以及玩法更新。 |
解謎類 | 以對話文本爲主的解謎類,從參與方式、解謎方式、獎勵方式将變得更爲開放,以及可能産生前人千面的開放結局。例如極樂迪斯科類型的遊戲。 |
劇本跑團 | 龍與地下城,目前已有初步的接入 GPT 版本,充當 DM 的角色,可以預見的,AI 對于美術資源生成方式的進化,将使得原本的文字跑團,變得畫面豐富、聲情并茂,玩家 AI 變化聲音,沉浸式扮演,遊戲體驗将上新台階。 |
養成類 | 賽馬娘等養成類的養成路線可能交由 AI 生成,AI 提供不同的交互玩法,劇情文本基于玩家的基礎數據和不斷的輸入生成,固定與動态内容相結合,真正做到養成屬于玩家自己的 " 偶像 "。 |
03
AI 與遊戲發展展望
1. 監管相關
(1)AIGC 的版權:
a. 美國:對 AIGC 生成的内容不予版權保護,相似度過低的情況下,也不認爲侵權素材來源方。
2023 年 2 月 21 日準許 AIGC 漫畫《Zarya of the Dawn》的版權注冊,但僅限于非 AIGC 的部分,即選擇、協調安排的部分,該作品的版權先後經過了直接審核通過,而後美國版權局得知其爲 AIGC 的内容後予以拒絕,最後進一步考慮後,切分了版權的保護範圍。總的來看,目前政策還處于變動期,需要我們關注的爲兩個方面:一是版權隻能保護人類創造力的産物,在不受保護的情況下可以理解爲它屬于 " 任何人 ",二是侵權的風險依然存在,AI 擴散生成的訓練集通常用千萬張以上的圖像,目前僅從相似度判定基本沒有侵權問題存在,但無法忽略大規模使用,會對以後侵權方式的界定産生變化。
b. 歐盟:四步法判定 AIGC 内容是否符合 " 作品 "。
歐盟委員會 2020 年發布的報告提出了 " 四步測試法 ",來判斷 AIGC 是否符合 " 作品 " 資格:
Step 1 – 文學、藝術、科學領域;
Step 2 – 人類智力活動 ;
Step 3 – 獨創性;
Step 4 – 表達。
目前來看,AIGC 作品基本上不滿足第二和第三點,不能得到版權許可以及相應的授權保護。
(2)AI 大模型的數據安全和文化安全
a. 意大利:3 月 31 日,意大利國家隐私監管機構正式下令封禁 ChatGPT,并指控 OpenAI「非法收集個人數據」。
值得注意的是,該「臨時禁令」将一直生效,直到 OpenAI 能夠尊重歐盟具有裏程碑意義的隐私法——通用數據保護條例(GDPR)。
b. 中國:4 月 11 日,中國國家互聯網信息辦公室發布《關于公開征求意見的通知》,主要爲 AI 内容提供者應當承擔該産品生成内容生産者的責任、個人信息保護義務。利用生成式人工智能産品向公衆提供服務前,需按規定向國家網信部門申報安全評估,并對内容審核負有責任。
2. AI 生态與遊戲發展展望
AI 生态目前排山倒海的景象,可能還隻是處在單點爆發階段—— AGI 的前夜。筆者認爲 AI 生态的發展會經曆至少 4 個階段:
(1)單點爆發;
(2)垂直大規模應用,以及多模态的應用;
(3)功能集成與耦合,湧現出新功能、新體驗;
(4)行業洗牌,頭部獨占 + 細分龍頭。
目前我們處在 I 向 II 過渡的階段,可以看到 ChatGPT 等大語言模型、MJ、SD 在充分的單點爆發引燃了用戶群體後,在各垂直領域有星星之火燎原之勢,例如 GPT 結合的微軟辦公全家桶,在辦公領域這一垂類仍會繼續細分直至完全的适配和具體的痛點被打通。
GPT4 已經初步展現了在多模态中圖像處理功能,在之後的 5/6/7 版本中,将全面覆蓋音頻和視頻的處理能力,對于多種載體形式的混合 " 信息 "、集成輸入的處理能力邁上新的台階,顯而易見的,遊戲這一泛文娛和集成前沿技術的領域,将會是最好的引領行業,以及最大規模被颠覆的行業。
在 AI 生态 + 遊戲行業中,PME 三端将會逐步迎來垂直細分的大規模應用,而在 P、M、E 每一個部分,例如生産制作端,策劃、客戶端、美術各部将會很快覆蓋,從制作到對玩家體驗的更新。
Overview of HuggingGPT(圖源自 arXiv 論文 HuggingGPT...)
這裏的以大語言模型 LLM(例如 ChatGPT)連接機器學習社區(例如 Hugging Face)中的各種 AI 模型以解決 AI 任務的框架已經初見成果,例如上圖中微軟亞洲研究院的 HuggingGPT,能夠覆蓋衆多不同模态和領域的複雜 AI 任務。以及近期諸多整合工具,例如 BabyAGI、AutoGPT 等,AGI 初見端倪。
而散點的 AI 技術百花齊放、百家争鳴階段,仍是以第一階段技術的延伸、改造爲主,在經曆過充分的爆發後将會逐步收斂,新技術、新功能以從未被系統設計過的方式組合後,将産生湧現式的創新,這一過程像是 CV、NLP 等整合後帶來的湧現創新,這類的突破将會帶來新功能和遊戲的新體驗,不僅給制作者帶來便利,而會真正的影響每一個大衆玩家。
3. AI 時代下的個人
在一個新時代來臨之際,個人的态度選擇尤爲重要。筆者建議根據個人情況,有兩種相對融入的态度:
(1)擁抱、學習
a. 保持開放心态:擁抱 AI 時代需要首先保持一個開放和樂觀的心态,不畏懼新技術所帶來的挑戰。AI 是很好的工具," 君子善假于物也 ",我們從馴服動物、制造馬車、自行車,再到燃油車、新能源汽車一直以來都在與時俱進,像那句俗語說言:" 汽車時代來了,我們應該做的是考個駕照,學會駕駛它。"
b. 更新知識結構:在 AI 時代,個人需要不斷更新自己的知識結構,學習跨學科的知識,特别是與 AI 相關的領域(如計算機科學、數據分析、統計學等)。目前的知識獲取已經極度便捷,我們完全可以根據自身情況積極了解、或者掌握 AI 相關的技能(如基礎編程、機器學習算法、應用開發等)。
c. 跟随時代潮流,深度思考,看透本質:一方面持續關注 AI 領域的動态和趨勢,使自己始終與時代同步,另一方面,警惕追風捉影,深度思考需求的本質、問題的本質、價值鏈條的本質,以第一性原理看待潮流後的實質。除了理工科思維和技能外,非邏輯性的洞察思維、同理心思維、人文素養将變得更爲珍貴,這裏我們最好不要用學科去定義和切入,保持 " 以人爲本 ",多從關懷和愛的角度思考,或許會有不一樣的發現和收獲。
(2)發現應用場景、解決具體問題,實現自我和社會價值
a. 浸泡、深入了解所處的行業:深入研究和了解所處行業的痛點和需求,發現 AI 技術可以解決的具體問題,個人可以根據自己的興趣和特長,發揮優勢,實現 AI 技術在自己關注領域的應用與突破,例如深耕 RPG 品類的考慮能否訓練垂類的 GPT 模型,爲企業和玩家帶來價值。
b. 驅動創新與發展:通過挖掘 AI 技術的新應用場景,比如 ControlNet 爲斯坦福大學計算機專業的在讀華人博士 Lvmin Zhang 開發,我們能否将其更好的應用在遊戲領域,推動整個行業的創新與發展,同時也實現個人價值的提升。
c. 普及 AI,亦師亦友:作爲 AI 領域的使用者,在熟悉掌握了之後,可以選擇幫助更多的人了解和使用 AI 技術,以解決實際生活中的問題,這對我們自己的提升也十分有幫助," 三人行,必有我師焉 "。
04
總結
本文淺薄的讨論了 AI 生态與遊戲行業的應用與未來發展展望,對遊戲行業 PME 三端應用的進行全景解析,并對 P 端的 AI 現階段具體技術應用進行了分享,最後讨論了 AI 的監管和風險項,對 AI 生态 + 遊戲行業發展進行展望,以及個人在 AI 浪潮中的應對給出一點建議,僅供參考。
希望對遊戲行業從業者全局了解有所幫助,或許這是一個種子,幫你在未來長出對 AI+ 遊戲研究的小苗,或許這是刺客信條翺翔的鷹眼,幫你從全局的視角,鳥瞰一眼寬闊的景象;或許這是一篇 " 投資報告 ",幫 AI 生态 + 遊戲引來一位 " 植樹人 ",灌溉一傾水,滋潤行業的發展,也爲社會和玩家帶來價值。
# 寫于 2023 年 4 月,以上内容僅供參考
遊戲葡萄招聘内容編輯,