譯 / 安德魯
遊戲 NPC 不再千篇一律執行預設指令、根據玩家對話自由發揮的情況,可能要出現在遊戲裏了?英偉達最近公布的一項新 AI 技術就指向了這種可能性。
AI 生成技術正在從根本上改變遊戲行業,從設計開發、到遊玩方式。遊戲開發者正在探索,怎樣在 2D、3D 的内容創作管線中利用 AI 技術。這其中有一些讓人興奮的要點:在于 AI 帶來了 " 在遊戲運行過程中創作内容 " 的能力,這在更早期的階段原本是無法實現的。
随着遊戲變得越來越複雜,遊戲對于 NPC 的刻畫也在不斷進步。面部表情更豐富、台詞量更大、與玩家的交互方式也更多樣。
但當前玩家與 NPC 的交互方式,依然是偏程式化的、目的性明顯,因爲對話選項有限,玩家與 NPC 的交談、交互都隻是爲了推動遊戲内的故事發展。
而現在,生成式 AI 則可以改善 NPC 的交談方式,創造出能夠随時間推進而長期存在的性格,并對玩家的行爲做出更特别的響應,讓 NPC 的塑造顯得更生動。
在 COMPUTEX 2023 展會上,英偉達公布了 NVIDIA Avatar Cloud Engine ( ACE ) for Games。這是一項 AI 模型定制服務,通過 AI 驅動的自然語言互動讓 NPC 表現得更爲智能,從而改變遊玩方式。
遊戲開發者、中間件和工具軟件的開發者,都可以利用 NVIDIA ACE for Games 在遊戲、軟件中部署定制的對話文本、語音以及動畫的 AI 模型。
以下内容來自英偉達官方技術博客《Generative AI Sparks Life into Virtual Characters with NVIDIA ACE for Games》,由 DeepL AI 翻譯完成:
用 AI 基礎模型的最新突破生成 NPC
優化的人工智能基礎模型包括以下内容:
NVIDIA NeMo:提供基礎語言模型和模型定制工具,因此你可以爲遊戲角色進一步調整模型。這些模型可以根據需要進行端到端整合,也可以進行任意組合。這種可定制的大型語言模型(LLM)能夠實現符合遊戲世界的特定角色背景故事和個性。
NVIDIA Riva:提供自動語音識别(ASR)和文本轉語音(TTS)功能,實現與 NVIDIA NeMo 的實時語音對話。
NVIDIA Omniverse Audio2Face:隻需一個音源,就能立即爲遊戲角色創建富有表現力的面部動畫。Audio2Face 具有适用于虛幻引擎 5 的 Omniverse 連接器,因此用戶可以直接爲 MetaHuman 角色添加面部動畫。
您可以通過 NeMo 模型對齊技術爲 NPC 帶來活力。首先,采用行爲克隆,使基礎語言模型能夠根據指令執行角色扮演任務。爲了進一步使 NPC 的行爲與預期相一緻,在未來,你可以應用人類反饋的強化學習(RLHF),在開發過程中接收設計師的實時反饋。
在 NPC 完全對齊後,最後一步是應用 NeMo Guardrails,它爲 NPC 增加了可編程的規則。這個工具包可以協助你建立準确、适當、符合主題和安全的遊戲角色。NeMo Guardrails 原生支持 LangChain,這是一個用于開發 LLM 支持的應用程序的工具包。
英偉達爲各種規模的中間件、工具和遊戲開發者提供靈活的部署方法。實現 NVIDIA ACE for Games 的神經網絡針對不同的能力進行了優化,并在尺寸、性能和質量方面進行了不同的權衡。
ACE for Games 代工服務将幫助你對遊戲模型進行微調,然後通過 NVIDIA DGX 雲、GeForce RTX PC 或企業内部進行部署,以便進行實時推理。你還可以實時驗證模型的質量,并測試性能和延遲,以确保模型在部署前符合特定标準。
爲遊戲創建端到端的化身 / 頭像解決方案
爲了展示如何利用 ACE for Games 來構建 NPC,英偉達與 Convai 公司合作,幫助其優化 ACE 模塊并将其整合到産品中,Convai 公司是一家爲在遊戲和虛拟世界中創建和部署 AI 角色而建立平台的初創公司。
"Convai 公司創始人兼首席執行官 Purnendu Mukherjee 表示:" 通過 NVIDIA ACE for Games,Convai 公司的工具可以實現所需的延遲和質量,從而以具有成本效益的方式向幾乎所有的開發者提供 AI 非遊戲角色。
Convai 将英偉達 Riva 用于語音轉文字和文字轉語音功能,英偉達 NeMo 用于驅動對話的 LLM,而 Audio2Face 則用于從語音輸入中獲得 AI 驅動的面部動畫。
視頻 1. 英偉達 Kairos 演示展示了身臨其境的 NPC Jin,以及利用最新的英偉達 RTX 和英偉達 DLSS 技術打造的拉面店。
如視頻 1 所示,這些模塊被無縫集成到 Convai 服務平台中,并被輸入到虛幻引擎 5 和 MetaHuman 中,将身臨其境的 NPC Jin 帶入到生活中。由 NVIDIA Lightspeed Studios 藝術團隊創作的拉面店場景,在虛幻引擎 5 的 NVIDIA RTX 分支(NvRTX 5.1)中運行。該場景使用 RTX Direct Illumination(RTXDI)進行渲染,用于光線追蹤照明和陰影,同時使用 NVIDIA DLSS 3 以獲得最大性能。
遊戲開發者已經在使用現有的 NVIDIA 生成式 AI 技術進行遊戲開發:
歐洲領先的遊戲開發商之一 GSC Game World 正在其即将推出的遊戲《S.T.A.L.K.E.R. 2: Heart of Chornobyl》中采用 Audio2Face。
獨立遊戲開發商 Fallen Leaf 也在 Fort Solis 中使用 Audio2Face 制作角色面部動畫,這是一款發生在火星的第三人稱科幻驚悚遊戲。
以生成性人工智能爲重點的公司,如 Charisma.ai,正在利用 Audio2Face 爲他們的對話引擎提供動畫。
内容來源:
https://developer.nvidia.com/blog/generative-ai-sparks-life-into-virtual-characters-with-ace-for-games/
遊戲葡萄編譯
遊戲葡萄招聘内容編輯,