ChatGPT 徹底引爆了 AI 領域,也點燃了各賽道玩家的熱情。
以虛拟交互體驗爲例,就已經有不少新産品冒頭。
不僅像 Chat D-ID 這類以 ChatGPT 驅動的虛拟女友 bot 花樣百出,就連遊戲AI NPC也變得火熱起來,這幾天知名遊戲公司育碧要推出 AI 工具 Ghostwriter 一事,更是引起了巨大關注。
不過這些都還隻是用 AI 驅動單人 NPC 對話。
如果能用 AI 操控 NPC、甚至搭建出一個 AI 社會呢?
前不久,一個名爲 " 活的長安城 " 的技術 Demo 引發讨論,其中 NPC 不僅全由 AI 操控,彼此之間還能互動:
要做的事也不會脫離性格和目标,如隻想摸魚翹班的捕快、立志當首席的舞女:
這場景,屬實有點《西部世界》内味了!
但與《西部世界》不同的是,這些 NPC 沒有預設劇本,也不會消除已有的 " 記憶 "。
它究竟有何不同?又是如何運轉起來的?
" 活的長安城 ",有何不同?
據上述 Demo 的發布方最新介紹," 活的長安城 " 是一個還在演進中的 "AI 社會",背後由一個名叫GAEA的技術系統驅動。
(之所以還在演進中,是因爲它隻運轉了 30 天,更像是一個社會雛形)
而以 " 活的長安城 " 爲代表的 "AI 社會 " 具備以下特點:
包含一群身份多樣、能互動的、受社會常識和反饋影響的 AI
這些 AI 的生活環境開放,能受交互反饋影響産生文明,反過來影響 AI 未來生活
這也導緻在身處 "AI 社會 " 的 AI NPC,與其他虛拟世界如遊戲中的 NPC 有很大不同。
首先,與衆多爲劇情設計的 NPC 相比,AI NPC 有自己的目标和行動理由。
在不少遊戲中,NPC 的目的隻是引導用戶走完劇情,即便用 AI 生成對話,這一目标也不會改變。
但 "AI 社會 " 中的 NPC 不僅有各自的長期目标,當下也需要爲生存等短期目标而考慮,換而言之,它們和人一樣有需求,并根據性格和心情狀态做出不同的行動。
此外,與其他遊戲 NPC 不同的是,這些 AI NPC 還能" 觀察 " 其他角色的行動。
就像你走在大街上會觀察路人一樣,AI NPC 也會在一定範圍内觀察你和其他 NPC。如果有人吵架、或是舉止異常,他們還會化身吃瓜群衆上來圍觀。
最後,相比其他遊戲 NPC,這些 AI NPC擁有社會常識,能 "記住" 看見和做過的事,并影響之後的行動。
例如舞女決定對路人出手援助,是因爲她沒有遇到過 " 受騙 " 的事情。如果她目睹或經曆了類似事件,那麽 AI 就會降低她援助别人的幾率。
這些特點,也導緻了 "AI 社會 " 不需要預設劇本,就能讓 AI NPC 自己碰撞産生故事,積澱到社會中後又能回饋到 NPC 身上,反過來影響 AI NPC 的行動決策。
聽起來很有意思,但具體到技術上,會發現實現起來并不簡單。
拆解 GAEA 兩大核心系統
從公開架構來看,GAEA 分爲靈魂系統和環境系統兩個子系統。
這其中,靈魂系統相當于 AI NPC 的大腦和行動中樞,環境系統則包含 "AI 社會 " 的社會常識和物理信息等,它們彼此之間會相互影響交互。
先來看看靈魂系統,它被分爲 " 記憶 " 和 " 策略 " 兩部分。
" 記憶 "又分爲内部狀态和事件經曆兩個模塊。内部狀态用于建模 AI NPC 做事的 " 動機 ",包含各種實時變化的狀态值,如有錢就想摸魚,不開心就想吵架:
事件經曆則包括 AI NPC 一路觀察或親曆的事情,用于給 AI NPC 的行動決策提供參考。例如 AI 小偷在大街上偷東西被捕快抓住過,它下次可能就不會在捕快出現的場景實施盜竊。
" 策略 "則分爲上層宏觀決策模型和下層交互模型。上層模型是一個長序列策略模型,它有點像 AI 的大腦,能夠基于 " 記憶 " 中的社會常識信息 + 當下的環境系統做出決斷,相當于給 AI NPC 制定一個整體計劃:
下層交互模型則是通過符号系統建模的多任務模型,負責将上層模型做出的宏觀決策進一步拆解細分,把整體計劃變成一步步實際行動。
再來看看環境系統,它被分爲 " 社會環境 " 和 " 物理環境 " 兩部分。
" 社會環境 "包含了兩方面的内容。
一方面,AI NPC 之間通過交互和反饋生成的語言行爲關系等信息,會被記錄在這個系統裏,持續影響 AI NPC 靈魂系統做出的行爲決策;
(當然,靈魂系統驅使 AI NPC 做出的行動,也會反過來交互中對環境系統産生影響,形成系統自運轉)
另一方面,它包含了運轉 "AI 社會 " 所需要的所有人類社會常識,例如帶有人類社會含義的狀态标簽(快樂、希望、金錢等)就包含在這個庫中,而社會知識和規則也納入其中。
" 物理環境 "就是場景中的各種物理數據了,包括風景建築和商品水果等實物的建模信息、以及其他 NPC 的物理建模數據等,讓 NPC 知道能與哪些場景數據發生交互,并指引它們做出具體的行動。
但即便 GAEA 背後的技術原理已經透露,具體如何實現讓 AI NPC" 更像人 " 的效果,又是哪些關鍵技術提升了它的劇情生成細節,仍然是一個未知數。
帶着這些問題,我們找到了 GAEA 背後的團隊——超參數科技。
據其項目負責人張弛介紹,GAEA 綜合了不同模型能力,研發周期比想象中要長,大緻分爲兩階段:階段一是搭建出完整的叠代場景和技術框架,也就是 GAEA1.0;階段二是着重提升 GAEA 的劇情生成和自然語言交互能力。
階段一,團隊主要依靠自研的 AI BOT 技術和長期實踐積累的工程能力,一步步完成 GAEA 的技術選型,讓虛拟場景 " 長安城 " 自運轉起來。
這一階段,不僅需要着重提升 AI NPC 的能力,包括豐富的行爲表現和自然的語言交流等,來讓它們看起來 " 更像人 ",還需要不斷改進技術方案和叠代路線,相當于将實驗室的内容落地。在張弛看來,後者尤其難,不僅要考慮技術落地,還要具備從系統的角度思考整個 NPC 生态的産品思維。
他舉例說,光是讓 NPC 看起來 " 更像人 ",涉及到的技術就不少。比如,讓 NPC 根據晝夜等常識概念做出合理行動,涉及到模型對社會常識的理解與推理能力;給 AI 賦予 " 理想 " 和生存等現實目标,則要考慮建模 NPC 内在動機;而支撐 NPC 海量的行爲表現,需要用到多任務強化學習等技術;而有效 " 記憶 " 信息提取,得通過特殊的編解碼方式來解決……
階段二,在系統已經能完整運轉的基礎上,團隊引入了大語言模型來提升系統的生成效果。正如原理框架中展示,大模型提升了原有 GAEA 在目标拆解、AI 常識推理和對話等模塊上的能力,進一步提升系統的 " 轉速 "。
談及下一步,張弛也做了小小透露,他說團隊計劃持續優化 GAEA 的技術細節,利用大模型去進一步提升 NPC 與真人交互的能力,以及整個生态的劇情生成能力,并對其他方向的 AI NPC 技術做一些預研布局。
當然,如何将 GAEA 輸出到輕量化、可感知的産品上,建立合作機會,也是他們正在思考的方向。
公開資料顯示,在推出 GAEA 之前,超參數科技已在 "AI+ 遊戲 " 領域取得成績,包括率先在在 3D FPS 領域實現大規模商業化落地,AI bot 在多款千萬日活的頭部産品中穩定運營,已經部署到全球 50 多個國家及地區等。
AIGC 催生産業變革浪潮
AIGC 這波浪潮推動下,各行各業正在迎來新一輪 AI 變革節點。
正如比爾 · 蓋茨在《人工智能時代已開啓》文章中所言,AI 的到來将會極大地提升社會生産力,從而進一步改變人與人之間的交互方式:
整個行業都會圍繞它重新定義。
一方面,AI 的到來正在不斷地提升社會生産力。
以大模型爲例,它正在改變很多行業的工作方式、未來甚至能極大地提升行業的工作效率。
另一方面,對于産業本身而言,AI 的出現又改變了人與人之間的交互方式,從而帶來産品的新一輪爆發。
在紅杉資本兩位合夥人與 GPT-3 聯合撰寫的一篇名爲 Generative AI:A Creative New World 的文章中,更是預測 AIGC 技術會如當年移動通信一樣,誕生一輪 " 殺手級應用 "。
簡而言之,這些新技術的出現,不僅會給産品開發過程帶來變革,催生出産品交互方式、乃至于産品本身的進化,甚至帶來 AI 原生産品。
至于如何應對這波 AIGC 浪潮?有玩家選擇 All in 新技術,開辟新場景;也有玩家質疑新技術應用前景,選擇再觀望一波。
超參數科技 GAEA 項目負責人張弛接受采訪時表示:
随着技術叠代,市場的不斷競争,我相信大模型的調用成本一定會持續降低。
因此,現階段該聚焦的還是如何在原有技術積累上用好大模型,做出完全不同以往的東西,給遊戲或未來産品帶來新的可能性。
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~