01 一個意料之外的設計變量
語音系統,可能是最不起眼的遊戲功能之一。但現在,情況變了。
最近的社交媒體上,一位玩家在 " 你最近最喜歡的遊戲是什麽 " 的問題下提到,他近期沉迷玩一款名爲《Dark and Darker》的遊戲,尤其當它重新引入了全新的語音系統(VoIP)後,遊戲體驗變得更好了。
相似的現象在也出現在《Suspects: Mystery Mansion》。開發者去年在相關媒體賬号上指出,遊戲叠代了一次語音系統後,哪怕玩家不戴耳機,其遊戲體驗也能得到提升。開發者對提升幅度描述爲 " 徹底 "。
如果你在社交媒體上搜索上述産品 +VoIP 的詞條,能看到玩家對語音系統清一色的喜愛。某款産品測試階段上線該系統後,有 KOL 專門爲此制作了視頻,不吝溢美之詞地稱贊語音體驗;有玩家回複,遊戲前後體驗能好上 "10 倍 "。
這一現象并不尋常,畢竟很少有玩家會提到遊戲聲音的優劣。
遊戲聲音的評判比較尴尬,它既難被玩家捕捉,也難被開發者确切描述。一位大廠音頻總監曾告訴我,他們此前靠用戶調研判斷工作成果,隻要 " 沒人提音頻不好 ",便證明工作做對了方向。
語音系統更爲邊緣,它甚至難算作遊戲音頻。過往,語音更接近附加功能,與遊戲所需的社交程度挂鈎。如果語音需要被添加,它通常不是由音頻部門負責,而是交由客戶端來開發。這是一個較爲基層、難出彩的功能模塊。
而如今,語音模塊正切實地在數款産品身上帶來了超預期的市場反饋,甚至成爲部分産品影響玩家體驗的關鍵因素——這些産品的共同特點,就是使用了騰訊雲音視頻 GME 與 Wwise 獨家合作的語音方案。
根據玩家、KOL 對上述兩款産品的評價,這套全新的語音系統已成爲遊戲音頻的一部分。
在《Dark and Darker》KOL 發布的相關視頻中,一位深處在洞穴的玩家向主播求饒時,他的聲音不僅有方位感,還自帶混響,好像那個玩家是真在逼仄的洞穴中說話一樣。
在《Suspects》裏,玩家語音有傳播範圍,太遠了聽不見,還有可能被牆壁隔開——玩家在被其他人追殺時,爲了及時告訴其他人自己有危險,得跑來跑去,大聲呼喊才行……
通常,遊戲聲音要有信息,也要有 " 身臨其境 " 的感受。遊戲聲音爲了沉浸感,會實時做混音。例如,當一位玩家走路的時候,另一位玩家可以根據腳步聲就能判斷另一位玩家是在樓上還是樓下,是在木闆上還是外面的石子兒路上,距離有 5m 還是 10m ……
而傳統語音功能簡單,玩家開麥隻爲了傳遞信息。語音更接近于一個獨立社交系統,與遊戲内容本身的聯系并不大。很多遊戲一開麥,就像是撥通電話一樣,讓玩家的聲音和遊戲格格不入。
——很明顯,上述兩個産品案例的語音多了臨場感的那一面。
《Dark and Darker》就是一個典型案例。
《Dark and Darker》的語音與遊戲聲音就融合在了一起。當玩家在遊戲開麥說話的時候,語音會根據玩家所處的環境,完成混音,讓聽到語音的玩家能立刻知道說話人究竟在什麽位置,或者身處在什麽樣的空間。
聽起來并不特别?但玩家的體驗卻因此發生了許多變化:大家開始更頻繁地和陌生人聊天,就爲了能聽聽聲音在地下城裏的回聲;語音還帶來了緊張刺激的感覺,強化了某些場景的表現力;一些主播喜歡這種沉浸感,時不時會戲精上身,玩起角色扮演……
其實仔細梳理遊戲設計,《Dark and Darker》并沒有爲語音額外增加玩法設計,或是爲其改變關卡,但僅是讓語音多了沉浸感的設計,就已經讓玩家們的體驗發生變化,甚至改變了其遊戲的方式——說實在一些,這一改動的性價比很高。
這種沉浸感還有許多額外的加持。比如,GME for Wwise 功能還使語音更清晰,不割裂,就像在遊戲環境之下的面對面對話;再比如,組隊玩家可以應用彼此熟悉的變聲特效,既區分了隊伍,也多了趣味性。
而在不久前,語音系統還隻是一個距離遊戲設計很遠的邊緣功能模塊。而如今,它正在借助新的語音技術,跻身到遊戲音頻的設計範疇,開始啓發團隊立項方向,影響玩家的遊戲體驗。
但這一變化是什麽時候開始的?
02 從邊緣功能,變成核心的一部分
在剛看到有關語音的稱贊時,我其實也不以爲然。這與行業對語音的傳統認知有關。
語音的邊緣性,部分來自其功能定位。語音對很多産品都很重要,但它在生産流程上鮮少被重視,大部分團隊認爲,等所有設計完成後,再額外添加上語音功能就好。這也忽視了語音質量對遊戲的影響。
語音的功能定位,也使其更多交由三方團隊開發。研發組不需要耗費太多時間去自己做一個語音系統,而是尋找三方團隊的解決方案,植入項目就行。一位音頻總監提到,他們針對語音系統的工作隻有屏蔽詞設定。
也因此,語音模塊距離遊戲設計一直很遠。
最早,國内語音功能就獨立于遊戲,依賴三方聊天軟件。在《魔獸世界》《傳奇》《QQ 炫舞》等産品的社交環節,許多玩家會額外挂 YY 等語音軟件,和朋友一起聊天打本。語音模塊時常會脫離遊戲,接近另一個社交場景。
後來,語音模塊逐步融入遊戲,與部分品類綁定在一起。這部分需求在手遊發展較快的階段頗爲明顯,由于手遊聚焦操作,所以玩家難做太多社交動作,比較依賴遊戲内即時語音系統。也在此時,GME 項目開始推進。
2017 年,GME 開始推出語音解決方案,提供 SDK 及基礎 API 來幫助遊戲廠商做遊戲内的語音系統。根據相關信息,GME 是騰訊雲音視頻旗下産品,它最初誕生于 QQ 音視頻實驗室,用以支撐内部産品,後對外開放,向外部遊戲廠商提供語音方案。
成立早期,GME 核心戰略是做一站式方案:
● 這套語音方案要極簡,僅需 4 行代碼就能使用功能;
● 它有騰訊雲音視頻的技術優勢,足夠穩定安全,兼容移動、PC 等多端平台,并且是索尼與任天堂主機平台官方授權的語音插件;從 17 年适配 unity 起,到如今最新 UE5、PS5、XboxSeries 的适配,SDK 越發成熟穩定;
● 更重要的是,它集成了大量語音功能,能做基礎的音文互轉、語言翻譯,也能做更高級的識别特定遊戲術語、錄制音頻存檔、極速語音條等,還因覆蓋遊戲品類的廣度與深度,而優化叠代了較多語音管理相關的能力……
但語音始終是邊緣功能,因爲鮮被重視,它一直有一個未被解決的 " 頑疾 "。
手遊平台的語音一直存在一個割裂遊戲體驗的問題:玩家一開麥克風,遊戲聲音就會如電話音一般,讓體驗割裂。不過由于語音一向如此,很多人都覺得它是無法避免的,甚至鮮有人将其視爲痛點與 GME 溝通。
簡單來說,此前語音想要變得清晰,依賴硬件調試,它得去手機的通話功能裏才能降噪,并消除回聲。但這一調用,原本走電影音樂播放通道的遊戲聲音,會一同被帶到通話音質。這也讓遊戲一開麥,音質就變差。
如果要解決這個問題,就得想辦法讓語音不依賴硬件,在軟件層面去做降噪和回聲消除。而在過往的傳統方案裏,語音之所以沒往這方向考慮,便是因爲邊緣性,它很難拿到遊戲的音頻信号。
2018 年,GME 希望解決這個問題,他們前往加拿大與 Audiokinetic 的 Wwise 聯系——這是全球覆蓋範圍最大的遊戲音頻引擎軟件——尋找解決方案。他們一開始的策略很簡單,就是借助音頻引擎從軟件層面提升語音質量,讓它不會割裂遊戲體驗。
但合作起初并不順利。Wwise 覺得這事沒什麽必要,它服務的海外産品以 PC、主機産品爲主,沒有聽到太多用戶關于手遊的語音體驗反饋——也是在溝通中,GME 意識到,語音除了提高聲音品質,它在遊戲引擎裏其實可以做更有價值的功能。
從結果來看,GME for Wwise 方案是将語音做成了遊戲内的一個事件。一方面,語音完成降噪和回聲消除,讓遊戲保持媒體音量,使開麥不會影響遊戲聲音的品質;另一方面,語音還能與其他音樂音效共同聽從遊戲設計的指揮,一同爲玩家的沉浸體驗服務。
在這個方案裏面……人聲構成遊戲事件的一部分。
2023 年北美 GDC 遊戲開發者大會上
Audiokinetic(Wwise)公司展台上
向無數開發者呈現 GME for Wwise 方案
總結這個全新的語音方案,GME for Wwise 最大特點就是将邊緣化的語音系統納入遊戲音頻,鼓勵音頻設計師将語音作 爲設計的一部分,讓語音不停留于通話功能,而是能成爲玩家與遊戲交互的方式之一。
借助 Wwise 與 GME 的合作契機,語音模塊逐步消解了邊緣性,正慢慢從一個需要三方提供的解決方案,變成了能夠拓展遊戲廠商設計緯度的 " 遊戲聲音 "。這也是我在了解新語音系統時感知最爲明顯的部分。
目前,越來越多的廠商開始引入 GME for Wwise 的語音功能,國内多款大熱的 MOBA、派對産品,也已開始嘗試接入該方案,以提升産品的語音體驗。
03 亟待探索的新領域
語音對于遊戲設計來說并非一個陌生領域。
此前,《In Verbis Virtus》《會說話的湯姆貓》等産品就嘗試做了語音設計,玩家喊出特定内容,遊戲對玩家做出一些回應。這些設計已經将語音視作了玩家與遊戲交互的一種方式。
而 GME 與 Wwise 推出的獨有解決方案,讓語音真正在設計領域突圍道路——它更接近于一次聚焦語音的技術變革,語音正追上遊戲設計的其他模塊,成爲一塊可用的組件,可以被更多團隊在立項階段視作實現差異化的武器之一。
根據一位音頻設計師的進一步解釋,遊戲設計強調關聯性,比如在聲音範疇,單個聲音可能并不出彩,但它們可以彼此配合,組成一塊足夠完整的體驗,它們就能帶來沉浸感。語音從新技術處獲得的,正是它與其他組件的關聯。
另一方面,GME for Wwise 也對團隊帶來了影響:如今一個語音模塊,可以由客戶端負責邏輯開發,音頻部門來做創意設計;它提升效率的同時,也額外增加了創意發揮的部分。
探索還尚未普及開來。GME 在 Wwise 的第一個語音插件在 2020 年 1 月發布,随着一兩輪開發周期過去,這一插件開始被更多開發者應用起來。而且許多産品仍在開發當中,對全新語音方案的應用程度仍是未知數。
但我們已經可以在已有産品中看到了許多很有趣的嘗試。
語音與空間的關系就是一個方向。在 Wwise 介紹 GME 插件的 demo 裏,他們就主要展示了語音在空間中折射、衰減的 3D 效果。站在研發角度,這一變化也變相影響着團隊設計關卡結構的思路——《Suspects》便是如此。
傳統太空殺的對局不需要語音,玩家各自推進任務,直到發現兇案,大家再在投票環節再交流信息;而《Suspects》讓玩家們在對局中也能互相交流,不過若彼此離得越遠,或者有建築物阻擋,聲音就會衰減。
對比傳統設計,《Suspects》的關卡也要更加立體複雜,它會考慮到玩家之間彼此交流的輕快,嘗試制造更多死角,來阻擋或衰減語音信息的傳播—— 遊戲的每個關卡有需要乘坐電梯的複式解構,有大量隔開的小房間,以及有高低差的樓梯間……
也因此," 太空殺 " 的爾虞我詐能貫穿整個對局過程:如果你懷疑某人有嫌疑,害怕他加害你,大可到處亂跑大叫他的名字,嘗試向附近的人留下訊息;如果你是完成犯罪的嫌疑人,可以在事發前就找到其他人,提前釋放假消息。
逍遙散人在直播時看到有玩家靠近,
就到處大喊 "cheche 貼我!我死了就是 cheche!"
Suspects 還做了一個提示效果:
玩家語音聲音大小和角色光圈挂鈎
《Suspects》的音頻設計師在 Wwise 座談分享的時候特别提到,他們之所以能夠跳出品類限制,做出不少有關語音交互的樂趣,就是在接觸 GME for Wwise 後,覺得可以把這些功能用起來,做一些過去不會想到的玩法。
除此之外,語音與遊戲設計的結合方式還有很多。例如與隊伍劃分結合,不同隊伍玩家的語音可以被賦予不同的聲音特效;例如與變化的天氣結合,隊友的語音會混雜更多的氣象效果,如下雨、刮風等,增加遊戲環境的真實度。
再比如,語音與角色狀态結合。如果玩家受到了攻擊,狀态不好,那麽他的聲音就可以按角色血量或 debuff 增加一些表達痛苦的混音;如果他需要火力支援,可以讓其他遊戲音效小聲一些,突出角色求助的關鍵信息。
回顧語音的過往是很有趣的事。最早,語音服務商們的策略都是做一站式,要集成足夠多的功能,覆蓋足夠多的場景,爲客戶提供足夠豐富的服務。但無論如何變換,它都是面向遊戲廠商做叠代。
如今,語音面向産品,完成功能突破。語音不是去滿足遊戲廠商多麽百人千面的需求,而是進到了生産鏈路,成爲産品的一部分,正想辦法直接爲遊戲帶來增益價值——站在産業角度來看,這也将改變行業對這一細分領域的諸多認知。
根據 GME 透露,現在已經有越來越多的遊戲工作室對該方案感興趣,并開始讓在研項目對接全新的語音解決方案。而 Wwise 也在與許多使用了新語音方案的團隊聯系,讓他們分享更多設計經驗。
或将在不久的未來,我們就能看到語音模塊會對遊戲設計帶來更多有趣的改變。