經濟觀察網 記者 陳奇傑 馬雲、雷軍、周傑倫、特朗普 …… 這些國内外公衆人物的真實聲音,被一些創作者使用 AI 音頻應用克隆後,制作成語音角色,并發布在 AI 音頻分享社區。用戶隻需幾十秒鍾,便可依靠這些語音角色生成一段接近真人講話音質的 AI 音頻。
" 十一 " 假期期間,網友制作了大量小米公司創始人雷軍的 AI 音頻,并在結合畫面合成音視頻後,将此類内容上傳到抖音、快手和 B 站等互聯網平台,其中不乏罵人、惡搞小米産品的語音,成爲輿論熱點。而在 9 月底,一名犯罪嫌疑人利用 AI 音頻應用 Reecho 睿聲(下稱 " 睿聲 ")僞造了三隻羊創始人盧文慶的錄音,更是導緻警方介入調查。
雷軍 AI 音頻事件發酵後,互聯網平台上的大量相關音視頻被删除,但仍有少量剩餘。經濟觀察網記者在 10 月 13 日發現,用戶依然能夠使用睿聲 AI 音頻分享社區(下稱 " 睿聲社區 ")裏名爲 " 雷軍 " 的語音角色制作音頻,一個 " 雷軍 " 語音角色已被使用 60.3 萬次。
睿聲是深圳市言域科技有限公司(下稱 " 言域科技 ")旗下的 AI 音頻應用和分享社區。言域科技創始人謝偉铎告訴經濟觀察網,小米法務方面已與該公司取得聯系,希望其能對社區中涉及雷軍的音頻内容進行管控。目前,言域科技已通知原作者下架相關内容,如果原作者在 7 個工作日内沒有下架,該公司會進行強制删除。
AI 音頻制作者、語音角色創作者、AI 音頻應用和分享社區、互聯網平台,共同構成了制作公衆人物 AI 音頻的上下遊鏈條。當此類音頻引發負面輿情時,鏈條上的涉事各方分别需要承擔什麽責任?被侵權人能否利用現有技術精準追溯到肇事方?
制作者的責任
目前,AI 音頻制作者主要通過兩種形式生成公衆人物的音頻。
第一種方式爲,AI 音頻制作者直接使用 AI 技術提供方的技術生成音頻。謝偉铎說,此前,合肥警方通過互聯網平台溯源找到了僞造盧文慶錄音的犯罪嫌疑人,在其電腦上看到了使用睿聲的記錄。言域科技配合警方調取了該嫌疑人的生成記錄以作證據。
言域科技方面披露,該嫌疑人截取了盧文慶在直播中大約 30 秒的情緒較爲飽滿的音頻作爲素材,并用自己編撰的文本在睿聲的平台上進行合成。其後,該嫌疑人在一個較爲嘈雜空曠的環境中,播放合成後的音頻,并用其他錄音設備分段做翻錄及拼接。這一操作增加了環境氛圍感,導緻衆多網友難以區分該錄音是真實還是僞造。
第二種方式爲,創作者上傳公衆人物的真實聲音,克隆出接近其聲音的語音角色,并分享至 AI 音頻分享社區上,其他制作者可以直接使用此類語音角色再生成 AI 音頻。相比前一種,第二種生成 AI 語音的方式更加便捷。
經濟觀察網記者在睿聲社區中選擇一個名爲 " 雷軍 " 的語音角色,輸入 200 個字符的文字,點擊生成音頻。不到一分鍾,一段仿造雷軍講話的 AI 音頻就被制作出來。
截至 10 月 13 日,睿聲社區的一個 " 雷軍 " 語音角色,被使用次數爲 60.3 萬次,生成字符數爲 3371.8 萬個;在 AI 音頻應用 Fish Audio 上,一個 " 雷軍 " 語音角色被使用了 17.4 萬次。
網友在制作公衆人物的 AI 音頻時,往往不會注意此類行爲需要得到授權,一位 B 站用戶說,他隻是看到很多人合成雷軍的 AI 音頻,于是萌生了制作雷軍 AI 語音解說遊戲視頻的想法。另一位制作了類似視頻的 B 站用戶稱,"(這種視頻)網上很多,應該沒事,有提示違規我就删 "。
泰和泰律師事務所律師杜雙告訴經濟觀察網,根據現有司法判定标準,高度可識别的 AI 生成聲音受到法律保護。AI 配音素材提供者、視頻制作者未經雷軍本人或小米公司授權,将其 AI 生成的聲音用于制作、傳播具有辱罵、诽謗性質的音視頻内容,本身已構成對雷軍肖像權、名譽權等多項人格權侵權,甚至會侵犯小米公司的名譽。
技術提供方的義務
在前述兩種 AI 音頻制作方式中,AI 音頻應用公司扮演了不同的角色。在第一種方式下,他們僅充當 AI 技術提供方。在第二種方式下,他們則具備 AI 技術提供方和運營方的雙重屬性。
言域科技創始人謝偉铎認爲,AI 應用隻是内容轉化的工具,在内容把控方面,更優先的選項是由用戶負責。作爲用戶生成内容(UGC)社區,在合法合規的情況下,言域科技并不願過度幹預用戶生産的内容。
因此,言域科技主要通過提示用戶和内容溯源的形式,進行合規經營。
言域科技在官網上提醒用戶,請勿使用其服務克隆或生成任何侵犯版權、違反道德倫理或違反中華人民共和國法律法規的内容。
三隻羊僞造錄音事件後,言域科技回應稱,其正在部署包括強化的實名認證機制,強化的敏感詞多維度智能偵測預警,以及可溯源音頻水印等多重安全措施。
謝偉铎說,現在用戶使用睿聲生成的所有内容都可以被溯源到,能溯源到的信息包括技術平台以及内容制作用戶等。
内容可溯源是監管方面對 AI 技術提供方和運營方的要求。全國信息安全标準化技術委員會秘書處去年 8 月發布的《網絡安全标準實踐指南—生成式人工智能服務内容标識方法》稱,由人工智能生成圖片、音頻、視頻時,應在生成内容中添加顯式水印和隐式水印标識。
杜雙稱,根據《互聯網信息服務深度合成管理規定》(下稱《管理規定》),AI 技術提供方還擁有加強訓練數據管理、保障訓練數據安全、保護個人信息等義務。同時,對提供人臉、人聲等生物識别信息編輯功能的,應當提示技術使用者依法告知被編輯的個人,并取得其單獨同意。
經濟觀察網注意到,一些創作者制作的 " 馬雲 "" 周傑倫 "" 特朗普 "" 蔡徐坤 " 等語音角色,被發布在睿聲社區的首頁上,并且可以被未注冊用戶看到。此時,這些公衆人物的語音角色成了 AI 音頻應用公司吸引流量的工具。
杜雙說,這種情形下,制作語音角色的創作者已經構成侵權。AI 音頻分享社區如果發現侵權行爲或者權利人投訴舉報,需要及時删除下架相關素材。如果不及時删除,AI 音頻分享社區需要承擔一定的侵權責任。
謝偉铎說,目前睿聲正在和一些配音演員合作,考慮推出高質量的官方角色。未來可能也會在驗證過版權的情況下,開展用戶出售聲音版權的業務。
平台:寄望于用戶标識
在本次雷軍 AI 音頻事件中,抖音、快手和 B 站等互聯網平台是主要傳播渠道。面對越來越多的 AI 生成内容,互聯網平台有何責任?
杜雙說,作爲傳播渠道的平台方,同樣受《中華人民共和國網絡安全法》《管理規定》規制,針對可能導緻公衆混淆或者誤認的深度合成技術,應當在生成或者編輯的信息内容的合理位置、區域進行顯著标識,向公衆提示深度合成情況。
目前,主流社交平台對 AI 内容采取的措施,一般是先讓用戶做出聲明,并在 AI 生成的内容旁标注類似于 " 本内容爲 AI 生成 " 标識。
經濟觀察網從快手方面了解到,其在 2023 年 9 月上線了 AI 内容作者聲明功能,并要求用戶在發布人工智能生成内容時,務必添加作者聲明,避免 AI 内容在傳播過程中帶來誤解。
B 站、抖音等視頻内容平台同樣采取了類似的措施。例如,抖音在用戶服務協議中提到,用戶不得利用基于深度學習、虛拟現實等的新技術新應用制作、發布、傳播虛假新聞資訊信息。用戶在發布或傳播利用基于深度學習、生成式人工智能等新技術新應用制作的非真實音視頻信息,或其他可能導緻公衆混淆或誤認的信息内容時,應當以顯著方式予以标識。
對于未以顯著方式标識的 AI 生成内容,B 站的用戶協議還進一步提示,B 站 " 有權對相關内容和賬戶采取包括但不限于增加标識、限制、封禁等措施 "。
但經濟觀察網記者爲抖音、B 站上傳一段 AI 音視頻後發現,在不主動選擇對該音視頻作出标注的情況下,兩家平台都沒有檢測出該音視頻爲 AI 生成。
一家 AI 鑒僞公司的高管曾接觸過互聯網平台。在他看來,出于自身成本及監管力度等綜合原因,目前互聯網平台對 AI 僞造内容的管理意願還不高。