近期網上出現了很多名人說外語的視頻,比如郭德綱、趙本山說英文段子,黴黴、特朗普說中文,這背後其實一個叫 Heygen 的人工智能服務在支持。筆者登錄了 Heygen 的網站,發現其并不向國内用戶開放,服務付費渠道裏沒有微信和支付寶,而實際上 Heygen 的創始人是兩位華人,都畢業于同濟大學。今天就來研究一下,Heygen 的人工智能服務如果
要在國内落地,需要辦理哪些手續?
Heygen 的翻譯服務過程,根據筆者的實測過程如下:用戶需要登錄 Heygen 網站,上傳一段長度在 30 秒以上的包含人聲的視頻,然後 Heygen 會翻譯視頻中的聲音内容,并生成一段視頻中的說話者說翻譯後語言的視頻
。這個神奇的地方在于,生成的視頻用的是原視頻中說話者的嗓音,并且口型也和發音匹配。
原來,HeyGen 的服務至少接入了其他三個人工智能引擎 [ i ] ,ChatGPT-4 負責翻譯視頻裏的語音、然後用 11labs 的語音克隆提取的視頻中說話者的嗓音特征,在新生成的視頻中讓說話者說出來,而 wav2lip-2 會對生成的新視頻的人的唇部做口型同步。
一、Heygen 提供的服務屬于深度合成服務
根據我國法規,HEYGEN 應屬于深度合成技術,應受到監管。《互聯網信息服務深度合成管理規定》的規定,深度合成技術,是指利用深度學習、虛拟現實等生成合成類算法制作文本、圖像、音頻、視頻、虛拟場景等網絡信息的技術。
ChatGPT-4 的翻譯視頻裏的語音,屬于生成或者編輯文本内容的技術;11labs 的語音克隆提取的視頻中說話者的嗓音特征,屬于生成或者編輯語音内容的技術;wav2lip-2 對生成的新視頻的人的唇部做口型同步,屬于生成或者編輯圖像、視頻内容中生物特征的技術。均屬于《互聯網信息服務深度合成管理規定》規定的業務場景。深度合成服務提供者有很多義務,具體包括:
1、常規的合規義務
如不得危害國家安全、社會公共利益、不得侵害他人合法權益;不得制作、傳播虛假新聞;建立健全用戶注冊、算法機制機理審核、科技倫理審查、信息發布審核、數據安全、個人信息保護、反電信網絡詐騙、應急處置等管理制度;具有安全可控的技術保障措施規定等。
2、人工智能服務義務
提供人臉、人聲等生物識别信息編輯功能的,應當提示深度合成服務使用者依法告知被編輯的個人,并取得其單獨同意;服務生成或者編輯的信息内容,應當添加标識等。
3、備案和評估手續
Heygen 如果在國内提供服務,要不要做備案和安全評估?2023 年 4 月的《生成式人工智能服務管理辦法(征求意見稿)》規定:利用生成式人工智能産品向公衆提供服務前,應當按照《具有輿論屬性或社會動員能力的互聯網信息服務安全評估規定》向國家網信部門申報安全評估,并按照《互聯網信息服務算法推薦管理規定》履行算法備案和變更、注銷備案手續。據此,Heygen 以及其接入的 ChatGPT-4、11labs、wav2lip-2 均應該做安全評估和算法備案。
但 2023 年 7 月發布的《生成式
人工智能服務管理暫行辦法》把這條改了:提供具有輿論屬性或者社會動員能力的生成式人工智能服務的,應當按照國家有關規定開展安全評估,并按照《互聯網信息服務算法推薦管理規定》履行算法備案和變更、注銷備案手續。也就是說,隻有具有輿論屬性或者社會動員能力的生成式人工智能服務才需要做安全評估和算法備案。
但就筆者的了解的實踐情況,在國内提供服務的文心一言等類似 Chatgpt 的産品都是需要安全評估和算法備案的,國内以 API 方式接入 Chatgpt 的産品基本都被叫停了,可能就是因爲其沒有做安全評估和算法備案。所以,接入 Chatgpt 的 Heygen 服務如果服務要落地,也需要做安全評估和算法備案。
我國政府對互聯網進行的監管比較嚴格,如果在中國境内向公衆提供應用深度合成技術的,要遵守的國内其他法律法規還包括《中華人民共和國網絡安全法》《互聯網信息服務管理辦法》《互聯網信息服務深度合成管理規定》、《生成式人工智能服務管理暫行辦法》、《具有輿論屬性或社會動員能力的互聯網信息服務安全評估規定》等。
二、Heygen 提供的服務涉及個人敏感
信息的出境
個人信息的數據出境分爲兩種情況,一種是數據處理者将境内的數據傳輸、儲存在中國境外;另一種是,數據處理者将境内的數據存儲在境外,但是境外的機構、組織或者個人可以訪問或調用,但必須屏蔽身份信息。如果要向國内用戶提供服務,Heygen 的服務器可以架設在國内,并限制身份信息的出境,這可以解決一部分數據出境問題。
但 Heygen 的服務需要使用者上傳視頻,視頻中直接包含可以識别身份的用戶的肖像和聲音,wav2lip-2、11labs 會對人的肖像和語音進行分析,都會提取人的特征文件,如聲紋、面部特征和唇形,這些都是生物識别特征,屬于敏感個人信息。Heygen 如果拟将從中國國内取得的敏感個人信息傳輸至境外的,也應當進行數據出境安全評估,并在申報材料中列明敏感個人信息的數量與字段。因爲其服務是面向公衆的,一旦提供,一定會達到敏感個人信息超過 1 萬人次的監管觸發點。
所以哪怕 Heygen 的服務器在國内,如果支撐其服務的 Chatgpt、wav2lip-2、11labs 的服務器都在國外的,其還是要履行敏感個人信息出境的合規義務。同時,Chatgpt 的服務目前仍屏蔽中國地區的 IP 訪問,微軟必應搜索引擎在海外嵌入了 Chatgpt 的人工智能服務,但國内也無法使用其人工智能部分。Heygen 即便想給中國用戶提供服務的,Chatgpt 的開發者 OpenAI 公司也未必會同意。從以上分析看,就目前的政策和法律環境 Heygen 想要在國内落地服務,合規方面的挑戰還是不小的。
最後說一下人身權和知識産權的侵權風險問題,由于 Heygen 提供的是面向用戶的一對一視頻翻譯轉換服務,網站并不會向公衆發布轉換後的内容,所以 Heygen 的知識産權的侵權風險較小。但用戶如果用 Heygen 将他人的講話視頻生成了翻譯後的内容發布到網上,就需要取得很多授權。
比如你傳了郭德綱的相聲視頻,就需要取得郭德綱的肖像權、聲音權的授權、相聲視頻的錄像制作者權和相聲文字内容版權授權,缺少任何一個都可能涉嫌侵權,當然,郭德綱是公衆人物,這種無傷大雅的傳播其可能未必會維權,但如果其想維權的,發布視頻者打官司肯定會輸。