在創造新機遇的同時,生成式 AI 和大模型的安全可控性和倫理問題日漸引人擔憂。但其實,早在去年 Stable Diffusion、Midjourney 等圖片生成工具風靡時,不少創作者、藝術家已然發現這類圖像生成工具,或許侵犯了自己作品的版權。
侵犯版權,或是生成式 AI 第一個被公之于衆的風險。2023 年年初,多名畫師對 Stable Diffusion 和 Midjourney 提起訴訟,認爲這些 AI 工具在訓練時使用的原始素材,包括畫師未授權的作品,構成侵權行爲。在企業端,etty Images 起訴 Stable Diffusion 和 Midjourney,認爲 AI 生成算法使用了該平台提供的上百萬張高質量照片,涉嫌侵權。
目前圖像的版權是否被 AI 侵犯,在法律層面依然争論不休。但眼下,科技界已有團隊推出産品,希望從技術角度,幫助創作者保障自身權益。
36 氪日前接觸到的 Mist,就是一款緻力于保護版權的圖像預處理産品。據介紹,Mist 的三位創始團隊成員分别是即将赴南加州大學攻讀計算機博士的梁楚盟、上海交通大學計算機碩士在讀的吳曉宇和紐約大學法學碩士在讀的薛伊銘。2022 年 10 月,他們發現生成式 AI 和版權保護之間存在不少沖突。于是,兼具法律和 IT 背景的三人便決定嘗試打造一款能解決這一問題的産品。
概要總結,Mist 的主要作用是在創作者的圖片作品中加上 " 噪聲 ",讓圖像生成模型在使用這些素材時被 " 噪聲 " 所幹擾,從而難以生成和創作者原圖風格相似的新圖片。
Mist 團隊表示,這款産品主要受水印思路的啓發,通過在圖像中注入對抗攻擊信息——也就是 " 噪聲 ",讓圖像生成工具的算法難以辨認原始圖片的特點,自然也難以生成和原圖風格類似的圖片。
舉個例子,用來被生成式 AI 學習的原圖可能是一隻貓的畫像,而被 Mist 處理過、加入了噪聲的原圖,可以讓圖像生成算法将貓錯認成與之相似但不同的老虎或其他物體,并最終生成一張與貓無關的圖片——對擁有貓圖版權的創作者來說,這樣做避免了自己的作品被拿去免費生成類似圖像。
産品效果示例
Mist 團隊向 36 氪介紹,對抗攻擊的背後,主要是損失函數在發揮作用。
一個常識是,以神經網絡爲基礎的 AI 均通過優化降低損失函數(loss function)來進行訓練。損失函數是表示神經網絡性能的指标,也就是表明當前的神經網絡對監督數據還存在多大程度上的不拟合、不一緻。有資料顯示,常見的損失函數有均方誤差和交叉熵誤差。簡單總結,一般損失函數越小,意味着神經網絡的輸出結果越達預期。
Mist 團隊表示,神經網絡中的 Loss 函數同樣也能用來做其他的事情。損失函數可以表示成 L=L ( x, θ ) 的形式。它既和神經網絡的參數有關,又和輸入(圖像)有關。若固定一個訓練好的神經網絡參數 θ,以增大 Loss 函數爲目标,在一定像素範圍内改變輸入的圖片 x ,使其變爲 x ′ ,就可以使得這個神經網絡在面對這個特殊的輸入 x ′時,無法輸出它本應輸出的結果。
Mist 團隊告訴 36 氪,研究者們發現,爲明顯改變神經網絡的輸出,輸入圖片需要改變的像素是很少的。這種技術被稱爲 " 對抗攻擊 "。這一技術最簡單的應用正如前文所提到的,可以通過爲圖片添加水印,讓一張貓的照片被 AI 識别爲老虎。這次,Mist 團隊把這一思路用在 AI 繪畫背後的隐式擴散模型(Latent Diffusion Model)上,從而使得擴散模型無法識别加了水印的圖片,進而無法模仿原圖風格。
" 水印更多是一種工具,可以被注入各種信息。最常見的情況是給水印注入人名,而我們注入的是對抗攻擊信息。"Mist 團隊總結。另一方面,在對原圖注入信息時,Mist 也進行了一些約束,目标是讓原圖在未被生成模型使用時不要産生過大的變化,影響本身的觀感。
Mist 團隊表示,其産品中的損失函數主要包括兩個維度,一個是語義,另一個是紋理。在具體場景中,語義讓模型把圖片中的 " 貓 " 辨認成噪聲或者無意義的圖案(目的是讓其失去語義),紋理則可以讓模型把 " 貓 " 生成更像 " 老虎 " 的圖片。也就是說,Mist 産品中的損失函數,希望讓模型和原圖之間語義差距越來越大,紋理則更偏向于另一張非原圖的圖片。
之所以這樣做,是因爲過往不少水印産品會因爲裁剪、拉伸等二次處理而喪失效力,Mist 則通過語義、紋理的雙重維度保障産品在多個 " 白嫖 " 場景下都能發揮效力。
産品效果對比
另外,Mist 團隊表示其産品的另一個特點是速度快。他們介紹,以芝加哥大學開發的 Glaze 爲例,即使在水印添加程序中選擇 " 最快 ",耗時也高達 20 分鍾。倘若希望生成更高質量的水印保護圖,則預估耗時達到 1 小時。對比之下,Mist 在以默認參數運行時,僅需 3 分鍾便能完成一張圖片的處理。至于原理,Mist 團隊表示生成速度和算法本身的設計相關,Mist 的算法設計比較高效,可以減少訪問生成式模型的次數。
當前,和 Mist 技術原理相關的 paper 已被 icml2023 作爲 oral paper 接收。Mist 目前免費提供給有需要的用戶,不過,創始團隊已搭建起一個 200 餘人的社區,成員包括技術從業者、創作者等。" 社區成員可以幫助我們更快地叠代産品。"Mist 團隊表示。之後,Mist 團隊希望利用社區的力量,結合自身的技術能力,進一步提升産品的魯棒性、生成速度等。