以假亂真的 AI 生成式圖片,AI 自己分辨不出來了。
這張馬斯克和機器人女友的照片,5 個鑒别器裏有 2 個都覺得是真的:
還有這張人類和 3 米巨人的合照,居然 5 個鑒别器一緻判斷爲真:
啊這,AI 鑒别器似乎不太靠譜的亞子。
這就是《紐約時報》最近做的一項測試,他們找來了市面上五個常見的 AI 鑒别器,分别喂給它們 100 多張照片做測試。
結果發現,AI 鑒别器不僅會把 AI 照片錯認成真的,也會把真實照片劃定爲 AI 生成的。
而且不同鑒别器之間的水平差距也不小。
具體表現如何?一起來看
加點顆粒(Grain)就能騙過鑒别器
在這項測試中一共使用了 5 個 AI 鑒别器,分别是:
Umm-maybe
Illuminarty
A.I or Not
Hive
Sensity
測試的内容包括 AI 和人類創作的圖片,分别喂給每個鑒别器,看它們會怎樣判斷。
使用的 AI 創作工具包括 Midjourney、Stable Diffusion、Dall-e 等。
《紐約時報》主要展示了這樣幾個例子。包含 5 張 AI 創作的圖片,以及 2 張真人拍的照片。
從統計結果來看,五個鑒别器中隻有Hive全部判斷正确。
Umm-maybe 的表現最差,隻判斷對了兩張圖。
舉例來看,這張照片是 AI 生成的,聽說還在 2 月的一場攝影比賽中拿下大獎,這道題就難倒了大部分鑒别器。
但這張純 AI 生成的照片,就沒有逃過大部分鑒别器的法眼。
對于人類創作的照片,AI 鑒别器的正确率比較高,兩張照片都隻有 Umm-maybe 鑒别器判斷錯誤。
此外他們還專門測試了藝術畫,發現大部分 AI 鑒别器能判斷出這是真人畫的。
對比另一幅 AI 創作的,同樣也是四個鑒别器判斷正确。
(Umm-maybe 啊……是真的不太行)
值得一提的是,如果對 AI 圖像進行一些加工處理,AI 鑒别器會失效。
比如這張 Nike 男的照片,一開始有 4 個鑒别器判斷它是 AI 生成的。
但如果給圖片加一些顆粒,AI 鑒别器就會将這張圖片的 AI 含量從 99%,判斷爲僅有 3.3%。
最後,我們也測試了一些能上手實測的鑒别器(Umm-maybe、Illuminarty、A.I or Not)。
結果顯示,對于 " 馬斯克在蘇聯 " 這張圖,Umm-maybe 覺得它有 85% 的概率是人類創作的。
Illuminarty 覺得它是 AI 創作的概率僅有 5.4%。
隻有 A.I or Not 确定了它是 AI 生成的。
AI 鑒别的判斷标準是啥?
那麽 AI 到底是怎麽鑒别真僞的?
普遍來說,它們和人類的判斷标準不太一樣,人類一般以圖像内容的合理性爲依據,而 AI 更多是從圖像的參數入手,比如像素的排列方式、清晰度、對比度等。
所以這就解釋了開頭那張巨人照片,爲啥所有鑒别器都覺得很真。
在 AI 畫畫大火一年多以後,如今市面上已經出現了非常多鑒别器。
有的就是直接放在 Hugging Face 上供大家免費使用,有的則是已經成立公司,隻提供 API 接口形式。
比如 Hive 就是一家提供商業解決方案的公司,從如上的測試結果可以看到,Hive 的表現效果也是最好的,幾乎都能判斷正确。
而在這之前他們的主要業務是爲平台網站提供數據審核服務,圖像視頻文字都支持,服務的平台有 Reddit、Quora 等。
參考鏈接:
https://www.nytimes.com/interactive/2023/06/28/technology/ai-detection-midjourney-stable-diffusion-dalle.html