前幾天,AI 繪畫工具 Midjourney 推出了 V6 版本,随後一如既往地赢得了巨大的盛贊。
V6 模型的最大亮點,在于它對畫面真實性的理解更加透徹了,無論是在細節的處理上,還是對于提示詞的敏感,相比 V5.2 都有着前所未有的提升。
但在另一方面,随着被使用規模的增加,越來越多的人發現,Midjourney V6 之所以能夠拿出極其逼真的圖畫,可能是因爲它的訓練來源已經深入到了影視作品的每一幀上,而且并不掩飾生圖時的一緻性。
有很多用戶已經發現了拟合度非常高的案例,比如下面這組對比,左邊是 " 複仇者聯盟 " 的電影截圖,右邊是 Midjourney V6 的出圖:
來自 X 友 Reid Southen
以及和 2019 年上映的電影 " 小醜 " 劇照的這個對比:
來自 X 友 Min Choi
這再次觸及到 AI 繪畫的模糊風險:在被指控拿版權内容進行訓練這件事情上,通常隻能自證而非他證,AI 公司 " 打馬虎眼 " 的空間相當充裕,AI 學習人類藝術是否是一項權利,也可以作爲讨論議題拖延太久。
但是,重繪是一碼事,疊圖又是另一碼事了,當你的産出裏已經出現了高度拷貝原始圖像的圖畫,由此引起的法律訴訟隻會迎來爆炸式的增長。
事實上,我自己測試的結果,也能發現在那些具有高知名度,且影視素材流傳極廣的動畫作品上,Midjourney V6 的還原度,确實非常驚人:
火影忍者
瑞克和莫蒂
進擊的巨人
馴龍高手
龍珠
海賊王
小黃人
蜘蛛俠:平行宇宙
樂高蝙蝠俠
這些圖片都出自 Midjourney V6,Prompt 是很簡單的一句 [ scene form xxx — ar 16:9 — style raw ] ,很顯然,如果不事先說明的話,将這些畫面僞裝成對應動畫的截圖,大概不會有多少人能夠分辨出來。
當然,也有一些失敗嘗試,我的分析是,有些動畫作品可能在知名度上是有的,但它的網絡資源或是素材并沒有那麽豐富,或是樣本被污染比較嚴重,導緻 Midjourney V6 在訓練時的容易走偏,所以複現效果就會變差不少:
灌籃高手
穿靴子的貓
貓和老鼠
總之就還挺迷的,作爲 AI 的使用者,當然希望獲得更加強大的産品能力,可是如果 AI 公司不能建立一個公允且可持續的商業模式,最後也可能會爲行業遭緻災禍。
也不能完全說 AI 的拟合行爲是不可容忍的,畢竟從 Prompt 來看,如果你指明讓 AI 還原一部影視作品,它要是沒做到這樣的程度,反而會是某種意義上的失職,隻是在一個非開源的、商業化的産品生态裏,風險是有集中性的。
雖說給猴子一台不會壞的打印機和無限的時間,它終有一日能夠打出 " 哈姆雷特 " 的全集出來,但無論是藝術還是科學,都不會膜拜這隻猴子。