這兩天,不少人開始拿到 Adobe Firefly 的測試資格。
雖然 3 月下旬才剛剛殺入,但作爲設計界權威公司的新 AI 工具,它的生成效果也自是被寄予厚望。
這不,英偉達 AI 研究科學家Jim Fan率先給出實測:
Adobe 能否與自籌資金的 11 人團隊 MidJourney 相抗衡?
結果是——
嗯,Adobe Firefly 被吊打了……
不信你看:
Adobe Firefly 大戰 MidJourney
Jim Fan 一共測試了 8 輪。
第一輪:
死侍在英國一所公寓大樓外的汽車頂部擺出廣角姿勢。
來看兩者的生成結果,左邊是 Firefly,右邊 MidJourney(下同):
啊這,Firefly 你确定左邊這個是蜘蛛俠,而不是真 · 豬豬俠?
第二輪:
一張照片捕捉到超級馬裏奧在昏暗的街道上擺 pose,在地上的水坑裏有一個大倒影,空氣中有輕微的薄霧,你知道某些事情即将發生,人們對此充滿期待。這就像好萊塢電影中的場景,高産值,拟人化的鏡頭。
結果:
超級馬裏奧的形象就不說了,感覺 Firefly 在背景和氛圍感的刻畫上也遜色一番。
第三輪:
和第二輪的提示詞一模一樣,不過把超級馬裏奧換成皮卡丘。
除去皮卡丘形象不說,還是 MidJourney 更能抓住氛圍,Firefly 這次連昏暗的街道都表現得不到位。
第四輪:
不整 IP 形象了,這輪看看誰更擅長人物攝影。
富士膠片拍攝的這張現代街頭風格的照片捕捉到了東京一個憂郁的早晨,一大群通勤者在街上行走。
人群中注意力集中的面孔穿着日本街頭服飾和商務裝的混搭,但吸引你注意力的是穿紅色衣服的女人。
日出的溫暖光芒在薄霧中綻放,而銳利的陽光和精心的構圖強調了人群的情緒和紅衣女子的優雅。
完全兩種不同的呈現方式,但 Firefly 實在實在是有點失真了。
第五輪:
這輪再整點科幻的。
抽象分形藝術作品,由數百萬個三維異形塊組成的圓形馬賽克城市建築,城市位于太空中,背景可以看到木星,就像從宇宙飛船上看到的那樣。
感覺 Firefly 對 " 圓形 " 的理解過于表面,顯然也不懂什麽是 " 像從宇宙飛船上看到的那樣 "。
第六輪:
現在來生成一些手機應用程序的圖标設計,Firefly 知道這是什麽嗎?
應用程序圖标設計:iOS,科幻星球景觀,skeomorphic 風格;視覺技巧:使用淺景深、高曝光度、柔焦來強調美;設備:采用高分辨率相機拍攝;編輯:通過顔色校正和銳化增強;平台:Dribble、Behance
顯然它還不知道。
第七輪:
報刊 / 電視台 / 新聞風格的照片,中全景,afga vista 劇照,一位留着白色辮子的牙買加年輕女子站在沙漠中,身穿複古亮片 Gucci 白色禮服。
這輪主要是看一下 AI 最不擅長的手部生成。
乍看一眼,兩個都還行,但稍微瞧瞧就會發現 Firefly 給了個男扮女裝的形象,手部廢了,背景相比 MidJourney 還是輸了一截。不過兩者這個 " 白色辮子 " 的呈現就大哥不說二哥了。
最後一輪:
Seealpsee 湖旁蒲公英中的紅色法拉利 F40,用 Fujifilm Velvia 50 拍攝,高細節,高對比度 4k
乍一看也都還行,但細看 Firefly 的背景還是假,不過 Firefly 說畫蒲公英就隻畫蒲公英,MidJourney 反而畫蛇添足給了一些其它花種,略微偏離題意。
測試就是這些,總體看下來,Firefly 确實完敗,有種小學生 VS 大學生的趕腳,也有網友認爲 Firefly 的水平也就算 MidJourney 的 V1 版本。
不過如 Jim Fan 所說,這種情況情有可原,畢竟:
(1)這些提示語已經在 MidJourney 中進行了大量優化,直接和剛 " 出道 " 的 Firefly 來比不是很公平。
不過 Jim Fan 也試了一些 " 變體 ",但仍然無法獲得更好的結果,也可能是和他寫的提示詞不是很好有關,上面這些測試的提示語基本來自網友。
(2)最重要的一點,Firefly 宣稱它僅在 Adobe Stock 和完全許可的圖像上接受過訓練。
這點是很大的劣勢,但對于必須确保輸出圖像版權的使用者來說卻是一個重要的優勢。因爲這些人很可能更願意爲了合法性而犧牲質量。
針對這個話題,Jim Fan 進一步發表觀點:
恕我直言,從長遠來看,MidJourney 的策略(幾乎不關注藝術家和版權)和 Adobe 的策略(爲了保護知識産權削弱訓練)都不是最優的。
也有一些還不錯的作品
事實上,随便在網上搜一搜,還是能看到 Firefly 在沒有如此對比之下生成的一些還不錯的作品。
算是挽回一些局面。
比如這個:
走在鵝卵石路上的阿爾巴尼亞老婦人。
這個:
以及用它添加的動畫效果:
能感覺到,Firefly 不擅長寫實,這種卡通 / 手繪等效果還是可以。
Midjourney 更新:能以圖生文了
強大的 Midjourney 仍在繼續叠代。
官方最新發布一個命令:/describe,可以用 4 種文字結果來描述一張圖片。
網友紛紛表示:我們可以用它給的描述來研究怎麽更好的寫提示詞了。
不過,直接用它給出的描述再生成圖,會跟原圖有些差别,比如設計美學博主 @Simon_ 阿文嘗試的這個 " 地鐵老人看手機 " 梗圖:
但很快就有網友給出解決方案:
除了手動再修改提示詞,在二次生成時将原圖也喂給 Midjourney 就會基本差别不大了。
參考鏈接:
[ 1 ] https://twitter.com/DrJimFan/status/1642967379939573761
[ 2 ] https://twitter.com/midjourney/status/1643053450501169157
[ 3 ] https://weibo.com/1757693565/MAuOMcoUO?pagetype=homefeed