【新智元導讀】Midjourney 大神的超深度測評來了!V6 比起 V5.2 究竟有哪些改進?來感受一下吧。
最近,國外的一位名叫 Andrei Kovalev 的大神網友,做出了一份 Midjourney V6 的超深度評測。
指南很專業,V6 和 V5.2 有什麽不同,很直觀地就能看出來。
下面,就讓我們來跟随大神的腳步,深入感受一下 Midjourney V6 的性能有多強吧。
V6 模型,究竟比 V5.2 強在哪
在以往,當我們看一張 AI 生圖時,可能馬上就會感覺到這是 AI 畫的。
但在 Midjourney V6 中,你很少會有這樣的感覺。
在這一部分中,Kovalev 介紹了 V6 的優勢、劣勢,以及和 V5.2 相比的主要變化。
Tim Walker 的高級時裝正面肖像,清澈的白色空靈機器人,半透明的皮膚淹沒在電線的海洋中。紅色和青色色調,發光的高光,深色陰影
V6
V5.2
Kovalev 發現,V6 有以下升級(因爲當前還處于 Alpha 測試,以後還會發生變化)。
在遵循提示時更準确了,并且使用更長的提示時,效果會更好。 新模型的一緻性大大增強了。 V6 改進了圖像提示功能。 現在 V6 有了兩個新的升頻器,具有微妙和創意模式(都将分辨率提高了兩倍)。 有一個「unopinionated」的 --style raw 模式(類似于 V5.2)。 此外,還可以在圖像中添加文本了。
所以,V6 究竟變成了什麽樣子?
超現實主義
以往每次的 Midjourney 升級,都會提升照片的真實感,V6 也不例外。
最能定義 V6 的關鍵詞,恐怕就是超現實主義。
川内凜子的少女太空飛行員攝影肖像
V6
V5.2
總而言之,V6 的逼真度爆表,上升到了一個新台階,尤其是在攝影風格上,已經到了讓人迷惑的程度。
Kourtney Roy 的老海員攝影肖像
V6
而 Midjourney V6 中逼真圖像功能之所以如此驚人,恰恰是因爲存在缺陷:鏡頭像差、故意過度突出的區域、意外的失焦元素以及各種膠片效果。
Mitsuo Katsui 拍攝的初音未來照片 --stylize 175
當然,V6 不止是人像畫得好。
第比利斯的延時攝影 --stylize 175
而且,在某些情況下需要更微妙的外觀和感覺,這時 V6 的超現實主義就顯得有些尖銳,顯得有些矯枉過正。
Ara Guler 對 1970 年代伊斯坦布爾賭場賭徒的肖像
V6
V5.2
細節很瘋狂
每次在 Midjourney 的下一個模型發布之前,許多人都會屏住呼吸,想看看他們會如何處理細節。
V6 中的細節,很瘋狂。而新的 upscalers 功能,則讓細節更進一步。
Ivan Bilibin 的畫作,描繪騎着白狼的冬季領主
V6
V5.2
不過,雖然圖像的複雜性随着每個新模型的出現而穩步上升,但在此過程中,卻丢失了一些東西,比如紋理。
比如,V4 的精細程度在 V5+ 中提高了十倍,因此幾乎不可能實現膠片顆粒或真實筆觸這類效果。
雖然離真正的顆粒感似乎仍然遙不可及,但 V6 顯然朝着以前失去的原始性,邁出了明确的一步。
它的紋理令人驚歎,比起 V5 來大放異彩(在 V5 中,需要選擇「non-refined」的視覺風格)。
Marianna Rothen 的夢幻女孩
V6
V5.2
另一個能很好地描述 V6 的概念,是非常規組合(unconventional composition),這導緻了 V5.2 中結構化和平衡方法的重大轉變。
以前的模型追求幾何完美、黃金比例和中心主體,而 V6 追求不對稱,經常将主體從畫面中間移開。
Tyrus Wong 的跨維度神秘野獸
V6
V5
這可能會提供更具動态性和吸引力的視覺效果,但也需要相應地調整提示。即使是很小的調整,也可以恢複中心構圖和對稱性。
可變性增強
可以看到,在 V6 中,同一提示結果的可變性增強了。
與早期模型相比,單個提示的四個變體,通常顯示出更明顯的差異。
Jessie Willcox Smith 的《銀術士》
V6
V5.2
許多情況下,這會産生一種更具創意、更有趣,有時甚至更忠實于現實生活中原型的多樣性的藝術風格表現。
藝術風格
在提示中,我們可以引用「Style modifiers」的名稱,召喚圖像的特定視覺風格、技術、流派、主題或上下文。
像素藝術
V6
V5.2
現在,每個新模型都更善于了解源材料,并且在輸出中重新創建它,這已經是一個傳統。
然而,Midjourney 從未停止這種戲劇性的變化。
by Jody Bergsma
V6
V5.2
無論這些風格本身多麽偉大,真正将它們從對原作的單純解釋轉變爲獨特的東西的,是我們添加的提示。
圖片中添加文本
雙手拿着報紙,标題爲「Midjourney 的文本 - 真實還是騙局?」
V6
V5.2