【【【前言:AMD 顯卡也能吃上 AI 繪圖的紅利嗎】】】
衆所周知,随着 AIGC 相關技術最近這一兩年快速成熟,也使得 AI 繪圖早已經不再僅僅是部分 PC 發燒友或 AI 愛好者的 " 玩具 "。
例如在一些遊戲裏,現在已經可以看到 AI 繪制的角色或是 AI 設計的服裝,它們正在變得越來越精緻,同時也受到了許多玩家的好評。此外在一些工業産品上," 由 AI 參與設計 " 也成爲了最新的營銷噱頭。與人類設計師相比,AI 的 " 思路 " 有時會顯得格外天馬行空,爲産品注入顯眼的亮點。
除此之外,在電商、外貿等領域,通過 AI 來繪制産品宣傳圖也成爲了時下最新的熱門話題。由于與人類畫師相比,AI 圖像生成程序 " 任勞任怨 ",還支持反複不斷地修改方案,因此在綜合成本上也有着顯著的優勢。
話雖如此,但隻要用過 AI 繪圖工具的朋友可能都知道,以 Stable Diffusion 爲代表的繪圖工具在易用性方面,普遍還存在着一些短闆。其中最爲突出的一點,就在于它們之中的很多版本,依賴的都是特定品牌顯卡的特定私有 AI 體系。如此一來,這就導緻相關顯卡遭遇了一波又一波的炒作,不僅價格居高不下,甚至最近還出現了疑似部分型号遭遇禁售的傳言。
說實在的,這些對于大型企業、設計工作室來說都不是什麽問題,因爲他們完全消費得起更專業、同時也更昂貴的 AI 加速卡,而且也熟稔 Linux 系統下更高效的種種 AI 繪圖工具。
但如果是一般的個人用戶呢,或者是對于諸如網店店主、小型遊戲開發者這類,對于 AI 繪圖有需求,但财力又相對有限的用戶來說,難道就真的沒有辦法以更低的價格和技術門檻,來吃上這一輪 "AI" 紅利了嗎?
_ueditor_page_break_tag_
【【【幸好微軟和 AMD 聯手,給出了解決方案】】】
辦法當然是有的,就以大家熟悉的 Stable Diffusion 來說,它本身就具備 Windows 客戶端版本,因此并不需要非得使用 Linux 或者更專業的操作系統。
其次,此前主流 Stable Diffusion 版本所使用的 Pytorch 指令,對于 AMD GPU" 天生 " 缺乏優化,這是造成 A 卡運行 AI 繪圖效果不佳的最核心原因。但現在借助 Microsoft Olive 工具,Pytorch 指令會被實時轉換爲 ONNX,然後便可以通過 AMD GPU 自帶的 DirectML 加速功能進行加速,大幅提升 "AI 繪圖 " 的效率。
在此基礎上,自今年 7 月底更新的驅動版本(23.7.2)之後,如今 AMD GPU 已經實現了對 Microsoft Olive 的原生支持。因此如今隻需要在 Windows 系統下,配置一套啓用了 Microsft Olive、支持 DirectML 加速的 Stable Diffusion,就可以很簡單地享受到由 A 卡帶來的 AI 繪圖體驗,再沒有過多的成本和技術門檻了。
_ueditor_page_break_tag_
【【【測試平台:銳龍 9+ 高頻内存,三款顯卡同時參測】】】
前面說了這麽多,那麽 A 卡 +Windows 系統如今在 Stable Diffusion 的 AI 繪圖場景下,性能表現到底如何呢?
爲了探究這個問題,我們三易生活基于一套由銳龍 9-7950X 處理器,搭配 32GB DDR5-6400 内存,并使用最新版 Windows 11 專業工作站版的測試平台。
需要注意的是,AMD 的銳龍 7000 系列平台在剛上市那陣子,對于超過 6000MHz 的 DDR5 内存兼容性并不太好,直到前段時間通過 BIOS 更新,才 " 解鎖 " 了明顯好得多的内存兼容性。所以如果也想與我們一樣,在如今的 AMD 平台上使用高頻 DDR5 内存,建議先将主闆 BIOS 更新到最新版本才更爲穩妥。
在測試顯卡方面,爲了更廣泛地覆蓋盡可能多的用戶群體,我們選擇了三款,分别是 Radeon RX 7900XTX、RX 7900XT 和 RX 7700XT。
其中,RX7900XTX 我們此次使用了不僅具備完整的 96 CU 單元、192 AI 加速器和 24GB 顯存配置,同時默認頻率也比公版更高、達到了 2565MHz 的版本。
相比之下,RX7900XT 和 RX7700XT 我們使用的也是具備出廠超頻設計,并配備了比公版方案體量大得多的三風扇 + 多熱管散熱設計的版本。其中尤其是兩款 7900 系列顯卡的三槽散熱器設計,無論拿在手裏的 " 分量 "、還是裝在機箱裏的視覺效果,也都相當驚人。
當然,從經驗來說,短期内的 AI 繪圖并不會對顯卡造成像遊戲那麽大的性能壓力,但誰又不希望自家顯卡可以在 " 煉丹 " 時更安靜、更涼快一點呢?
_ueditor_page_break_tag_
【【【測試結果:DirectML 顯神威,A 卡 " 煉丹 " 大加速】】】
值得一提的是,就在我們進行測試的這段時間,原版 Stable Diffusion 使用時所需訪問的大模型網站正好陷入長期的連接困難之中,這确實一度給測試帶來了不小的困擾。
好在經過一番摸索後我們發現,其實現在國内已經有愛好者制作出了更加本地化,配置起來也更容易的 Stable Diffusion WebUI 方案。而且其同樣擁有 DirectML 版本,可以使用 AMD 顯卡進行 AI 加速。
針對此次繪圖測試,我們使用了以下參數:
生成關鍵詞:
dynamic pose, dynamic angle, ( masterpiece:1. 4, best quality ) , unity 8k wallpaper, ultra detailed, beautiful and aesthetic, perfect lighting,detailed background, realistic
去除關鍵詞:
EasyNegative,nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, bad feet, text,logo
分辨率設置:512 × 512
采樣步進:20
提示詞引導系數:7
生成數量:15-1,1-1
RX7700XT 生成 15 張圖片,總用時 115.8 秒、平均每張圖片耗時 7.72 秒
RX7900XT 生成 15 張圖片,總用時 77.8 秒、平均每張圖片耗時 5.19 秒
RX7900XTX 生成 15 張圖片,總用時 67.7 秒、平均每張圖片耗時 4.51 秒
可以看出,一方面有了 DirectML 加速途徑,如今 AMD 顯卡在 AI 繪圖的效能上已經不低。尤其是對于 RX7900 系列顯卡來說,大顯存加上更多的 AI 單元加持,使得其明顯具備更高的生成速度。
根據上面的測試結果我們将三款顯卡的平均每張圖片耗時成績彙總成了上面這張柱狀圖,可以看到 RX7900XTX 雖然有着明顯更快的速度,但相較之下,RX7900XT 與其僅 15% 的性能差異,顯然沒有價格方面那麽明顯。對于要求沒有那麽高的朋友來說,即便是與 RX7900XTX 在性能方面有着 71.2% 差距的 RX7700XT,兩者近一倍的價格差,無疑也使得 RX7700XT 有着不錯的性價比。
針對這一點,我們也出于好奇心進行了一次連續生成 100 張圖片的追加測試。可以看到,RX7900XTX 應對自如,僅用時 450.8 秒就完成了全部任務,平均每張圖片的生成速度完全沒有變慢,依然維持在 4.51 秒一張的效率上。
_ueditor_page_break_tag_
【【【總結:AI 繪圖現在已經有了更具性價比的選擇】】】
說實在的,由于過去很長一段時間生成式 AI 繪圖工具對于 AMD 顯卡的支持力度确實不算太好,這造成了大量有需求的用戶不得不額外去購買昂貴顯卡的局面,客觀上給消費者帶來了更多的開銷,也在一定程度上阻礙了生成式 AI 繪圖本身的技術發展速度。
好在随着 AMD 和微軟聯合優化的 Microsoft Olive 工具,以及由此衍生的 DirectML 版本 Stable Diffusion 發行版誕生,A 卡用戶們終于不需要再羨慕他人的 " 煉丹 " 效率,也不再需要配置繁瑣的 Linux 和 RCOM 環境,直接就能在 Windows 系統下像其他顯卡一樣,方便地使用 AI 繪圖工具了。
很顯然,無論是對于喜歡 " 折騰 " 的技術愛好者,還是對有這方面需求的商業用戶來說,這都意味着 "AI 繪圖 " 背後的硬件性價比的再次攀升。其中特别是對于 "AI 繪圖 " 有着強烈需求的商業用戶來說,新的繪圖工具就意味着部署的硬件和軟件成本都大幅降低,這也将進一步解放 "AI 繪圖 " 在實際商用場景中的可能性。
比如電商運營者現在便不再需要依賴畫師、廣告公司,來進行産品宣傳所需的美術設計,而是可以嘗試基于 AI 技術來生成産品宣傳圖。這不僅能夠大幅節約成本和時間,而且即便對效果不滿意,也可以無限次重來,直到獲得合适的設計爲止。毫無疑問,這将會大幅促進電商行業的降本增效,并爲生成式 AI 技術的發展注入了更多的現實需求動力。
與此同時,随着 "A 卡煉丹 " 效率的解封,相信這也将促進生成式 AI 繪圖技術迎來更好、更快的發展。
當然從另外一個角度來說,它會不會因此使得顯卡的價格因此變得更加合理一些呢?