The following article is from 元住民 Pro Author 瑗瑗子
本文僅代表個人工作流總結 & 行業思考,較爲粗糙,并無闡述過多技術點。如有其他想法歡迎交流。
有部分科普性質文字,同專業同學可以隻看第 4 和第 5 部分。
導讀:
1. 不同 AIGC 軟件效果圖
2. 原理闡述 & 軟件選擇
3. AIGC 工業化到底是什麽
4. 舉個例子
5. 不同業務要求下 AI 能夠介入的程度,對設備及人員的要求
6. 我所看到的盈利方向
7. AI 對于我個人的影響
01
不同 AIGC 軟件效果圖
目前 AIGC 的主流軟件有 midjourney 和 stable diffition。
我用 mj 生成的産出圖:
我用 sd 生成的産出圖:
可以明顯看出,mj 的生産圖精細度更高,畫面更細膩;sd 則質量稍差一些。二者根本區别在于,sd 的底層框架是開源的,而 mj 是閉源的。
02
原理闡述 & 軟件選擇
開源的本質含義是——我可以自由的選擇這項技術的任何節點,自我改造成适應我業務的模式;所以大多數情況下,适合介入工業化的軟件都會是 sd 而不是 mj。
03
AIGC 工業化到底是什麽
與業務美術風格(畫風)一緻的前提下,AI 可以根據項目的具體需求,快速大量出圖解決需求 or 提高解決需求的效率;使人工成本降低,生産力提高。
美術要求越低越少、量越大的業務,AIGC 可用價值就越高。
具體落地的核心點隻有兩個:
1. 可以訓練出與項目畫風一緻的大模型。
2. 可以結合軟件快速完成多種多樣的個性化需求。
04
舉個例子
我個人在工作和個人創作中針對 AI 跑了很多條工作流想去節約自己的時間和提升效率,基于時間和隐私問題我就不再這裏展開講述,隻是拿出基本的思路拆解給大家舉個小例子。
某小業務的畫風來源于一名叫 rinotina 的韓國畫師,現有數字人 / 角色需求如圖。
AIGC 會如何介入?
第一步
1. 找到畫風一緻的素材圖 70-100 張左右。
2. 打 tag。
3. 測試數據分批試跑 直至找到風格最接近且穩定的 lora。(目前不太推薦 loha,乘積參數變量太大)
第二步
結合軟件快速完成多種多樣的個性化需求。
這裏我推薦我個人的兩種工作流,:一種是面對想法少時間趕的文生圖法,第二種是想法偏多的圖生圖法。同理,想法越多,設計師介入程度越高。
文生圖:
1. 将需求轉化爲關鍵詞。
2. 适當調整并輸入。
3. 選圖。
4. 我認爲這張不錯。
可以看到這張圖還存在諸多的細節問題,但已經可以基本滿足 60% 需求了。從生成到選圖,花費時間在 3h 左右。剩下的細節設計調整,就需要靠設計師手動調整,并與需求方強交接。
這套文生圖的方法流更多是做一個大方向的快速出具,給需求方更多選擇後,靠設計師自行叠代完善。不過也可以用于需求方給美術出具參考圖的環節。
圖生圖:
1. 如果需求方并沒有那麽确定自己的想法,那麽畫師前期可以多嘗試一些草圖,确認大方向。
2. 利用插件 controlnet 介入,拒絕不穩定生成。
Controlnet 集合多個處理器,如 canny 線稿檢測、openpose 姿勢檢測等,将其他圖片的内部信息檢測後可應用到自己的圖片創作中來。
将草圖導入 controlnet,讓後啓動了 hed 處理器。(我個人覺得這個處理器比較全面,所以喜歡用這個 )
3. 設計師高強度介入,反複疊圖修改。
4. 這張相對是比較想要的感覺。
這樣一張圖基本可以達到最終效果的 80%,它的設計在畫師和 AI 的不斷修正中已經基本确定,欠缺的是細節的調整和補充。這樣的工作流,更适合想法偏多、磨合更多的需求當中。
不同業務側,需求不同。
結合需求和 AI 介入程度,自行打造管線即可。例如,在某畫風确定且有大量美術素材的遊戲項目中,想利用 AI 節省美宣成本,那管線可以是:
固定角色 lora+場景 lora+畫風 lora 或畫風大模型,搭配文生圖 or 圖生圖任意工作流。
05
不同業務要求下 AI 能夠介入的程度,
對設備及人員的要求
所有業務對于 AI 介入的底層邏輯思路,其實都是一緻的。
想法越多、對于内容的确定性越強,AI 的介入程度就會變得越低。
AI 無法頂替設計師,它始終是作爲工具的輔助性存在。文娛内容向的産品,重要的從來都是内容,而内容作爲感性産物,始終需要設計師人爲感應市場和他人的訴求後,做出選擇和決定。要求越高,那麽美術皮下的内容和想法就越重要,AI 的介入程度就越低,否則反之。
買量向産品、大衆市場高叠代向産品,不管是品牌還是遊戲,AI 介入應該都是筆劃算的買賣。此類業務中,AI 沒有辦法做到 90 分,但可以達到 70 分,隻要保證模型穩定需求清晰,可以提升 20% 甚至 30% 的前期美術效率。
但在偏高品質、要求高想法的業務中,AI 對于 UI、UX、插畫、原畫、平面設計等工種來說,更多是提供局部流程上的改善,整體提升效果偏弱。
AIGC 目前對于設備的要求尚可,sd 本地部署基本需要 2080 的顯卡及以上,雲端部署對于中小業務來說是不錯的選擇。
而訓練同理,Lora 等小模型目前的開源訓練包已經非常成熟,主要是分批測試較爲花費時間成本;而對于使用者來說,sd 和 mj 的學習成本并不算很高,對于審美和需求磨合能力的要求,遠高于對技術能力的要求,基本大多數需求方裏 1 至 2 名設計師配合等比技術即可。
AI 的多應用方向:
UI、字體,都是可以被做成模型的應用方向。
06
我所看到的盈利方向
我個人認爲,想要盈利,目前缺乏的是挖掘 AI 到底能被融入到哪些需求中的洞察力,而不是單一專注于 AI 技術本身。就像我在文章開頭說過的,sd 能應用工業化是因爲它開源,但開源的技術一般都難以盈利。
sd 直接盈利很難,不過拿來封包做應用應該沒那麽難。尤其是做成妙鴨相機的甜品級應用(用戶訴求不高、量大、單一),或是 to B 的業務應用(封包管線)。
更多是通過一種将需求轉化爲可應用的能力,來達到盈利目的。
07
結尾
其實筆者作爲一名畫師,在剛接觸 AI 時是極度焦慮的,甚至認爲自己會失業,想要轉變職業走向去逃避 AI。但在一次次學習嘗試和摸索中,我發覺 AI 的出現讓畫面做精美的難度,的确比之前大大降低。同時,市場對畫面故事性、情感性、風格特殊性的要求,也會大幅度增加。
也就是說,大家對于内容的要求增加了,本質變化是,我需要在日後漫長的職業生涯裏,學會預判下一步市場會喜歡怎麽樣的美術,什麽創新尺度是觀衆可以接受的,我做的設計表達出來的内容觀衆能否第一時間感知到,這些内容是否也能引起他人共鳴……這些成了我的新職業命題。
我畫的每一張畫都不是畫,是一個内容的其中一部分。單一精美的畫面沒有用,但如果是一百張精美連在一起的畫面,伴随着一個個故事、設定、玩法、模型、動畫,就成了新内容的開始。
那内容的内核對于我來說,究竟是什麽呢?
就好像《蜘蛛俠:平行宇宙》一樣,在多個宇宙裏,蜘蛛俠可以是黑色或白色,人類或動物,畫風也會有變化……但隻要他被一個蜘蛛咬了一口,爬到高樓之上,那他就是蜘蛛俠。
我愛蜘蛛俠。
遊戲葡萄招聘内容編輯,