圖片來源 @視覺中國
文 | 光錐智能,作者 | 盧滢西
2022 年,元宇宙、Web3.0 降溫後,AIGC 成為了創業者們淘金的又一風口。
在矽谷大廠待了 5 年的 Lucy 辭去了原來的全職工作,一頭紮進了遊戲開發的事業中,還把一款 AI 生成 3D 模型的工具帶回了國内。
" 第一款遊戲在藝術設計的過程中,我們就發現了很多涉及到複雜且重複性的工作,其實都可以用 AI 來實現。"Lucy 告訴光錐智能。
談及項目的創立初衷,Lucy 表示,最核心的一點還是看到了 AIGC 可商用的價值。" 無論是 Stable Diffusion,還是最近的 OpenAI,底層邏輯上都是因為生成效果的精度達标了,慢慢為普通的消費者所接受,所以我們就把創業提上了日程。"
從今年年初 Disco Diffusion 面世,再到 MidJourney 和 DALL-E2 的出現,短短幾個月内 AI 繪畫的叠代速度令人吃驚,特别是 Stable Diffusion 模型開源以後,徹底讓 AIGC 站上了風口浪尖。
巨頭們聞風而動,百度、騰訊、阿裡巴巴以及字節跳動等大廠都在 AIGC 領域有所投入。在創業公司層面,湧入的公司更是多達數十家。
不過,相比于大廠有成熟的産品做載體,創業公司的路走得似乎更艱難。具體來看,國内應用層的創業公司,大多都是基于 Stability AI 或是 OpenAI 這類底座廠商的模型進行二次開發,很大程度上會受制于底層模型的性能。
再來看國外的情況,從 2020 年開始,OpenAI 的商業化路徑逐漸顯露,語言模型 GPT-3 的 API 接口付費開放以後,不到一年就吸引了約 300 家公司。不久前,OpenAI 的 DALL-E2 也可以作為 API 使用,讓更多的開發者能夠基于該模型構建自己的應用程序。如今,OpenAI 估值已經超過了 200 億美元。
而 Stability AI 雖然是一家初創公司,但因為 Stable Diffusion 模型的研發,不僅能夠在消費級顯卡上實現 DALL-E2 級别的圖像生成,更重要的是,Stable Diffusion 完全免費開源,也就刺激了一大批創業公司的出現。
圖片來源于 Stability AI
在這樣的背景之下,沒有技術底座的應用層創業公司其實處境有些尴尬,特别是在 Stable Diffusion 模型開源之後湧入的這批公司。在 6pen 創始人王登科看來,Stable Diffusion 模型開源以後把文生圖的門檻降得特别低,一時間出現了上百家 AI 繪畫的公司,也就導緻了 AI 繪畫工具的泛濫以及産品的嚴重同質化。
因此,打造産品的差異化,以及尋找合适的商業化場景落地,成為這些創業公司競争的關鍵。
01 技術可商用,AIGC 爆火的關鍵
2021 年 12 月,工作室的第一款遊戲正式發行,Lucy 激動得一宿沒睡。
興奮、激動,但更感不易。
白天在科技公司上班、晚上下班回家寫遊戲,這樣的日子持續了将近兩年半。Lucy 告訴光錐智能,一開始的時候團隊隻有兩三個人,對于程序員出身的主創而言,做原型自然不在話下,但到了畫原畫、3D 建模的時候,就顯得力不從心了。
對于遊戲而言,3D 動畫效果有助于遊戲更有沉浸感,但沉浸感需要建立在每一個步驟都很貴的前提上。據了解,一個 3D 模型,需要先畫原畫,畫出來之後需要建模,步驟十分繁瑣複雜。
圖源網絡
" 每一個流程都是獨立的工種,一個獨立的遊戲開發者不太可能完成,成本太高。"Lucy 表示,當初在開發第一款遊戲的時候,十幾人的小團隊光是負責 3D 建模的成員就先後招了七八個。
那為什麼不開發一款可以用以提高遊戲開發效率的工具呢?
在 Lucy 看來,在遊戲開發過程中生成藝術資産這一環節完全可以交給 AI 去做。從前,如果想要完成一個 3D 模型,從 2D 貼圖到 3D 模型可能需要花上一周甚至更長的時間,現在隻需要不到 20 分鐘的時間就能直接生成。
而 AI 生成 3D 模型開發工具的存在,除了遊戲開發以外,任何需要生成 3D 模型資産的場景都可以使用。起初,這個工具的主要作用隻是輔助工作室内部進行遊戲開發,但産品出來以後,很多元宇宙、房地産廠商上門找到了 Lucy,詢問其能不能把工具拿給他們的産品建模。
談及項目的創立初衷,Lucy 分析道:" 最主要的原因還是 3D 遊戲越來越多,遊戲制作成本越來越高,這兩點是客觀存在的。" 據悉,3D 遊戲的市場空間巨大,每年都有 4-5 萬的 Steam 遊戲上線,而現在做一款 3A 遊戲并不比拍一部科幻電影便宜多少,甚至更貴。
與此同時,AIGC 底層技術的快速叠代,也讓 Lucy 看到了 AIGC 能夠商業化落地的希望。" 之前 AIGC 生成的東西基本都不能看,醜得奇形怪狀,要不就是畫質很模糊,根本沒辦法商用。"Lucy 感歎道。
可商用,成為了今年 AIGC 爆火的關鍵。
事實上,這一切都是有迹可循的。從今年年初 Disco Diffusion 走紅,但是存在生成速度慢、對人和物體的理解不明确等問題,到 Midjourney 和 DALL-E2 的内測,再到 Stable Diffusion 模型的開源再一次降低了 AIGC 的門檻,底層邏輯上都是因為 AIGC 的質量慢慢達到了市場要求的标準。
盜夢師 toB 産品負責人李慶功告訴光錐智能,AI 繪畫的出現讓内容創作的門檻進一步降低,既能夠賦能内容創作工具,也可以重塑内容創作行業的生産方式。" 比如說在市場營銷行業中,AIGC 的出現帶來了一種全新的營銷方式,讓消費者參與到品牌的互動當中,用 AIGC 的方式,生成有用戶個性的品牌素材。" 李慶功表示。
無論是 3D 遊戲開發,還是 AI 繪畫,技術成熟後可商用,造就了這一波 AIGC 創業浪潮中的機會。
02 産品同質化,C 端付費意願低
AIGC 是一座富礦,但行業仍然處于商業化探索的初期也是不争的事實。
在 AIGC 這片熱土上,你我皆是拓荒人。即使是像百度這樣的大廠,也無法繞開。光錐智能向百度的相關知情人士了解到,在商業化的實現上,文心一格目前已經推出付費版本,采用積分制,用戶通過消耗積分可以使用一格生成圖片,下載後允許個人使用和合法合規範圍内的商用用途。
既然 AIGC 已經走到了可商用的臨界點,并且有如此多可以落地的場景,那為什麼遲遲沒有在産業端實現爆發呢?
很多時候,一項前沿科技走出實驗室轉化為商業化産品時,往往都需要經過市場的驗證。現在擺在創業者們面前的就是無數道難題:AIGC 的價值究竟要如何實現?做 B 端還是做 C 端?如何開展商業化?
在商業模式上,光錐智能觀察了國内外幾家 AI 繪畫應用的收費情況,大多都是采取 " 一定免費次數 + 付費點數 " 的模式,比如 DALL-E2、盜夢師以及 6pen 都是免費生成一定數量的作品之後,按量進行收費,海外的獨角獸 jasper 也是依靠着訂閱費在 2021 年創造了 4000 萬美元的收入,今年預估收入為 9000 萬美元。
圖為 6pen 的點數收費規則
王登科告訴光錐智能,從今年 5 月份上線的第一天開始,6pen 就制定了通過向用戶售賣點數的收費規則," 這是最簡單也是我們認為最可持續的一種模式。" 在王登科看來,如果 Stable Diffusion 沒有開源,這樣的商業模式的确是可以賺到錢的。今年 5 月上線的 6pen,在不到半年的時間裡就累積了不少用戶,9-10 月份的收入甚至達到了幾十萬的級别。
隻是誰都沒有預料到,8 月底的時候 Stability AI 将 Stable Diffusion 模型開源了。"Stable Diffusion 的開源導緻了門檻進一步降低,一下子出現了幾百家公司,大家越來越卷,産品同質化也非常嚴重。"王登科無奈道。
在産品嚴重同質化的背景下,C 端用戶的付費意願降低,因此,單純依靠售賣點數的商業模式已經很難賺錢,需要找到産品的差異化并發掘新的商業想象空間。
在産品的差異化上,定制模型是 6pen 正在探索的一個方向。據悉,現階段大部分 AI 繪畫應用所使用的模型都是比較通用的,但如果 AI 想要完成個性化的内容創作,這時候就需要定制模型上場了。" 定制模型能夠讓用戶自己訓練模型,生成出來的結果是完全具有個人特色的。" 王登科表示。
與此同時,李慶功也向光錐智能介紹,因為用戶在盜夢師生成作品的版權歸屬于用戶個人,因此,有一些 C 端用戶将自己生成的繪畫作品拿到淘寶進行售賣,一幅作品的價格能夠賣到 300 元左右,而生成的成本隻有幾毛錢。在這樣的模式之下,AI 繪畫在 C 端的商業價值進一步被放大。
值得注意的是,表面上看,雖然現在 AIGC 有很多亟待開發的應用場景,但商業化落地遲遲無法繼續往前推進,核心原因在于,真正落地的過程中無法忽視的版權問題和生成可控性問題。
就拿這段時間最火的 AI 繪畫為例,生成的可控性差——玩過 AI 繪畫的人已經見識過了,市面上大多數 AI 繪畫應用都是基于底層的預訓練大模型進行開發的,應用層的公司想要解決生成可控性問題,底層大模型的叠代和優化很關鍵。
而版權問題自 AI 繪畫誕生以來,争議就從未停止。
像 Novel AI 這樣基于 Stable Diffusion 模型做微調的模型,它微調用的素材大多都是 D 站(日本的一個二次元網站)上的圖片,D 站上的很多二次元畫師對此意見非常大。不久前,Midjourney 的子程序 nijijourney 無視版權,大量收集個人畫師們的圖片用于訓練模型的事情也在社交媒體上鬧得沸沸揚揚。
在這樣的情況下,如果着急去商用,可能會産生很多不必要的麻煩,這也就不難理解為什麼市場暫時還不太敢用或者用不起來。
此外,産品的商業化對于創業團隊本身而言也是一種考驗。
" 項目本身比較早期,很多投資人就在擔心這一點,投資人跟我們說得最多的一句話可能就是 ' 等你的産品出來 '",Lucy 無奈地說道。
對于資本市場而言,看到方向好、團隊好的項目腦子一熱就掏錢的時代已然成為曆史,雖然這一波 AIGC 的創業熱潮來勢洶洶,但能殺出重圍還是需要真正賺錢的能力。
在商業化的道路上,大家仍然是在摸着石頭過河。
03 尋找更長期的場景
萬事開頭難,所有技術從實驗室裡走出來,都有一個被接受的過程。
而對 AIGC 來說,産品還尚未定型。正如王登科所言,單純文生圖工具的生命周期并不會長,在如此短的生命周期裡談商業價值,意義不大,更重要的是尋找更長期的場景。
對于 6pen、盜夢師這類創業公司而言,現階段可能需要花更多的心思在打磨産品、打開市場和驗證商業模式上,慢慢探索出适合自己的商業化路徑。
" 整個行業還是處于早期的階段,所以我們選擇了 B 端和 C 端同時進行,兩者能夠相互反哺、相輔相成。" 李慶功表示,無論是 B 端還是 C 端,盜夢師這幾個月的漲勢都十分驚人,營收實現了 200%-300% 的增長。
光錐智能向李慶功了解到,在推向市場的過程當中,盜夢師在每個行業都有一個 " 共創三部曲 ":第一步是在行業中找到一個關鍵角色,并為關鍵角色提供新的工具,提高生産效率;第二步是推廣到行業裡,讓所有人都用起來;第三步則是将這個行業的案例複制到其他行業裡,實現規模化。
也正如李慶功所言,AIGC 的商業化路徑上是一個不斷試錯以後,快速引爆應用場景并放大價值的過程。目前,AIGC 已經撬動了不少應用場景的潛在需求。據了解,盜夢師已經和旅遊、動漫、小說以及元宇宙等行業客戶進行了合作,有廣闊的應用場景亟待被開發。
圖片來源于盜夢師
以小說的宣發為例,過去的小說宣發是先由平台方輸出劇本的精彩片段,再聯系幾百上千個 KOL,讓 KOL 根據片段進行短視頻的制作和分發。但在 AIGC 的技術介入以後,官方可以直接輸入片段的文字描述,就可以自動将文本生成圖片,并且将圖片自動拼接,最後包括 bgm 的卡點和人聲配音的加入、字幕的加入等流程都可以做成全自動的形式。
有應用場景,有跑得通的商業模式,那麼接下來,就是要解決上文所提到的兩個棘手問題。
針對争議比較大的版權問題,目前業界尚未讨論出一套行之有效的解決方案,但光錐智能了解到,不少初創企業也正在努力做出嘗試。
據悉,6pen 正在探索和人類藝術家的一些合作模式,如果藝術家明确了作品不被使用的意願,那麼其作品就不會喂養模型;如果藝術家願意合作,那就可以把他的作品加入到模型的訓練當中,按照用戶的使用頻率進行付費。
而在生成結果的可控性方面,相比于多數初創企業隻能被動地等待諸如 Stable Diffusion 等模型的叠代,百度這樣的大廠自主性則更強。具體來看,文心一格使用了百度自研的文心 ERNIE-ViLG 2.0 作為 AI 繪畫的大模型底座,ERNIE-ViLG 2.0 采用知識增強算法和混合專家擴散模型建模,能夠進一步提高了生成效果的準确性和可控性。
圖為百度文心一格還原陸小曼版《夏日山居圖》的部分 AI 作畫過程
總結下來不難發現,在布局 AIGC 這件事上,大廠無論是技術儲備,還是産品化上都有其天然的優勢。除了百度之外,騰訊 AI Lab 有能夠通過用戶提供的關鍵詞自動生成歌詞并演唱的虛拟歌手 " 艾靈 "、能夠輔助疾病診斷的遊戲 AI" 絕悟 ",并且騰訊雲今年還在加大數字人的布局;字節跳動也催生出了爆火全網的抖音 AI 繪畫特效,一個小特效 + 流量就玩出了爆款。
因此,創業公司想要在巨頭的夾擊下生存其實并不容易,但憑借着獨特的優勢和機遇,在垂類場景中依然有可能成為新晉獨角獸。随着技術的升級、産品的成熟,AIGC 會在更多的場景中得到應用,商業價值也會不斷地被挖掘出來。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App