" 如果人類的水平達不到 80 分,就會被 AI 淘汰。"
在中國 AIGC 産業峰會現場,昆侖萬維 CEO 方漢抛出這樣一個大膽預測。
在他看來,目前 AIGC 對存量知識的理解與表達已經達到 80 分的水平,行業從業者将随之形成兩極分化的局面:
一部分人成爲上遊管理員,一部分成爲底層 AIGC 操作員,兩者的工作産量都會極大提升。
剩下的達不到 80 分的腰部從業者,大概率被淘汰。
方漢畢業于中國科學技術大學近代物理系,擁有 29 年互聯網從業經驗,從 1994 年開始參與和倡導開源運動,是國内最早的網絡安全專家,負責研發了國内市場占有率最高的網頁遊戲《三國風雲》。
2008 年 3 月,他協助周亞輝先生創立昆侖萬維,後者于 2015 年 A 股上市。
在本次大會上,他對昆侖萬維介入到類 ChatGPT 大模型開發的契機、AIGC 對内容從業者的影響、三種 AIGC 商業路徑、以及開源和預訓練大模型在其中的重要性進行了一一分享。
爲了完整體現他的思考,在不改變原意的基礎上,量子位對其演講内容進行了編輯整理。
演講要點:
AIGC 原本含義比較狹窄,主要指文本、圖像以及視頻還有音樂等人類可以消費的娛樂内容的生成。ChatGPT 的出現把 AIGC 的範疇給泛化了。
對存量知識的理解與表達,AIGC 将以低廉的成本做到 80 分的水準。
由于兩極分化,AIGC 領域的腰部工作者要麽力争上遊做頭部管理員,要不就老老實實成爲 AIGC 操作員。
在 AIGC 領域,文生圖在同一個賽道出現了三種完全不同的商業模式,互爲補充:
(1)Stability.AI 打造的開源生态;
(2)Midjourney 打造的 SaaS 或者 Model Service 生态;
(3)Adobe Firefly 打造的傳統生态工具,将所有 AIGC 功能集成到工具裏。
隻有開源模式可以滿足用戶的長尾需求;隻有開源模式才可以滿足中小企業的增長需求。
需要注意的是,我們不能隻盯着目前 AIGC 進展,認爲預訓練大模型已經突破傳統 AIGC 範疇進入 AGI 領域。實際上,各種 AIGC 工具能力仍然受到預訓練大模型限制,尤其 GPT-4 大模型出現後這個現象更加突出。
以下爲方漢演講全文:
ChatGPT 的出現把 AIGC 的範疇給泛化了
AIGC 這個名字剛提出來的時候,在美國叫生成式 AI。
國内 UGC、PGC 的概念深入人心,所以造了一個詞叫 "AIGC"。
AIGC 原本含義比較狹窄,主要指文本、圖像以及視頻還有音樂等人類可以消費的娛樂内容的生成。
ChatGPT 的出現把 AIGC 的範疇給泛化了,ChatGPT 屬于 AGI(通用人工智能)範疇。
今天我的分享更多偏向原有含義,即人類娛樂内容的生成。
首先,我簡單介紹一下昆侖萬維介入到類 ChatGPT 大模型開發的契機。
昆侖萬維 2015 年 A 股上市,當時是以網遊題材上市的,上市後在海外進行多元化發展,有浏覽器、社交産品、遊戲業務。
昆侖萬維是内容廠商,對于所有内容生成方面的科技進步都非常敏感。
早在 2020 年 6 月份 GPT-3 剛剛出現的時候,管理層和技術領導者都去進行嘗試。
當時我們判斷這是内容生成領域一個裏程碑,沒想到兩年後變成通用人工智能突破口。
也是從那時我們就已經決定要跟進這件事情,因爲我們在内容生成領域絕對不允許落後。
具體而言,昆侖萬維開始布局 AIGC 和大模型領域,與奇點智源合作開始進行大模型訓練工作。
目前爲止除了通用大模型訓練之外,昆侖萬維在音樂生成領域也處于國内和國際前沿地位。
我們的願景是推進開源 AIGC 算法和模型社區的發展壯大。
昆侖萬維作爲中國領先互聯網出海企業、技術驅動全球互聯網公司,緻力于前沿技術追蹤和研發,有相當的技術積累和人才儲備。
我們的技術團隊持續進行算法技術創新,積極推進模型算法開源以及社區發展壯大,基于全球每月平均 4 億活躍用戶以及豐富行業經驗,助力 AIGC 應用和生态的快速落地以及成長。
以下分享 AIGC 在具體商業模式落地方面的思考。
AIGC 從業者出現兩極分化
我們觀察到一個有趣的現象,對于 UGC(用戶生成内容)的平台如小紅書、知乎、抖音、快手等,用戶創造内容的門檻每降低一倍,用戶創造内容的數量就會增加十倍。
舉個例子,在手機攝像頭出現之前,人類拍攝視頻一定是靠專業的攝像機和數碼相機。
手機出現之後,攝像的門檻變低,視頻内容數量出現了大爆發。
這促成了快手和抖音的發展,進而中國 UGC 領域産生了巨大突破。
C 端工具的商業邏輯其實是社區,B 端工具的商業邏輯是功能完備性。
C 端工具用快手、抖音拍視頻,目的絕不是爲了做工具,而是讓用戶做出來内容通過社區分發,這是 C 端工具邏輯。
B 端工具的商業邏輯就像 Adobe 的 PhotoShop 全家桶、微軟 Office 全家桶,以功能完備性來獲得用戶的青睐。
可見,随着 AIGC 技術的進展,它們将對内容生産者産生巨大影響。
不得不承認,現在 AIGC 對存量知識的理解與表達還遠遠沒有到 100 分水準,但以低廉的成本做到 80 分沒有任何問題。
如果人類自己的水平也隻是 80 分,我們的工作一定會被 AIGC 替代,而 80 分以上的人将去管理 AIGC 操作員,完成曾經需要腰部作者完成的工作。
因此未來,頭部工作者産量極大提升,作爲 AIGC 操作員的底部工作者的生産能力也會得到極大提升。
很不幸,腰部工作者大概率會被淘汰。
那麽,我們要麽力争上遊做頭部工作者,要麽就老老實實當 AIGC 操作員。
隻有開源模式可以滿足用戶的長尾需求
在 AIGC 領域,文生圖在同一個賽道出現了三種完全不同的商業模式。
第一種:Stability.AI 打造的開源生态;
第二種:Midjourney 打造的 SaaS 或者 Model Service 生态;
第三種:Adobe Firefly 打造的傳統生态工具,将所有 AIGC 功能集成到工具裏。
這三種商業路徑,不止是在文生圖,在文生圖像、文生音樂還是小說創作領域都會長期存在,且三種模式互爲補充。
最終的 C 端用戶會傾向于使用 Midjourney 完成工作,如現在的電商從業者,大量使用 Midjourney 來進行電商廣告素材創作。
Adobe Firefly 則契合一些傳統的大 B 企業的需求,B 端用戶會使用 Adobe Firefly 來作爲自己的創作工具。
Stability.AI 是一種開源模式,特别适合在這個領域進行創業的廣大中小企業。
通過開源模式來進行自己的改裝與改進,來滿足長尾需求,這是另外兩個模式無法提供的功能。
開源大模型是商業閉源大模型的有力補充和替代。
大家可以把 ChatGPT 想成早期 Windows,Windows 的存在是整個電腦商業軟件的一個基石,也是絕大多數人的生産工具。
Linux 通過 30 年的努力變成 Windows 的替代,開源大模型也一定會出現。
因爲隻有開源模式可以滿足用戶的長尾需求。
還是以 Linux 爲例,全世界所有的雲廠商、大型互聯網企業都以 Linux 爲自己的服務底座。
要滿足自己的長尾需求,隻有一個選擇,就是用 Linux 進行改裝。
所以,我們也說,隻有開源模式才可以滿足中小企業的增長需求。
做一個具體的分析,Stable Diffusion 的出現比 OpenAI DALL · E 2 晚了整整 6 個月,在性能、質量上都低于 DALL · E 2 和 Midjourney,但依然有衆多用戶。
因爲它是開源的,進步速度是難以想象的快。
Stable Diffusion 催生 ControlNet、T2I-Adapter、Composer,以及 LoRA 訓練技巧。
在它上面進行二次開發的人數衆多,新特性也在不斷地湧現。
ControlNet 是目前爲止在文生圖領域唯一解決一緻性問題的途徑,極大地降低了用戶的創作成本,提高了創作的可玩性。
ControlNet 開源僅 2 周,它的 Star 數就超過了 1 萬。
與此同時,開源社區也極大地降低了用戶的使用門檻。
例如 HuggingFace 提供了大量的模型托管以及通用的模型訓練來框架 diffusers,stablediffusion-webui 開發了完善的一套 Demo 平台,Civitai 貢獻了海量風格化 LoRA 權重,整個社區也蓬勃發展起來了。
預訓練大模型能力決定 AIGC 能力上限
需要注意的是,我們不能隻盯着目前 AIGC 進展,認爲預訓練大模型已經突破傳統 AIGC 範疇進入 AGI 領域。
實際上,各種 AIGC 工具能力仍然受到預訓練大模型限制,尤其 GPT-4 大模型出現後這個現象更加突出。
AIGC 領域的企業對于大模型本身的需求仍然非常大,也是持續的。
目前,還存在這樣幾個大問題。
首先,AIGC 發展起來之後是否會導緻優質内容的稀缺?
因爲 AI 生成的内容會大量污染原創的内容。
其次,如何解決大模型底座導緻的偏見?
比如 OpenAI、ChatGPT 生成的内容就存在偏見,這個問題值得關注。
最後,版權、信息僞造問題。
Adobe Firefly 提出了一個新的模式,它訓練的所有内容與作者達成協議,通過對 model 收費給内容作者分成。
從監管到行業自律,我們可做的事情非常多,而且迫在眉睫。
關于未來 AIGC 的展望(僅指娛樂内容 AIGC)——
第一,AIGC 對整個社會最大的意義是低成本終極解決方案,這一點毋庸置疑,所有人類都有消費内容産生多巴胺的權力;
第二,AIGC 将湧現新的範式,徹底改變藝術創作生産方式;
最後,AIGC 導緻内容生成的極大發展,會使得 VR 和元宇宙變得更加可行。
謝謝大家。