AIGC(AI 生成内容),這個概念在今年可以說是火得一塌糊塗。
例如 Stable Diffusion,隻要對它說一句話," 唰唰唰 " 地就能秒生成畫作。
再如最近大火的 ChatGPT,對答如流堪比人類,簡直讓網友們玩得不亦樂乎。
△左:Stable Diffusion 作畫;右:ChatGPT 作答
而就在這兩天,AIGC 賽道可謂是又雙叒叕熱鬧了一把。
因為國内一家互聯網出海巨頭公司宣布——正式入局 AIGC。
而且不同于其它玩家的單一路線,它在進軍之際,直接是覆蓋四大細分領域:AI 圖像、AI 音樂、AI 文本和 AI 編程。
例如在AI 圖像這件事上,隻需要在微信小程序裡輸入一句話便可秒生成一副作品,而且是中英混着來也 hold 得住的那種:
一隻貓咪 eating noodle。
講真,不僅是在形象方面做到了逼真,就連小貓咪自帶的那種小心謹慎且不失可愛的勁兒也刻畫了出來。
不僅如此,它還能生成其他多種風格的圖片:
(昆侖天工 - 天工巧繪 SkyPaint 作品,向左滑動查看更多)
AI 作曲就更不在話下了,直接上作品欣賞:
在AI 文本能力上,給出了一個上聯,它便可以秒懂其意給出一個對仗的下聯:
不僅如此,聊天、問答、中英互譯、内容續寫等能力也是不在話下。
再如AI 編程,在 VS Code 上隻需簡單安裝一個插件,光标處按一下 "Tab" 鍵,一整段代碼便可立即呈上:
" 互聯網出海巨頭 " 加持、一口氣又發布并開源幾大模型,這可以說是今年 AIGC 賽道值得關注的一件大事了。
這個玩家是誰?
不繞彎子,搞出如此大動作的玩家,正是昆侖萬維。
至于為什麼說 " 值得關注 ",可以總結為兩點。
第一,就是有技術積累。
昆侖萬維實則早在 2 年前便已經組建了超過 200 人的團隊着手布局 AIGC,此次推出的 " 昆侖天工 " 旗下模型包括天工巧繪 SkyPaint、天工樂府 SkyMusic、天工妙筆 SkyText、天工智碼 SkyCode,已覆蓋圖像、音樂、文本、編程等多模态内容生成能力。
除此之外,熟悉昆侖萬維的朋友都知道,它在 2008 年成立之初,其業務是以網頁遊戲為主,包括自研的《三國風雲》、《武俠風雲》、《千軍破》等等。
而後昆侖萬維選擇了一條進軍海外的道路,除了自研之外,還代理運營了《極品飛車:最高通輯 2015》、《憤怒的小鳥 2》、《皇室戰争》等衆多風靡全球的遊戲。
但說到它的逐步壯大,還要歸功于業務和戰略的轉型,也就是從單一的遊戲平台向互聯網出海企業升級。
2016 年至今,昆侖萬維的業務已經形成了海外信息分發及元宇宙平台 Opera、海外社交娛樂平台 StarX、全球移動遊戲平台 Ark Games、休閑娛樂平台閑徕互娛、投資闆塊等五大業務。
也正是在這種多元業務轉型的過程中,昆侖萬維在現今 AIGC 所涉及的技術範疇裡做到了 " 量的積累 "。
正如我們剛才提到的,昆侖天工所涵蓋的内容劍指 AIGC 四大熱門領域,即圖像、音樂、文本和編程。那麼具體到 AIGC 各細分領域,昆侖萬維所開源發布的模型又處于什麼水平?
以昆侖天工 AI 圖像能力為例,據了解,天工巧繪 SkyPaint 是一款多語言的 Stable Diffusion 分支模型。
換言之,是在保留了 Stable Diffusion 對英文文本 " 理解 " 能力的同時,增加了其對中文提示詞的輸入能力。
不僅如此,平行語料庫的量級達到了 1.5 億級别,包含經常能夠用到的中英語料,古詩詞中英語料,字幕語料,百科語料,圖片文字描述語料等語料庫的集合。
在訓練方面,則是采用了模型蒸餾方案和雙語對齊方案,在使用教師模型對學生模型蒸餾的同時輔以解碼器語言對齊任務輔助模型訓練。
在實驗性能結果上來看,也是優于目前已發布支持多語言的 AI 圖像模型:
AI 音樂方面,天工樂府 SkyMusic 是國内第一款商用級作曲 AI 模型,該模型引入全局信息約束、和弦隐式表征,和弦準确率達到 92.5%,遠超目前行業最佳 64.7%;支持中文、英文、日文、韓文、法文等 31 種語種,支持從旋律生成歌詞、文案素材生成歌詞,且支持全球多曲風。
值得一提的是,天工樂府生成的 20 首 AI 音樂已經在美國、韓國、印尼等國家及全球 180 多個音視頻平台發布。
昆侖天工在 AI 文本生成領域是基于千億量級的數據集訓練,最終構建的 140 億參數 GPT-3 生成模型天工妙筆 SkyText。
這個模型的一大特點便是涵蓋衆多細分任務,包括續寫、對話、中英翻譯、内容風格生成、推理和詩詞對聯等等。
不僅如此,從實驗性能結果上來看,也是優于目前已開源的 GPT 中文預訓練大模型:
在AI 編程領域,昆侖天工所提供的則是一款多語言開源編程大模型。
它支持目前衆多主流的編程語言,包括 Java、JavaScript、C、C++、Python、Go 和 Shell 等。
在其 " 嵌入 " 到 VS Code 中後,便可以實現代碼續寫,還是給它 " 喂 " 一句中文注釋即可的那種。
而在 AI 編程中,模型的生成通過率可以說是非常重要的性能衡量指标之一,而昆侖天工在實驗性能結果上依舊表現不俗:
由此可見,昆侖萬維在 AIGC 上的布局并不是一蹴而就的事情,而是在長期發展過程中技術積累後的一種量變。
而 " 值得關注 " 的第二點,亦是歸于昆侖萬維自身——資金實力。
畢竟搞 AIGC 這件事,單是前期研發投入便需要砸入一大筆資金,并不是小玩家就能 " 玩得動 " 的事情。
這一點,從近期披露的财務數據中便可窺知一二。
據昆侖萬維發布的 2022 年半年度業績來看,單是上半年這六個月,公司便已經實現了 22.5 億元的營業收入,整體毛利率水平進一步提高,達到 79%。
若是将時間節點拉得更長一些,随着昆侖萬維拓展多元業務,并且将人工智能技術不斷注入其中,使其各細分業務也産生了較大的變化。
例如 Opera 浏覽器,便從傳統浏覽器成功向科技驅動的信息分發與元宇宙平台轉型,由此帶來的營收變化也是肉眼可見。
單是今年上半年,Opera 實現營業收入 1.5 億美元,同比增長 34%,實現經調整後 EBITDA 2392 萬美元,同比增長 572%。
截至 2022 年第三季度,Opera News 及元宇宙等新興業務商業化能力不斷提升。其中,雲遊戲社區 GX.Games 上線遊戲突破 2000 款,Opera GX 月活躍用戶超 1800 萬,Opera 全球平均月活躍用戶達 3.21 億。
再如旗下的海外社交娛樂平台 StarX,全球注冊用戶數已超過 2.8 億,營收保持強勁增長。Ark Games 主打自研的 MMORPG 新品《聖境之塔》,目前單月最高流水收入已經突破 300 萬美元。
除此之外,昆侖萬維在投資領域也斬獲頗多。比如最近剛上市的全球最大 LGBTQ 社交平台 Grindr,背後大股東就曾經是昆侖萬維,光是這一筆投資就讓昆侖萬維的收益超過 33 億元。
而這一次開源 AIGC 模型,也是其不斷加碼科技研發投入的必然結果。
例如在 AI 圖像上,昆侖萬維所采用的便是市面上算力最高的顯卡集群 A100(80G 版本),可提供超快速的顯存帶寬,每秒超過 2 萬億字節,處理超大型模型和數據集。
AI 繪畫團隊對模型訓練時間超過了 9 萬個顯卡小時,其研發訓練所砸的成本可見一斑;不僅如此,在 AI 文本生成方面,也是通過 A100 GPU 集群訓練得到的最終模型。
據團隊透露,昆侖萬維自 2020 年開始布局 AIGC 開始,便已經投入了數千萬元的資金。
有技術積累,有資金研發,而且本身亦是互聯網出海巨頭,這便是昆侖萬維此番動作值得關注的原因了。
而從另一角度來看,昆侖萬維的入局也未嘗不是對 AIGC 賽道的一種認可。
因為有實力的玩家們,确實都在邁步于此。
火爆的 AIGC 賽道
近期 AI 圈新貴 ChatGPT 背後的 OpenAI,便是 AIGC 玩家中非常典型的一位。
ChatGPT 相當于此前 OpenAI 提出的 GPT 的 3.5 版本,問世 5 天用戶量便達到了 100 萬之多。
而更早一點的 Stable Diffusion,也是在僅發布一個月的時間内,其背後的公司便被估值到了 69 億元。
這種火爆,未來的市場規模和前景也已經有了推測:
到 2030 年,AIGC 市場規模或将超過萬億人民币。
除了二者之外,國外邁進 AIGC 領域的巨頭玩家不勝枚舉,例如谷歌、Meta、英偉達等等,均已将這個賽道視為重點。
而縱觀這些玩家的特點,除去擁有充足的研發資金外,還包括有技術、有生态、有落地場景。
反觀國内的發展,目前可以說是尚未進入真正的 AIGC 階段,這一點在量子位智庫的《AIGC/AI 生成内容産業展望報告》中有所提及。
雖然在細分賽道上出現了個别優秀的先行公司及研究機構,但目前行業尚未進入大規模驗證和體系化發展的階段。
例如在場景上來看,目前最關鍵的是内容領域需求較為飽和,且降本增效尚不夠迫切。細分來看,虛拟人行業将成為産業中短期增長的關鍵動力。玩家需要尋找容錯率較高、專業度或創意要求有限的場景。
但長期而言,AIGC 依舊需要有需求更加清晰且明确的消費落地場景,例如實時性場景(如實時互動、實時反饋類場景)和高度個性化生成場景。
再如玩家方面,國内目前的初創玩家數量較少,大部分細分賽道的初創玩家在 5 家以下,大部分為具有相關業務大廠 / 研究機構的内部探索項目。
因為市場規模短期内相對有限,且渠道和前期資源的積累需要較長時間,我們認為後期會更容易出現高行業集中度。
技術方面,除去個别布局較早的企業外,國内 AIGC 領域大規模穩定生産的能力還需進一步增強,完成從嘗鮮式做法向正式和業務化的進入各類場景的轉化。
據業内人士估計,預計 2-3 年内,各 AIGC 能力有望在成本可控的前提下,實現工業化生産。
最後是在變現方面,盡管國内的 Game AI、虛拟人、TTS、結構化文本寫作等領域已形成穩定的業務合作關系及收入關系,但行業整體的變現能力仍待進一步證明。且基本為項目制 / 長期項目制,标準化 / 平台化産品欠缺發育。
因此,種種分析下來,對于國内 AIGC 的發展現狀,我們可以認為仍舊處于一種嘗試階段,大部分情況下 AIGC 尚未進入業務場景,變現能力有待增長。
那麼接下來需要讨論的一個問題便是:昆侖萬維的入局又會帶來怎樣的改變?
從技術和研發資金等方面來看,正如我們剛才提到的,昆侖萬維是具備踏入 AIGC 門檻的資格。
而從此次開源并發布四大模型來看,昆侖萬維要做的重點更是在于推動生态的發展建設,不僅僅是純做應用那麼簡單,而是從模型層上出發掌握更多主動權。
首先是從昆侖萬維自身維度來看,其在全球平均月活躍用戶近 4 億,并且已然涉獵的多元業務覆蓋 AIGC 多個重要場景。
這樣正是符合國外巨頭玩家們 " 有生态 "、" 有落地場景 " 的特點。
不僅如此,對于國内 AIGC 現階段最為難解的變現問題,昆侖萬維也發表了它的觀點:
模型開源後不收費,但可以通過如 Mango DB 、Databricks 的方法,在商業支持、雲服務方面去收費,形成收入來源。
我們的對标公司是 Databricks、MongoDB 和正在成功的 Stability AI,這些公司在資本市場的市值也不低。
我們堅信開源的叠代速度遠遠超過閉源,終極目的是讓開源雲項目起到大廠 Saas 的補充,給中小企業、中小開發者、普通開發者更好的選擇。
那麼對于國内 AIGC 新晉巨頭玩家的這套 " 打法 ",你有什麼看法呢?
— 完 —
點這裡關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~