AIGC 熱得發燙,不跟上就會被淘汰。
這是當下創投圈最直觀的感受。
但 " 跟上 " 并不是一件容易的事:怎麽跟?朝什麽方向跟?
一不留神,就可能與風口錯過。
對初創公司而言,如今 AIGC 技術發展過快,即便從應用層出發創業,公司 PPT 也不一定能活過一次 OpenAI 技術叠代;
對投資方來說,短時間内出現的 AI 新技術和新創業方向太多,從 0 開始學習很可能與潛力股擦肩而過。
技術狂歡之下,關于國内外大模型創業差異、大模型未來發展方向和 AIGC 創新性的體現,企業和投資者們有了不一樣的思考。
爲此,量子位邀請到了元語智能聯合創始人兼 COO 朱雷、峰瑞資本投資合夥人陳石、無界 Ai 聯合創始人馬千裏和華院數智人商業化副總裁林萊尼,一起來讨論這波 AIGC 浪潮下,中國面臨的新機遇和新挑戰。
圓桌環節由量子位主編金磊主持。在不改變原意的基礎上,量子位對内容進行了編輯整理。希望能夠給你帶來更多的啓發與思考。
中國 AIGC 産業峰會是由量子位主辦的行業峰會,近 20 位産業代表與會讨論。線下參與觀衆 600+,線上收看觀衆近 300 萬,得到了包括 CCTV2、BTV 等在内的數十家媒體的廣泛報道關注。
話題要點
AIGC 讓很多人才重回 AI 賽道,長遠來看對我國科技發展非常有利。
這輪 AIGC 熱潮讓創業者感到焦慮,但更多是在焦慮中前進。
大部分 AIGC 創業公司的機會可能還是在非模型層,或是做一些垂類模型。
隻要 AI 不背叛人類,就一定會帶來社會效率和人類體驗的飛升。
成爲像 OpenAI 一樣的企業,并不意味着打造一個中國版 OpenAI。
國内 AIGC 這一波巨大的浪潮,大家都說是 "iPhone" 時刻,但其實更像是初期的 PC 互聯網時刻。
以下爲論壇對話全文:
論壇實錄 AIGC 熱潮帶來震撼、興奮和焦慮
量子位金磊:特别感謝各位參與 " 中國 AIGC 新機遇 " 圓桌論壇,如今由 ChatGPT 引爆 AIGC 大熱潮,尤其是國内已形成了一股燎原之勢。因此我們認爲站在當下的時間點上,有必要對 AIGC 的快速發展做一個總結和讨論,以應對即将到來的新機遇。
爲此,我們邀請了幾位走在業界前沿的企業嘉賓來共同探讨這一話題。
第一位是元語智能聯合創始人兼 COO 朱雷,元語智能是這一波 AIGC 熱潮的先行者。
第二位是峰瑞資本投資合夥人陳石,前沿科技一直是峰瑞資本重點投資的方向。
第三位是無界 Ai 聯合創始人馬千裏,在生成式繪畫方面,無界 Ai 同樣是國内企業中的先行者,目前 APP 上的用戶已超過 200 萬人。
最後一位是華院數智人商業化副總裁林萊尼,華院計算深耕于人工智能數智人領域,長期緻力于智能技術賦能産業。
在這場讨論中,我們圍繞每個話題設置了一個關鍵詞。第一個話題比較輕松,關鍵詞爲 "感受"。
我們想首先請各位談一下,這波 AIGC 熱潮,給您所處的行業及相關業務,帶來的最直觀感受是什麽?
元語智能朱雷:最直接的感受就是震撼和沖擊。
盡管我們一直在行業内做大模型探索和開發,會有一定的預期,但這一輪熱潮中還是有很多方面超出我們的預判。
體現明顯的一個方面是 ChatGPT 在各行各業中的接受程度和應用深度。這是人工智能發展以來非常大的一個改變。原來 AI 都是在小圈子或固定環節裏應用,這一次是真正實現了破圈,從廣度到深度,都是一個非常大的技術變革,這是我們認爲的震撼之處。
對我們所處行業來講,影響大概有兩點。
第二,人才方面。此前在國内氛圍的影響下,不少國内外人才加入 AI 浪潮,但也不免有些人對這一賽道有點失望。如今随着這波巨浪襲來,讓很多人才重新回到了 AI 的大方向之下,所以我認爲從長遠來看,這會是對我國科技行業的一個重大利好。
峰瑞資本陳石:其實我以前是寫程序的,對 AI 的技術和應用比較了解。我自己本身也經曆過之前深度學習的計算機視覺那一波 AI 浪潮,那麽這一次是做生成式 AI,以預訓練大規模語言模型爲主,GPT-4 加入了多模态的輸入輸出。這次的技術變革讓我們感到非常驚訝,因爲它是一個突然的跳躍,不是連續漸進的變化。
這背後最主要的原因在于,AI 其實已經具備了一些通用智能。微軟研究院最近有一個報告,認爲當下語言模型的發展,我們已經看到了通用人工智能的火花,而且這個火花還在不停燃燒、變大,這是讓人很驚喜的事情。
從産業角度來說,我會覺得這一輪技術浪潮和上一輪深度學習浪潮相比,也有很大的不同。上一輪的 AI 技術變革,總體上來說沒有達到預期,主要是在通用性方面比較差,最後隻在安防、人臉識别等少數應用場景有一些真正的落地實踐,投入産出是不好的。但這一輪的 AI 技術變革,技術的通用性更好,适用的場景比較寬廣,産出價值會比較大。
我認爲如果 AI 會讓人類的社會運轉效率、體驗都實現提升。而這種變化是可以看到的,它也會從本質上改變各行各業,特别是内容生産、教育、科研等,還有其他更多行業都會受到影響。
因此我們對這一輪 AIGC 浪潮感到非常興奮。這是人類的福祉,但前提是 AI 不背叛人類;這也爲各位創業者帶來了很好的機遇。
無界 Ai 馬千裏:站在創業者角度來看,這輪 AIGC 熱潮讓我更加焦慮了。
因爲它的發展速度太快了,我們去年 8 月的時候預估,在今年 2、3 月 AI 對圖片内容的影響會越來越強,變化體現在漫畫、GIF、短視頻等領域。但沒想到,一季度 Controlnet 加入進來後,誕生了非常多碾壓式的新成果。
這就會讓人時而覺得焦慮,因爲自己在做大量工作時,其他團隊可能會追趕上來。
另一方面,這種焦慮其實是全行業範圍的,甚至傳統行業的人也在焦慮。
這反而形成了一種 " 抱團取暖 ",一些 " 八竿子打不着 " 的合作對象找到我們,比如奇瑞汽車、若态潮玩、以及快消品的品牌等,他們把訴求給到我們,我們一起去做訓練,甚至還會給大量私有化數據。
要知道這些數據在一般情況下,企業是不會輕易分享出去的,但現在他們願意提供,也是在擔心如果不參與到這輪浪潮中來,就會被淘汰。
雖然有焦慮,但是更多是在焦慮中有前進的感覺,這是創業者的一種感受。
華院林萊尼:我來從數智人領域談一下感受。
數智人從過去的文本客服,升級爲語音客服,再到多模态人機交互系統的發展周期,人機交互模式正持續進化。
目前的數智人技術已經覆蓋了較多能力域,如能夠回答問題、撰寫文章、文本摘要、語言翻譯和代碼生成等任務,甚至可處理更多小衆主題;這些具備多模态交互能力的數智人在許多業務場景中已基本實現 " 聽得清、聽得懂、會表達 ",并在金融、文旅、傳媒、公共服務、醫療、零售、文娛、智能家居等越來越多的行業中商業化落地,提供坐席客服、理财顧問、播報主持、導遊導覽、虛拟偶像、虛拟歌手等輔助人工服務,已可作爲企業或個人在完成一些重複性工作時的輔助工具。
并且,我們都知道全球在醫療和教育方面仍處于嚴重的資源不足,這兩個領域存在巨大需求但缺乏足夠勞動力來滿足需求,這恰恰是數智人乃至人工智能未來的主要應用之一。
舉例來說,許多發展中國家的老百姓由于所處偏遠、基層醫療資源匮乏,就醫十分困難。
如設置一些專業醫療輔助用的數智人協助醫生完成基礎的預檢和分診工作,并爲病人提供是否需要進一步治療的建議和相關注意事項等,從而提高醫療工作效率和服務水平;在教育領域,通過 AI 賦能教育可以根據不同學生的特點因地制宜提供個性化的學習方案,培養學生學習興趣、提高教育質量等等。
所以數智人的出現既是挑戰也是機遇,我們需要保持敏銳的洞察力和前瞻性思維,積極應對它所帶來不管是正面亦或負面的影響。
中國 AIGC 創新性如何體現?
量子位金磊:讨論的第二個關鍵詞,叫做模型同質化和創新性。
就目前來看,無論是 AIGC 應用的玩法,或是背後算法模型似乎有同質化的趨勢。因此,中國 AIGC 的原創性該如何體現?
元語智能朱雷:這個問題很好,我們也一直在思考這一問題。
可以看到,大部分基礎研究、尤其是算法模型方面,很多都是國外率先誕生。再看國内目前做大模型,無論是大廠、研究機構還是初創公司,在基礎研究環節都是非常薄弱的,因此基礎研究或者原創性探索上,國内目前還有一段距離需要追趕。
但這也不是說目前國内自研大模型沒有價值,反而是非常勢在必行的。
第一,這可以推動開源數據集、模型這方面的生态構建。
比如在中文語料梳理上,通用語料質量還不夠好;還有在開源方面的氛圍也比較差,據我們了解國外有很多醫療行業的開源數據集,但國内我們已知的隻有 2 個,開源數據集的質量也不好。
因此要有更多人來做這件事,這也是我們元語智能核心團隊在 2019 年發起中文語言模型評測基準開源社區時,就在倡導的方向和理念。
第二,現在國内對大模型 AI 基礎設施的重視,已經到了相當高的量級。這時對于人才的吸引,包括很多圈外人都願意加入到這一浪潮中來,從長期角度來看,這件事對于國内做 AI 基礎設施非常有價值。
國内大模型的創新工作,大廠、初創公司都在做,各家的切入點也不同。
比如有專門做和心理咨詢相關的,比如元語智能就是在通用大模型之上,做上層專業模型。聚焦在一兩個行業裏,解決客戶的具體問題。
對于國内初創公司而言,創新性主要體現在對行業是否有足夠多、深刻的理解,以及是否能迅速在行業内把數據和場景跑起來。這就要求初創公司在模型底層數據、指令微調層面上做一定創新。
無界 Ai 馬千裏:做産品創新和擁抱 Stable Diffusion 生态并不沖突。SD 隻是幫忙從 0-1 的原型搭建,但是從底層數據、中層算法、上層應用方面還是要做從 1-100 的創新。怎麽做出這個差差異化,這是每個創業者要思考的事情。
比如我們現在開發國風模型,首先這個模型底層要有大量國風數據,比如中國人面孔、眼睛、漢服等素材,以漢服爲例,甚至具體精細區分不同時期、不同民族風格差别、漢服左右衣襟的不同代表意味都大不相同,細節見鬼神,對于關注國風的人來說細節非常重要。誰訓練出來了這種帶有豐富細節的戲份模型,誰就能具備底層的差異化。
訓練數據不是一次性的,而是實時的、自我叠代的。我們平台上每天有 200 萬用戶每天創作接近 220 萬張圖片,很多圖片都會被分享到我們的 " 廣場 " 裏面,我們會将受到關注和喜愛的作品的關鍵詞拿來做進一步訓練,使平台能力得到實時增強、這樣的話差異化就更體現出來了。這也是爲什麽我們使用開源 Stable Diffusion,但是平台作品和市面上的内容有很大區别,實時自我叠代的數據訓練成爲了創新點。
當然,除了底層數據,在訓練方法方式上也有很多創新點,比如融合 GPT 的功能,這些功能我不贅述,歡迎大家直接用無界 ai 上手體驗。
華院林萊尼:數智人作爲生成式 AI 技術的其中一種應用,本身包括了好幾個層面的内容。就如我們評價一個演員,會從 " 聲台行表 " 出發。除了外貌、聲音這些外在部分,數智人的行爲動作、文本表達、語音表達、交互方式甚至個性等都在生成範圍内。
剛剛馬總從數智人的外貌、類型和風格等方面做了解答。我這邊從數智人的内容生成做一些補充。華院計算認爲,數智人有三個層次,第一個層次是能說會動,第二個層次是真情實感,第三個層次是能思會想。
其中,第一個層次與 AIGC 技術中的音視頻生成相關,第二個層次與文本生成和跨模态生成相關,最後一個層次則是機器人能夠有自己的思考,經持續進行自主學習後,涉及策略生成等方面。爲達成第三層次的數智人,我們将 " 常識知識圖譜 " 中的社交常識加入到對話交互框架,實現數智人的情緒系統;通過建立行爲概率性知識圖譜,該圖譜涵蓋了 5000+ 種不同的行爲,實現數智人的個性化交互。
因此,最終生成的數智人,聲音外貌或有相像,但結合其形體動作、交互内容以及差異化的個性足以讓數智人具備自己情感和個性的個體,擁有獨一無二的原創性。當然,目前華院要達成這種具備多模态交互能力且有自己個性和情感的數智人還需在認知智能領域持續、深入的研究。
峰瑞資本陳石:在趨勢上看,不僅是國内,海外也是有大量偏同質化的跟進。有個統計數據顯示,2022 年平均四天出一個大模型,大概 90 多個大模型,主要是以美國爲主。
本輪生成式 AI 的核心突破還是在算法層面和模型訓練範式層面。
算法方面,大家剛剛都提到了 Transformer、Diffusion Model,是目前的主流模型,所以現在很多模型都是以他們爲底層架構來做叠代和變化的。
從熱度方面來看,我不認爲這是一個短期熱潮或泡沫,我認爲它會經曆很長時間的進步,并産生出非常大的社會價值和商業價值。業界有人說,大型語言模型是人機接口,還是新形态的操作系統。
首先,語言模型已經成爲了人機接口第一界面,以前通過菜單、圖形化的方式,人們隻能做有限選擇,但其實通過語言才是人機交互最自然和靈活的選擇。
另外從操作系統角度來看,因爲 GPT 等語言模型已經具備一定的通用智能,有點像大腦或者分發中心,它可以和人類做交互、接收、拆解和分發任務給各種外部插件應用,得到結果後再反饋給人類,所以可以認爲它也具備了操作系統的特點。
未來軟件行業也在變化,我覺得方向是以語言模型爲中樞的應用生态體系。AI 除了賦能并提升行業效率産生商業價值之外,人類還可以通過向 AI 學習,不斷提升人類自己的學習能力。
舉例來說,人類學習語言是很痛苦的,比如學外語十幾年效果可能都不是很好,但是機器學習語言的效率非常高,如果我們能夠部分打開 AI 的内部結構,找到一些其中的規律,或許人類也可以借此提升自己,和機器一起進步,這些事情就具備很大的社會價值。
因此我不認爲 AIGC 熱潮會是短期的,它是有長期社會價值和商業價值的。
大模型隻能靠 " 大力出奇迹 " 嗎?
量子位金磊:針對大模型的參數規模,還有一個問題要讨論一下,叫做 " 大力出奇迹 "。大力一定會出奇迹嗎?想先請教馬總,您覺得大力出奇迹這種方式一定是 AIGC 必經之路嗎?
無界 Ai 馬千裏:如果 AIGC 能出奇迹,不管是大力還是什麽力,都是好事情。
在一些語境中," 大力出奇迹 " 像是一件壞事情一樣,好像迫不得已的選擇,但它不見得是壞事。
我曾經看過一篇博客叫 " 苦澀的教訓 ",是強化學習之父 Richard Sutton 寫的,他認爲人類總是自作聰明地去幹預機器,教它怎麽下圍棋、讓它學習人類的棋譜,但其實最有效的方法還是自我學習,無監督學習。
一定程度上,我們人類幹預太多反而會限制它的發揮。所以本質上,雖然我們需要大量算力、算法上也要跟進,但我們不需要那麽強地去幹預它,否則效果可能會南轅北轍。
峰瑞資本陳石:大力出奇迹是必然,因爲目前這個階段的突破,就是無監督學習取得的。
無監督學習、特别是大規模無監督學習,此前一直是機器學習領域的聖杯,從來沒人取得過這個聖杯。如今 OpenAI 把它拿下來了,我覺得這是當下被驗證的一件事情,也是一個趨勢,所以估計大家還會這麽做,在算法和訓練技術方面如果沒有取得大的突破,我覺得大模型還隻能這麽訓練。
對創業公司來說,他如果是做應用層,其實可以不需要自己去訓練模型,而是在大模型基礎上做調優。所以我覺得,大部分 AIGC 創業公司的機會可能還是在應用層,或者做一些垂類模型方向。
大模型本身,我覺得未來中國可能不會有太多家、甚至全球也不會有太多家去做。但垂類模型還有一定的機會。
如何看待中國版 OpenAI
量子位金磊:接下來的關鍵詞叫做 " 中國版 OpenAI"。這波熱潮中,國内有很多大佬紛紛下場布局、廣發 AI 英雄帖,說要打造中國版 OpenAI。
所以,就中國目前大環境來看,有必要做 " 中國版 OpenAI" 嗎?可行性高嗎?
華院林萊尼:我對我們國家出現像 OpenAI 那樣基于底層算法研究、研發出劃時代創新技術或應用的公司充滿信心,尤其我看到現場有不少 Z 世代的年輕創業者,他們不僅有創新精神,也有情懷和責任感。
但成爲像 OpenAI 一樣的企業,并不意味着打造一個中國版 OpenAI,我們無需重複他人的道路,在人工智能領域," 創新 " 是非常重要的。雖然 OpenAI 打造了一個多模态大模型的底層平台,爲我們打開了生成式 AI 技術的應用大門,但從真實世界應用場景來看,多模态大模型也并非能 " 一招鮮、吃遍天 "。
舉例來說,從 GPT 的 1.17 億到 GPT-3 的 1750 億,幾年來大模型參數量增長了近 1500 倍,而 Google 的 Switch Transformer 參數量更是達到 1.6 萬億,海量參數規模所需的龐大算力,是許多企業甚至行業無法提供的。
因此,如何提高算法魯棒性、提升模型效果,通過小樣本學習、多模态學習等實現少量數據完成新領域的訓練,仍然是 AI 需要考慮的問題。
目前,我國已有不少露出小荷尖尖角的 AI 企業正在茁壯發展,雖然暫時因算力或算法上積累的經驗不足,與 OpenAI 這樣全球頂尖的 AI 公司尚有差距。但我堅信不久的未來,我們将看到屬于我們自己的 AI 代表企業及其創新技術。
元語智能朱雷:我覺得這個說法有一點以偏概全。OpenAI 所謂 " 十年磨一劍 ",是因爲它最初是以非盈利性目的成立的一家組織。最近它跟微軟合作,整體才進入閉源狀态,也有了一些商業化的模式。
但其實以商業化爲目标的技術研究,國外也有很多公司都在做,而不以商業化爲目标的技術研究,國内也有很多,比如高校、研究院、或是一些開源社區等,有一大批開發者和組織,以開源爲目的在做這樣的事情。
隻不過目前國内環境下,大家普遍隻會關注到一些有商業光環的項目,但對于那些非商業化的項目大家關注度比較低。
其實包括我們陳石總這樣的投資人也好,包括我們量子位這種媒體也好,大家可能真的要做一件事,就是推動國内開源數據集和開源模型的發展,這個可能會成爲未來的一個基石。
我認爲,國内和國外在這件事上沒有本質區别,大家都有一些考慮商業化的公司和以開源爲目的的組織。
對中國 AIGC 新機遇的期待
量子位金磊:最後一個關鍵詞,就是圓桌論壇的議題 " 中國 AIGC 新機遇 ",我們用簡短一句話來談談對它的期待。
華院林萊尼:說起這個期待,我們發現互聯網企業可能對于 35 歲 + 的人群不是很友好,所以我們也在思考一個問題,AI 真的創造了失業潮嗎?後來我覺得不是。我也是 35 歲以上的中年人了,在這裏說說我的感受。
我很喜歡一句廣告詞,就是 " 永不放棄,奔向未來 ",雖然我們已經 35 歲多了,但我們也可能會像 Transformer 用到一些機制進行自我變革一樣,永不放棄奔向未來,用積極和勇敢的心态正面來自未來的機遇和挑戰。
無界 Ai 馬千裏:我倒覺得可能是比較複雜的一種,你看最近有一個新聞,就是包括馬斯克在内,上千名科學家認爲 AIGC 還有 AI 大模型是一件危險的事情。
我覺得國内的機遇在于,即使你和國外有差距、甚至可能有幾倍差距,但對于人類來說夠用了就行,就像蘇聯和美國大戰時候,都說自己能毀滅地球多少遍,但其實毀滅一遍就夠了。可能 AIGC 産生的能力會強到,即使兩個模型之間有百分之多少的差距都無所謂,隻要它對于人類來說夠用了就行,這是一個長期的看法。
所以即使我們現在的大模型,的确可能沒有外國人那麽強,但是從邏輯上來說我們還是能趕上的。
峰瑞資本陳石:這個機遇其實是全人類的機遇,中國也有非常大的機會。當前無論是 OpenAI、谷歌、還是其他一些國外大廠,我們很多中國工程師、或者華人工程師,深度地參與了這個研發過程。我覺得,這裏面中國是有機會做成大基礎模型的,特别是大型語言模型,這是可以做的。爲什麽呢?
算法層面來說,這其實是大家共同的科研成果,從 GPT-3 的預訓練過程,到包括 ChatGPT 用到的基于人類反饋的強化學習過程,都有相關的論文詳細介紹其中的算法和實施邏輯,大部分訓練數據也是開放的。雖然細節上 OpenAI 可能有一些語焉不詳,但其實它剩下的最難的可能是一些具體的工程實施工作。我覺得在具體工程實施方面,我們中國的工程師是不怕的。
算力上,我覺得這個事情需要慢慢來,盡量地想到一些能替代的辦法,做到有自己的算力,或是通過别的方式去獲取一些算力。
數據上,我覺得我們是可以做到的,因爲數據集這個事情,它現在是 4500 億的 Token(每個約 0.7 個單詞),這個體量的數據相對而言,我們經過努力,應該也是有辦法收集和整理出來的。
我認爲,憑着中國人的聰明程度,基礎模型是可以突破的,當然複現到今天 GPT-4 這個水平可能還有差距,但也隻是時間問題。我們的應用生态一定也會基于這些國外國内的模型蓬勃發展。
其實包括微信、釘釘或是其他當年的手機上的應用生态,我們已經一再證明,中國在軟件的應用上是很厲害的,所以我覺得這個是中國的新機遇。
元語智能朱雷:我非常同意陳石總的看法。雖然說現在跟 GPT-4 比,技術差距還是有的,但是确實是時間的問題,因爲從全球範圍來看,除了矽谷,就是國内的這波熱潮了。
國内 AIGC 這一波巨大的浪潮,大家都說是 "iPhone" 時刻,但我覺得更像是初期的 PC 互聯網時刻。大家對于 AI 這件事認知沒有那麽強的時候,突然出現一個巨大的機會和機遇,這時候我覺得對于我們台上的各位和台下的現場觀衆,包括直播的觀衆,各行各業來說,都是一個巨大的機遇。
但在機遇的同時,這也是一種挑戰,所以最後一句話就是我們擁抱 AI。
量子位金磊:非常感謝各位嘉賓精彩的總結和分享,由于時間原因,本場圓桌讨論到此爲止。剛才嘉賓們所展望和期待一些新機遇,在未來将如何發展,我們明年揭曉答案。