圖片來源 @視覺中國
文 | 價值研究所
進入 5 月,國産大模型的風口非但沒有熄火,反倒越燒越旺。過去一個星期,就有多家企業發布 AI 大模型相關産品:
5 月 5 日,網易有道發布了基于 " 子曰 " 大模型開發的 AI 口語老師劇透視頻,介紹其基于教育場景的類 ChatGPT 産品布局;5 月 6 日,科大訊飛發布認知大模型 " 訊飛星火 ",董事長劉慶峰表示有信心超越 ChatGPT;同日,淘雲科技發布 " 國内首個 " 兒童認知大模型 " 阿爾法蛋 " ……
在上述公司之外,還有很多企業宣布進軍大模型,類 ChatGPT 産品正在密鑼緊鼓研發中,預計不久便會正式上線。企業的熱情毋庸置疑,AI 大模型似乎已經不是一條選擇題,而是必做題。
然而,狂熱背後不乏擔憂。大模型技術應用範圍雖廣,目前落地的場景畢竟有限。而這群入局大模型的企業,分别來自遊戲、教育、動漫等諸多行業,和大模型的應用場景離得很遠。
當國産大模型變得泛濫,我們該如何分辨優劣?
沒技術不要緊,有公司靠 " 外援 " 搗鼓大模型
要評判一個大模型的優劣,首先看技術,其中最核心的是算法和算力,即訓練參數量。因爲參數量越大,系統的知識面就會越廣,表現也會越穩定。資料顯示,openAI 在 2020 年推出的 ChatGPT-3 參數量已經達到 1750 億,谷歌在一年後發布的 PaLM 則達到 5400 億,更不用說最新的 ChatGPT-4 了。
參照此技術标準,我們可以精準識别一批蹭熱點的企業:它們要麽确實拿出了産品,但參數量和 ChatGPT 等有較大差距,功能也較單一;更有甚者,套用别家公司的硬件、數據庫來預訓練參數,本身缺乏核心技術。
當中的代表,有昆侖萬維。
4 月 10 日,昆侖萬維宣布聯合奇點智源研發 " 天工 3.5" 國産大語言模型。根據發布會上的介紹," 天工 3.5" 定位爲 " 中國第一個真正實現智能湧現 " 的大模型産品,具備智能問答、聊天互動、文本生成等多種應用功能以及豐富的科學、技術、文化、藝術和曆史知識儲備。
根據官方資料,昆侖萬維最早在 2020 年布局 AIGC 業務,投入數億元組建研發團隊。去年 12 月," 昆侖天工 " 首次亮相,初代産品提供圖像、音樂、文本及代碼 AI 生成功能。作爲對比,大模型領頭羊 openAI 在 2019 年發布 ChatGPT-1,每一代産品的研發周期都在一年左右。
乍一看,昆侖萬維的 " 天工 3.5" 功能全面對标 ChatGPT,比起百度 " 文心一言 "、阿裏 " 通義千問 " 等國産大模型毫不遜色。在研發速度上,昆侖萬維也領先于大多數國内同行。不過昆侖萬維的缺點也很突出—— " 天工 3.5" 是和阿裏雲合作的産物,後者的參數、硬件設備幫了昆侖萬維很大忙。
事實上,昆侖萬維一直抱緊阿裏雲的大腿。資料顯示,過去幾年昆侖萬維的海外數據基本都在使用阿裏雲公有雲儲存服務,2020 年布局 AIGC 時也是在阿裏雲的協助下建立算力集群。在 " 天工 3.5" 發布後,還有媒體爆出昆侖萬維缺乏文本生成、數據處理專利的消息,和百度、阿裏形成鮮明對比。
同樣遭遇技術質疑的,還有 "AI 四小龍 " 之一的商湯科技。
商湯科技在 4 月 10 日發布了自研大模型系統 " 日日新 SenseNova",内含 AI 數字人視頻生成平台 " 如影 ",3D 内容生成平台 " 瓊宇 " 和 " 格物 ",類 ChatGPT 産品 "SenseChat" 等産品。别人都是發布單個産品,商湯科技一次過拿出一套 " 全家桶 ",可見其野心之大。
然而,商湯的大模型全家桶在發布那天就有翻車迹象。演示視頻公布後,就有媒體和網友發現商湯 " 妙畫 " 生成的圖片和 AI 網站 Civitai 的圖片撞車,甚至還有來自 Civitai 的文字注釋。SenseChat 則在一些基礎問題上表達含糊不清,其訓練參數量也遭到質疑。
在價值研究所看來,缺乏數據源,是昆侖萬維和商湯科技共同的命門。
" 文心一言 " 背後有百度的海量搜索數據和語料庫,阿裏的 " 通義千問 " 則有來自電商、雲計算等領域的語料庫,流量大、用戶覆蓋面廣,能提供足夠的參數。缺乏面向 C 端用戶的通用産品、沒有參數積累,強行上馬大模型,昆侖萬維和商湯科技的尴尬處境完全可以預料。
沒應用場景又如何?這些企業硬要和 AI 攀關系
除了缺乏核心技術、産品缺陷明顯的昆侖萬維等企業,另一類企業的行爲更讓人迷惑:在缺乏應用場景的情況下,硬要給自身産品貼上大模型标簽、 " 硬蹭 " 熱點。
這一類企業,以專注 C 端服務的互聯網公司爲主,尤其是近年來處境不佳的教育、科技金融、遊戲公司。
比如專注于智能教育硬件研發的淘雲科技,在 5 月 6 日發布了首個兒童認知大模型 " 阿爾法兒童認知大模型 " 和 GPT 機器人,并宣布把平台的兒童原始語料加入科大訊飛的 " 訊飛星火 " 大模型中。同樣來自教育領域的學而思,也在近日宣布研發數學大模型 MathGPT,目前已取得階段性成果,預計年内推出。
這類企業最大的問題在于,大模型的應用場景、目标用戶和它們的業務有巨大差異。強推大模型,根本無法爲它們的用戶帶來多少幫助。
根據淘雲科技董事長劉慶升的說法," 阿爾法兒童認知大模型 " 基于兒童場景提供更貼近幼兒理解力的生成式内容,讓兒童用戶在輕松的氛圍下積累新知識。問題在于,類 ChatGPT 應用仍無法保證 100% 準确率,常識性的錯誤屢見不鮮。對于認知能力有限的兒童來說,并不穩定的大模型反倒可以帶來反作用。
當然,上面這些公司蹭熱點的目的雖然很明确,但好歹拿出了實打實的産品或規劃。還有一些企業,不僅業務場景和大模型相去甚遠,甚至還沒有拿出實際産品就開始往自己臉上貼金。
比如定位于 " 國漫 IP 孵化平台和漫畫分享社區 " 的快看漫畫,就在 4 月 27 日宣布成立 AIGC 事業部。創始人兼 CEO 陳安妮更是在内部信中表示,AI 将會給内容産業帶來 " 颠覆式 " 生态變革。
再比如最近一邊搗鼓直播電商、一邊忙着進軍本地生活的小紅書,也沒忘記籌備大模型團隊。根據 36 氪報道,小紅書在今年 3 月開始組建研發團隊,主要成員來自廣告 NLP 技術部門。4 月,小紅書悄悄上線了一款名爲 "Trik" 的 AI 創作應用,主打 AI 繪畫,但沒有大規模宣傳,至今沒有引發多少關注。
總的來說,這兩類企業的大模型布局都經不起推敲。但蹭上大模型風口,确實爲其帶來了可觀的流量,也掀起資本市場的狂歡。前面提到昆侖萬維,在發布 " 天工 3.5" 次日股價暴漲 16%。或許正因爲市場過于狂熱,才會反過來迫使這些企業主動迎合熱點。
可惜這種熱度是無法持續的,而且還會遭到監管機構的重點關照。在 " 天工 3.5" 發布次日,昆侖萬維就收到了深交所的關注函,要求前者結合項目研發進度、行業政策風險、對公司财務的影響等情況,說明該業務可能面臨的風險。
雖然深交所沒有把話挑明,但明眼人都看得出這封關注函寫滿對昆侖萬維蹭熱點的懷疑。在價值研究所看來,蹭熱點的行爲正在損壞行業生态。給大模型降降火、讓市場回歸理性,對踏實搞研發的企業來說非常重要。
追趕 ChatGPT,一場艱苦的馬拉松競賽
不可否認,除了上面這些蹭熱點的公司外,國内有不少企業在認真打磨大模型産品,也有一定的技術積累和豐富的應用場景。不過從百度、阿裏,再到 360,幾乎所有頭部企業都承認自己的技術不如 openAI 的 ChatGPT。
5 月 7 日,周鴻祎應邀來到東方甄選直播間,和俞敏洪、董宇輝大談國内的大模型創業熱潮。周鴻祎直言,openAI 比國内企業領先至少兩年,國産大模型有機會在一年内追上 ChatGPT-3.5,但 openAI 已經開始訓練 ChatGPT-5 了。
" 上來就說能超越 ChatGPT,那叫吹牛。"
周鴻祎最後這番話,不少媒體認爲是在影射 5 月 6 日發布 " 訊飛星火 " 認知大模型的科大訊飛。科大訊飛董事長劉慶峰在發布會上表示," 訊飛星火 " 在文本生成、知識問答、數學能力上已經超過 ChatGPT,目标是到今年 10 月,通用認知能力對标 ChatGPT,并在中文上超越 ChatGPT。
周鴻祎是否意有所指不得而知,可以肯定的是,投資者、用戶對國産大模型的耐心正在流失,要求變得更加苛刻,外部的競争也更加激烈——留給國産大模型的時間已經不多了。
5 月 4 日,微軟宣布 Bing 預覽版全面開放,該系統此前已接入 openAI 的 ChatGPT-4;一天後,谷歌也宣布向所有擁有 Wordspace 賬号的用戶開放 Bard AI 工具訪問權限。
微軟和谷歌先後走向開放,意味着新一輪用戶争奪戰正式打響。一旦它們滲透進國内市場,面對技術上的差距,國産大模型并沒有太多應對方法。比起那群蹭熱點的企業,追趕 openAI 的骨幹力量更值得我們關注——特别是百度、阿裏、騰訊三巨頭,周鴻祎治下的 360,疑似被其揶揄的科大訊飛實力也不容小觑。
這幾家公司的優勢是相似的:雄厚的資金儲備;擁有諸多面向用戶的産品 / 服務,語料庫十分豐富;主營業務貼近大模型應用場景,如百度和 360 的搜索,騰訊的社交媒體,阿裏的雲計算和電商,科大訊飛的智慧辦公等。現階段,這些企業的産品距離 ChatGPT 當然還有一定差距,但并非沒有追趕的機會。
要知道,即便是技術領跑全行的 openAI,也有自己的苦惱。過去一年,随着 ChatGPT 走紅 openAI 的估值也是一路走高,成爲全球範圍内升值最快的獨角獸——可惜随之飙升的,還有虧損額。
據外媒報道,openAI 上一财年淨虧損達到 5.4 億美元,同比幾乎放大一倍。每一次預訓練參數都要耗費巨資,要提升系統穩定性又必須不斷加大參數量和預訓練頻次,虧損自然成爲無解難題。國盛證券的研報指出,通過測算,2800 億參數量的大模型預訓練成本約爲 200 萬美元 / 次,谷歌的 PaLM 号稱擁有 5400 億參數,單次預訓練成本将高達 1200 萬美元。
今年 2 月推出的付費版 ChatGPT 和其他商業化嘗試收效甚微,短時間内不可能覆蓋預訓練所需成本。CEO Sam Altman 曾暗示,公司未來幾年可能需要籌集約 1000 億美元的資金,才能進一步提升技術,打磨下一代産品。
openAI 的經曆表明,AI 大模型研發如同一場漫長且艱難的馬拉松——不要總是奢望彎道超車,踏踏實實和參數打交道是成功的基礎。
寫在最後
水能載舟亦能覆舟,狂熱的市場氛圍既給企業帶來了資金和關注度,也帶來了難以預估的風險。近段時間,證監會等監管機構已經加大管控力度,不少公司也主動出面自證清白:據不完全統計,4 月底至今已有世紀天鴻、萬興科技、中科信息、唐德影視等多家上市企業發布股票交易異常波動公告,澄清自身業務和 AI、大模型的關系。
經過移動互聯時代的洗禮,蹭熱點、追風口的情況太過常見了。似乎任何一個風口都逃不過從萌芽到爆發,再走向混亂、重塑秩序的過程。但在亂戰過後,有的風口出清泡沫、置之死地而後生;有的賽道卻徹底沉淪,如一顆流星般結束自己絢爛卻短暫的一生。
走在時代前沿的 AI 大模型,似乎更有可能成爲前者,不過需要所有從業者、監管機構的共同努力才能保證健康發展。大模型是一條技術門檻、資金門檻都很高的賽道,蹭熱點的企業注定無法長久。加強監管、淨化行業環境、驅逐不良玩家可能會帶來短期混亂,但對行業的長期發展肯定是有益的。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App