圖片來源 @視覺中國
文 | 新立場 Pro,作者 | 新立場
持續兩天的 2023 騰訊全球數字生态大會在 9 月 8 号落幕了,在老闆定調 "AI 是百年不遇的機會,因此不急于一時 " 過後,騰訊自研的通用大語言模型 " 混元 " 終于還是亮相了。
跟國内同行推出的競品相比,鵝廠的大模型節奏在常人眼裏多少有點太沉得住氣了,比如據說隔壁的文心一言已經在從芯片到框架,從模型到應用方面經過了多輪優化。
不過很難說經過更多時間打磨但還沒實戰過的混元,能夠跟其他大模型在能力上有着差異化的優勢,盡管在官方舉例的一個邏輯推理場景裏混元的表現超過了 GPT3.5,處于跟 GPT4 一樣的水平。
當然,混元大模型的亮相對騰訊雲來說仍然是個相當利好的因素。
在過去這大半年裏,阿裏雲和百度雲都把模型即服務(MaaS)當作叙事的核心,張勇和沈抖兩個人用略有差異的語言傳遞着相同的口号:所有行業都值得用大模型重做一遍。
在華爲雲憑借在政務市場的資源優勢對騰訊雲實現彎道超車過後,騰訊在這幾年的聲量小了很多,這個轉變在馬化騰去年底那次著名的内部講話之前就已經發生了。
騰訊雲自 2020 年開始不再單獨對外披露營收狀況,而是合并到了财報中的金融科技和企業服務(FBS)部分。在騰訊發布的最新二季報裏,FBS 部門的營收同比增長了 15%,同時毛利率也達到了 38.4%,是有記錄以來的最高值。
不過這部分業績增長的最大功臣并不在雲計算業務,出力的大頭是以支付業務爲核心的金融科技和視頻号。雲計算部門的營收增長相當有限,官方的用詞是 "modest growth"。
對外界而言,有關騰訊雲的一個靈魂之問是,經曆了這麽長時間的 " 可持續轉型 ",騰訊的盈利時刻還有多遠。要知道百度雲的市場份額是低于騰訊雲的,而沈抖在去年五月輪崗上任過後,已經在今年一季度實現了盈利。
湯道生該着點急了。
01 托底下限取中庸
在中國信通院發布的《雲計算白皮書(2023)》當中,阿裏雲、天翼雲、移動雲、華爲雲、騰訊雲和聯通雲分别占據中國公有雲 IaaS 市場份額的前六名;而在公有雲 PaaS 層面,騰訊雲的份額則僅次于阿裏和華爲兩家,排在第三位。
所以一個客觀的情況是,雖然騰訊雲整體營收在前兩年被華爲雲超過了,但騰訊雲仍然是國内雲計算市場裏除三大運營商之外的 Top 玩家,并且跟華爲雲的差距也還算穩定。背靠着騰訊龐大的社交和遊戲生态,隻要騰訊還想做雲計算這塊業務,這部分下限永遠都是有保障的。
然而下限有保障不代表業務能做到出色,甚至不排除有時候會因爲有人托底而缺乏進取的動力。如果排除掉三大運營商,騰訊雲大概是中國互聯網雲廠商最缺乏特色的,從上到下透着一股中庸之道。
試想,提起阿裏雲,人們能想起馬雲的遠見和王堅的隐忍,能想到阿裏雲研發的飛天因而給其投射上一層技術濾鏡。百度雲這邊,雖然李彥宏最初關于雲計算的論斷成了業界的談資,但人家死死抓住 AI 這面大旗,國内第一個搞出文心一言也算是不辱人設。華爲雲就不用說了,繼承了華爲的狼性作風和政企領域的深厚基礎,因而才能快速後發先至。跟這些競争對手相比,你似乎很難找到騰訊雲的特色。
比如,談到騰訊雲在大模型方面的技術優勢時,無論是官方的公衆号文章推送,還是财報電話會議上的 PPT 演示文稿,抑或是騰訊雲内部高管對外的專訪,《新立場》注意到除了各家都會聊的一些軟硬件生态支持,騰訊雲還着重強調了自研的向量數據庫。
從目前各家雲廠商在營銷和 PR 方面的實踐看,騰訊雲似乎是唯一拿這點出來強調宣傳的。
所謂向量數據庫,是近年來在傳統關系型數據庫(SQL)之外,衍生出來的非關系型(NoSQL)數據庫的一種。它将數據以向量形式存儲,可實現向量數據的相似度搜索、聚類、降維等操場。
跟傳統數據庫相比,向量數據庫能夠高效地處理大規模和高維的複雜數據,例如圖像、音頻和視頻等,因此廣泛應用在以圖搜圖、推薦引擎、聊天機器人等領域。
把原始的多模态數據轉換成向量實際就是壓縮的過程,這對于需要現在動不動就需要接收上萬億 token 預訓練語料的通用大模型來說非常重要。
舉個例子,人類在見到一個熟悉的對象時,大腦的思考過程是這樣的。首先,眼睛中的視杆細胞和視錐細胞會記錄下光感強度,然後把信号傳遞到大腦的視覺皮層。随後皮層中數以百萬計的神經元被激活,當激活信号傳遞到颞葉時,大腦就會解釋成 " 我看到了某人 "。所以,當大腦試圖理解信息時,真正解讀的是視覺皮層輸出的神經表示,而非進入到眼睛的原始圖像。
深度學習模型其實也是如此。盡管大模型是端到端的呈現形式,從文本輸入到文本輸出,但是模型實際接觸和學習的數據并不是文本本身,而是向量化的文本。因爲文本本身直接作爲數據的話,會因維度太高導緻學習起來過于低效。而向量化的文本相當于對自然語言的壓縮和總結,會大大改善這個過程。
所以從技術背景上說,向量數據庫的确在大模型時代具有基礎作用。但問題是,這是否能成爲騰訊雲開展業務的差異化基礎。
實際上,在國内向量數據庫幾乎是所有做大模型研發的大廠标配,百度、阿裏、科大訊飛這些公司都有自己的産品。同時還有一波創業公司在做這件事,無論是開源的 Milvus 還是閉源的 Pinecone,并且在 benchmark 上還普遍比大廠表現更好。
2018 年,當騰訊大張旗鼓向 2B 方向轉型的時候,騰訊雲這塊業務是先鋒。當時很多人質疑一直以來都是 2C 産品見長的騰訊沒有 2B 基因,馬化騰不信。後來到了 2020 年 Q4,FBS 對騰訊營收的貢獻首次與遊戲持平,并在 2021 年四季度成爲最大營收來源。
從這個角度看,似乎騰訊的 2B 戰略的确取得了成功。然而從 FBS 業務的構成看,撐起局面的最大功臣顯然是微信支付。即便騰訊籠統地把這塊劃到了 2B 裏面,但支付業務的成績顯然應該歸功于微信作爲社交工具的成功。倒是過去幾年透出中庸甚至平庸的騰訊雲,作爲真正的 2B 業務試金石,某種程度上表明了騰訊 2B 轉型面臨的挑戰。
02 湯道生不比沈抖難
相較于國外同行,國内的雲計算廠商在賺錢這條路上走得非常艱難。
在這個問題上,行業的發展可以被大緻分成兩個階段。大概在 2020 年之前,這些雲廠商是主觀的不太想掙錢。從移動互聯網浪潮興起開始,國内的互聯網企業經曆了一波又一波的燒錢擴張,得到的經驗是燒錢最終不一定成功,但不燒錢一定立刻就死。
雲計算行業保留了這種慣性,各大雲企都有過花錢做慈善賠本賺吆喝的非理性行爲,一分錢一元錢中标的案例不勝枚舉。後來随着互聯網的用戶滲透達到頂峰,資本市場氛圍收緊,行業的整體基調很快轉向了業務可持續性上來。當然由于前些年的高強度内卷搞得太過,客戶的口味多少有點刁了,陡然間雲廠商想掙錢并不容易。
阿裏雲這邊因爲業務開展得最早,同時體量也最大,所以最早邁過盈虧平衡的門檻。根據阿裏的财報,阿裏雲在 2021 财年 Q3(自然年 2020 年 Q4)實習了首次盈利:單季營收 116.15 億元人民币,經調整 EBITA 盈利爲 2400 萬元。随後阿裏雲保持了上述趨勢,并在 2022 财年實現了年度扭虧。
不過需要注意的是,即便實現了穩定盈利,阿裏雲實際的變現水平仍然偏低,最近财年的經調整 EBITA 利潤隻有 14.22 億元人民币。除阿裏雲之外,國内其他雲廠商無論體量大小,基本都仍在虧損。
最近一個成功扭虧的廠商是百度智能雲,該業務已經連續兩個季度實現 non-GAAP 層面扭虧,背後的功臣是百度的中生代高管沈抖。
沈抖是在去年五月以輪崗的名義被安排到負責智能雲業務的,但正如《新立場》在此前文章中提到的,這種輪崗從性質上說有 " 發配 " 的意思。此前沈抖主導了手機百度的信息流轉型,推動移動生态事業群從搜信息拓展到搜服務,被李彥宏形容爲 " 具有戰略視野,敢打硬仗、能打勝仗 "。
而當時 ChatGPT 還沒冒頭,智能雲雖然名義上是百度極其重要的前景業務,但錯過先發優勢後增長明顯乏力,沈抖去能做的事情十分有限。
然而到 2023 年 5 月,僅僅一年過後,百度發布 2023Q1 财報時,智能雲業務就首次實現了季度盈利。在去年五月宣布輪崗安排的那封公開信裏,李彥宏給沈抖的指示是 " 實現規模和健康度的量變到質變,爲百度第二曲線的發展建立新的功勳 "。
從實際效果看,沈抖證明當初他帶領手百成功轉型不是偶然。另外,就時間點而言,百度發布文心一言是在 3 月 16 号,所以沈抖在一季度的扭虧是沒有趕上任何大模型方面的紅利的。
而騰訊雲這邊,從馬化騰本人的表态看,他對公司的雲業務有着跟李彥宏類似的期待,隻不過湯道生目前還沒做到沈抖的成績。湯道生負責騰訊的雲計算業務有些年頭了,論根基比沈抖深多了。
騰訊 2018 年成立雲與智慧産業事業群的時候他就是 CEO,在 2018 年以前也掌管着騰訊的雲計算業務。騰訊雲的體量也比百度智能雲要大,所以綜合來看湯道生這麽多年還沒能帶領騰訊雲扭虧沒有道理。
湯道生并不比沈抖難。
03 寫在最後
一個頗爲有趣的細節是,馬化騰似乎要比李彥宏寬容得多。
在去年底那次著名的内部講話裏,他說過去三年 CSIG 做了很多沖量的事情,追求做前端集成,追求大數字營收。但他同時也給湯道生找了台階下," 湯道生之前并不想這樣做,但騰訊經常被市場份額和輿論的大勢裹挾,被迫做總包去拿市場份額"。
從這個角度說,騰訊雲作爲騰訊 2B 最關鍵的招牌,湯道生理應更加不負期待。