" 原來我并不看好火山引擎,但現在有些改觀了。" 在雲行業已經幹了 8 年的張坤表示。
大模型大戰兩年後,雷峰網再次和許多從業者聊起火山引擎這位 " 後進生 " 時,一些人對火山引擎的看法有了很大變化。
雲牌桌上的後來者
火山引擎在 2021 年 12 月正式宣布開始參與雲計算市場的競争。與其他幾家雲廠商相比,這個入局時間顯得有些姗姗來遲。
回顧其他幾家雲廠商,阿裏雲屬于最早邁出步子的人,2009 年成立阿裏雲,并開始自主研發大規模分布式計算操作系統 " 飛天 "。
而騰訊雲是 2013 年 3 月正式上線運營,2018 年 930 之後,騰訊成立 CSIG,轉型産業互聯網。
華爲雲在集團中的地位經曆了多次調整和提升。最初,華爲雲作爲二級部門存在,但在短短半年内迅速提升爲一級部門,戰略地位僅次于華爲的三大 BG(運營商 BG、企業 BG 和消費者 BG),後來又重回集團業務體系。
到 2021 年底,火山引擎入局時,雲市場已經呈現四強競争格局,以阿裏雲爲首,占據國内四成雲服務市場規模,其次是華爲雲、騰訊雲與百度智能雲。火山引擎作爲後來者,想要在這個市場上争得一席之地,有一場相當難的攻堅戰要打。
當年,以 Ucloud、青雲爲代表的獨立雲廠商即便占據先發優勢,但在這四家雲廠商進入雲市場後,開始以投入 10-20 倍的人力,不計成本、不計收益的快速占領市場,後來獨立雲廠商不得不退出了舞台中央,站在獨立雲廠商的視角來看,這個故事的确聽起來相當悲傷,但這也暗含了雲市場厮殺的激烈程度。
半年以前,雷峰網曾與數十名雲從業者交流過火山引擎能否走出不同的命運軌迹,逆襲進入雲行業前三甲時,其大多給出的回答:很難,入局太晚了。
面對強勁的對手,火山引擎如何撬開雲計算市場?雷峰網認爲,核心策略之一就是價格。這種策略在雲市場上掀起了不小的波瀾,火山引擎接連拿下了不少的泛互、遊戲、消費電子等行業客戶,取得了高速增長。據業内人士透露,今年火山引擎的營收目标是要前一年基礎上翻倍。
火山引擎這種發展态勢,也讓其成爲了目前雲市場裏唯一一家還在大規模招聘的公司。" 其他幾家雲廠商這幾年招聘需求縮減了至少 30%,而火山引擎不僅招聘崗位多,而且給略有漲幅的薪資待遇。" 獵頭劉赟表示。
不過,這種高速增長繁榮并未掩蓋住擔憂,不少從業者認爲,短期内,火山引擎在有資源時,自然可以大力投入,但低價彈藥并非無窮盡,長期還是需要靠産品驅動,而目前大部分認爲,火山引擎在産品上還很難追趕上友商。
不過,這是半年前大多數人的論斷,近半年,一些業内人對火山引擎的評價又發生了一些變化,認爲,這一波大模型正在給了火山引擎一個極佳機會,提升産品競争力,同時也給了火山引擎銷售,拉開一個新的突破口。
AI infra,雲廠商們站在了同一起跑線上
爲何說大模型正在讓火山引擎趕超老牌雲廠商?
核心原因是,随着大模型訓練推理需求的不斷增多,客戶在雲底座的選用上,除了關注以往雲的基礎能力外,還會進一步關心在 AI infra 方面的能力。而在 AI infra 上,所有雲廠商都在同一起跑線,并且火山引擎的叠代速度幾乎是廠商裏面最快的。
前不久,火山引擎 Force 冬季大會上新升級了以 GPU 爲中心的 AI infra 分布式業務體系,通過 vRDMA 網絡支持大規模并行計算及 P/D 分離推理架構,提升訓練和推理效率,降低企業使用成本;EIC 彈性極速緩存解決方案,實現 GPU 直連,使大模型推理時延降低至五十分之一,成本降低 20%。
火山引擎在 AI infra 上能快速叠代的原因,這要追溯到 2021 年火山引擎制定的産品戰略。
" 從 2021 年起,我們就确立了兩手抓的産品思路,一邊抓存量,一邊做增量。" 火山引擎雲基礎産品負責人羅浩表示。
火山引擎雲基礎産品負責人羅浩
羅浩所言的存量是指傳統雲計算的需求,包括 ECS、存儲、數據庫、網絡、安全等一些雲基礎産品。不可否認,作爲後來者,火山引擎在這些基礎雲産品上與其他廠商還存在差距,所以羅浩認爲,在這一塊他們的核心就是要快速補齊短闆。
不過,光是補齊短闆遠遠不夠,如何能在産品上有所差異,才是赢得市場競争的關鍵。而随着生成式 AI 浪潮的到來,火山引擎随即決定要從算力上做突圍,也就是羅浩所說的增量,來服務比如兩年前爆發的訓練需求,今天大規模的推理需求。
" 早在 2021 年,我們就開始大規模投入 AI 和 GPU 了。"
這一戰略判斷,從過去一年火山引擎在 AI infra 上的銷售表現,已經可以驗證正确性,大模型公司幾乎都是火山引擎 AI infra 的采購者。
如果說 4 年前 " 兩手抓 " 的産品戰略是火山引擎在 AI infra 上實現追趕的根基,那過去幾年的内外部實踐則是 AI infra 叠代的關鍵驅動力,所有産品穩定性和能力往往是在一次次業務場景中淬煉重生。
在這些實踐中,讓火山引擎 AI infra 加速狂奔的是豆包大模型。前不久,火山引擎總裁譚待在火山引擎 Force 冬季大會上公布了一個數據,2024 年豆包的日均 token 數據從 5 月 15 日的 1200 億,到 12 月 18 日增長到了 4 萬億。
要承載 33 倍的增長,這幾乎其他廠商都沒有遇到過的,背後對于底層 AI infra 的性能、成本幾乎是一次大考。
羅浩談到,今年 5 月份之前,那時豆包體量還小,爲了讓豆包大模型能夠良好地運行,他們通過增加更多的 GPU 資源來保證大模型能夠快速響應大量的查詢請求,以提升客戶的使用體驗。
但他們很快發現," 堆量 " 這種方法行不通了,随着用戶量的增加,繼續這樣做成本就變得難以承受。
優化推理成本迫在眉睫,他們團隊開始大量分析哪些地方是 " 成本暴發戶 ",經過他們仔細的計算發現,緩存和存儲部分是拉高計算成本的重要部分。
" 傳統的緩存技術有一個問題,就是它處理數據時會繞一大圈,通過 CPU 再到内存,這會導緻延時增加,性能下降。" 羅浩說。
爲解決這個問題,他們決定重寫整個緩存系統。新的系統完全圍繞 GPU 展開,不再依賴傳統的 CPU 架構。這意味着,數據可以通過一種更高效的方式直接從 GPU 傳輸到遠端内存,使用一種叫做 GDR,GPU Direct RDMA(GPU 直接遠程内存訪問)技術,這樣不僅減少了延時,還提升了整體性能。
這個數據傳遞過程就像是送信,原來需要通過郵局,既慢又容易出錯。而現在,系統就像給數據裝上了直通車,直接從一個人手中快速送到另一個人,省去了中間環節,速度更快,準确性更高。
" 這些内外部業務,對我們的意義就是,讓我們比别人早踩坑,也早發現問題,早解決。"
今年 5 月火山引擎 Force 春季大會上,豆包主力模型在企業市場的定價比行業價格降低了 99.3%," 這個降價 99.3% 并非是我們拍腦袋想的,而是建構在之前對 AI infra 的優化上算出來的。"
羅浩表示,計算範式當前正在從雲原生進入 "AI 雲原生 " 的新時代,火山引擎以 GPU 爲中心重新優化計算、存儲與網絡架構。GPU 可以直接訪問存儲和數據庫,來顯著降低 IO 的延遲。同時,整個系統提供高速互聯和端到端的安全保護。
這是國内首次有雲廠商喊出 "AI 雲原生 " 的理念。如今,新架構仍在支持着豆包大模型實現快速的指數級業務增長。
除有豆包大模型 " 倒逼 " 外,火山引擎 AI infra 能夠在較短時間内升級,也與火山引擎獨特的組織架構有關。
國内其他幾家雲廠商的産研團隊基本是和集團業務是分開的,但火山引擎并不是,做火山引擎的這一批人馬,就是來自字節中台,像羅浩本人,就有兩個身份,一個是火山引擎雲基礎産品負責人,另一個是字節跳動基礎架構雲産品負責人,而吳迪也同樣如此,他第一個身份是火山引擎的算法負責人,另一個也是字節機器學習中台的一位負責人。
這種組織的好處有兩個:第一火山資源和字節的資源都在一個人手上管理,這樣也能實現資源的充分利用;第二是人才能力上的複用。
爲商業化撕開了新突破口
大模型到來,除縮小火山引擎與其他廠商産品之間的差距外,其帶來更明顯的效果就是,爲火山引擎商業化帶來了一個新的突破口。
上文也提到,作爲後進生的火山引擎進入雲市場時,面臨很大的一個問題就是如何打開市場,過去火山引擎用了一些價格策略的确也取得了一些成果,但這終究不是長久之計。
而這一波大模型,對于火山引擎來說,其最重要的就是手上多了一張撬動客戶的 " 王牌 " ——豆包大模型。
一名火山引擎銷售曾對雷峰網說過他的銷售經曆:以前經常找拜訪客戶由頭通常要絞盡腦汁,而且由于火山引擎在雲市場是後來者,一些客戶往往會提出靈魂拷問,爲什麽選你?但自從大模型出現後,越來越多的客戶有了大模型訓練需求,一些客戶還會主動找上來問,如何去搭建自己的大模型。
趁着大模型這一波熱度,火山引擎在加速推進商業化,據資深獵頭王帆透露,今年年中,火山引擎單獨成立了一個 10 人不到的大模型商業化小組,這也是雲廠商中唯一一家單獨成立大模型銷售團隊的,其他雲廠商的大模型銷售人馬仍然是賣雲的銷售、渠道。
雲銷售賣大模型有一個問題是在于,技術有壁壘,一般的雲銷售不一定有能力跟客戶講清楚大模型的價值、技術,而火山引擎也在寄希望于通過豆包大模型,打入更多已經跟友商合作的客戶中去,而這也是這個小組成立的重要原因。
過去一年,可以看到火山引擎借助大模型在商業化的突破,據了解,目前豆包大模型已經應用到了汽車、手機、金融、消費、互娛等 30 多個行業,尤爲值得一提的是汽車行業,火山引擎的确拿下了不少的汽車大單。
早在去年,火山引擎先後與吉利、長城、蔚來、廣汽等多家車企達成深度合作,爲車企提供了數字化營銷、智能座艙、車載聚合音視頻内容等一系列服務。
今年 5 月,火山引擎成立了汽車大模型生态聯盟,一汽紅旗、東風乘用車、吉利汽車、長城汽車、廣汽乘用車、宇通客車在内的 24 家整車廠、官方機構、出行生态公司等加入其中。下半年,火山引擎在汽車領域有一個重要的突破客戶,那就是奔馳。8 月 13 日,火山引擎與奔馳簽署戰略合作備忘錄,雙方宣布将在大模型、生成式人工智能和大數據技術領域展開合作。
不過,也有很多人會有疑問,賣大模型是否能爲火山引擎增收,畢竟眼下,OpenAI 和 Gemini 都在不斷降價。今年 5 月豆包在國内率先掀起大模型的降級潮,豆包主力模型在企業市場的定價爲 0.0008 元 / 千 Tokens,随即幾個月其他廠商也迅速跟進,而 12 月底,火山引擎再次将視覺模型價格打下來,定價爲 0.003 元 / 千 Tokens。
火山引擎總裁譚待公開表示,豆包大模型的定價一步到位,有合理毛利。不過,所有廠商目前大模型 API 收入規模都不大。結合雷峰網調研發現,月消費 1 萬,相當于公有雲消費 1000 萬的客戶體量,是很大客戶了。
的确,眼下大模型帶來的收益遠遠小于投入,不過大模型的生意還要是要拉長時間維度來看,大模型應用規模上去之後,一定會帶動雲的用量,據 IDC 報告,未來 5 年國内的訓練、推理算力分别以超 50%、190% 的年複合增速發展,并在 2028 年推理算力會超過訓練算力。而到那個時候,率先在大模型上重兵投入的火山引擎,興許也更新了自己在雲牌桌上的排名。