出品 | 虎嗅科技組
作者 | 王欣
編輯 | 苗正卿
頭圖 |《現代啓示錄》
圍繞 ToB 的雲計算和大模型服務競争正在愈發激烈。
2024 年下半年,字節在 AI 上的飽和式投入在火山引擎上彰顯無疑—— 5 月 15 日,豆包将主力模型價格降至 0.0008 元 / 千 Tokens 。5 月 21 日,最早提出 MaaS(模型即服務)的阿裏雲緊追不舍,将通義千問主力模型價格從降至 0.0005 元 / 千 tokens。幾小時後,百度智能雲宣布文心大模型兩大主力模型全面免費。
巨頭下場厮殺,MaaS 戰事進入白熱化,有提供 MaaS 服務的公司甚至開始逐步改換其他賽道。
在激烈的态勢之中,各家都在嘗試做出一些差異化,或找到自己的生存方式。火山引擎也是其中之一。
在 2024 年上半年,火山引擎給外界最明顯的感受之一是,他們在嘗試用 " 價格優勢 " 滲透市場。半年前的 5 月 15 日,字節也以 0.0008 元 / 千 Tokens 的價格,進入國内大模型價格戰的肉搏中。在半年後,這一特質幾乎成爲了火山引擎的 " 常規操作 "。火山引擎總裁譚待向虎嗅表示 " 隻要大家 follow 我們的價格就可以了。不同于其他可能虧損的友商,我們能夠壓低成本來保持可持續的商業模式。"
但譚待認爲,火山引擎的崛起,絕不僅是依靠 " 價格戰 "。
12 月 16 日,譚待和虎嗅進行了一次深入交流,我們希望了解這半年多火山引擎的變化,以及譚待對于行業的一些新思考。
以下爲虎嗅 12 月 16 日與譚待交流實錄:
增長和團隊
虎嗅:你用哪些維度,去評估火山引擎的發展情況?
譚待:客戶和開發者的使用量。這裏面有一個關鍵維度是,我要看到底有多少客戶是在深度使用的,邁入了真正應用 AI 的門檻,我們内部有個 " 雙 10" 說法——日均 Token 達到 10 億,有 10 個 Agent(智能體)使用場景。
虎嗅:上次交流是五月了,五月至今你們的客戶量、開發者使用量增長情況怎樣?
譚待:都是非常樂觀的增長态勢。而且我們通過比較好的商業化手段,讓成本和收入保持比較好的平衡。
虎嗅:具體增長到多少量?
譚待:我們近期會公布具體增長情況。
虎嗅:你如何解讀增長背後的原因?外界普遍認爲你們依靠價格優勢取勝。
譚待:價格隻是常規操作。我覺得是這樣子,隻要大家 follow 我們的價格就可以了。我們的視頻理解模型已經降至 0.003 元每千 tokens。
但更關鍵的是産品,在模型能力這裏我們形成了一個循環——通過提高模型能力、壓低成本來擴大用戶使用規模,從而帶回更多用戶需求,再針對性地進行産品和解決方案的研發,最終帶來模型能力的提升。
以及我們也會有一些團隊策略的調整,比如我們建立了一支 AI 落地服務的團隊。
這個團隊裏面有算法專家,有做 PE 的專家,也有行業的專家,也有技術的服務客戶。對于這些重要的客戶,或者是在關鍵産品上有挑戰的客戶,服務團隊會進場和他們一起來優化。
虎嗅:這個團隊是什麽時候建立的?
譚待:最早火山引擎在做第一個産品——推薦服務時,就有 OPPO、vivo 等手機客戶反饋,他們想要的不是一個平台,而是通過平台加算法服務,把商業變現效果做上去并爲此付費。當時我們就建了一個算法服務團隊來做這件事情。而我們認爲 AI 更需要這樣的服務團隊,而且這個事情更難——沒有統一的标準,有時候客戶會把這個事情想得太簡單,有時又想得太難,而服務團隊能夠幫助客戶更快地找到 PMF,我們就直接以此爲基礎去擴建了這個團隊,其實效果還挺好。
虎嗅:具體是怎麽幫客戶找到 PMF 的?難點在哪?
譚待:首先是診斷加咨詢,了解客戶需求和要解決的場景問題。我們會優先做業務價值高,實現難度又低的。
因爲模型進展很快,其實有些問題當前解決不了的,可能一個月後就能解決。這裏面我們會遇到一些情況,比如客戶數據可能特别敏感的,無法提供給我們,就需要我們按照對場景的理解,補充對應的合成數據來優化模型的效果。
我覺得在這個階段的話,因爲你的産品和模型在不斷地變,用戶的需求也不是特别清晰。這個時候就需要有一個比較立體的綜合性打法。在這個過程中,我們積累了非常多的案例,上線了 100 個 best practice 的案例模版庫。當針對客戶不同需求的流程和做法都固定下來,可能大家都知道該怎麽幹了,那你的服務在裏面就可以弱一些。
虎嗅:這些流程模式現在形成一套成熟的打法了嗎?
譚待:我覺得把整個大模型的應用重要場景都解鎖完了,這個事就實現了。它是一個過程,當然這半年我們其實找到了很多好的方案。但是很快就會看到有新的更難的問題,但我覺得這個更有價值,因爲不是過去問題的重複。比如說我做了 A 類問題,然後誕生了 A plus 問題,那個 A plus 它有更高價值難度也更大。這時我們就可以複用 A 問題的解決方案。
虎嗅:火山引擎内部是怎麽去做團隊協同,讓效率更高的?
譚待:第一,火山引擎算法負責人吳迪、基礎架構負責人趙鵬偉等核心團隊,本身就服務了抖音和頭條很長時間,他知道大規模的系統是怎麽構建的。
第二,我們内部也有很多新的探索,有更好的視野,他能看得清楚的大家都在做什麽,以及未來會發生什麽。
最後是,轉成對應的技術和産品規劃,以及用什麽樣的組織去承接好這些技術和産品的落地和發布。
這個過程中,還是需要不斷去優化的。也不能說我們現在做的特别好,但是至少我們在第一步和第二步有些天然的優勢,我們本身就有那麽多的客戶,以及我們有抖音、頭條、豆包,本身就有很多前沿場景。
虎嗅:今年咱們團隊擴招人數多嗎?
譚待:擴招不算太多。因爲我們原來人就很多,我們一開始的目标,并不是說我們做十個億的時候,建十個億的團隊。我想的是最終是要做到多大,要服務多少人,爲了這個目的來提前做好儲備。所以提前做好儲備之後,後面不用太擴了。這樣我覺得反而效果可能是更好的。這是一個先有雞還是先有蛋的問題。
但是我們的資源投入的分配上,是有很大的變化的。更多向大模型方向傾斜,傳統的就會少一些。
虎嗅:25 年火山引擎的打法會更側重哪些方面?
譚待:我覺得現在其實各行各業用得都不是特别深。比如,有很多遊戲公司它的 NPC 用了我們,但是 NPC 隻是遊戲中的一個環節,還有其他環節可以繼續滲透,AI 去做好遊戲的輔助,甚至能夠去創造地圖。我們後面會有 AI 3D 模型的發布,可以用它去做好開放世界。
遊戲這個場景,可能我們就解鎖 1%,還有很多場景沒有解鎖。我們希望的是今年這個客戶解鎖了 5% 的場景,明年解鎖 50% 的場景。
激烈的大廠競争,差異化在哪
虎嗅:最近半年客戶的需求跟之前相比有什麽變化?
譚待:用得越來越深了。第一、從訓練逐漸向推理走。第二、從用開源自建,到直接使用豆包 MaaS 服務,這是一個很明顯趨勢。第三,從簡單的場景往更難的場景走,比如從簡單的 chatbot 到需要邏輯推理能力的生産力場景。
我們看到還有一些需要 multi model 或者 multi agent 來聯合來解決的複雜場景,明年對于複雜智能體場景,是一個關鍵時間點。
虎嗅:面對這些需求變化,2025 年的時候,雲廠商的競争格局會有什麽變化?
譚待:25 年肯定比 24 年競争更激烈。ToB 是細水長流,不像 toC 可能一年格局立刻發生巨大變化,ToB 則可能要七八年。但是你頭三年做的事情基本就決定了 8 年後的格局,它是這樣的,隻不過它的結果的呈現會更慢。
虎嗅:目前雲廠的差異點和壁壘在哪?
譚待:核心還是模型能力。
虎嗅:您認爲 2025 年的話,競争的差異點會發生變化嗎?
譚待:差異點還是這些。但是做的好壞的差别會更大,就是好的會更好,差的會更差。
有的公司不做基礎模型了,就做個小模型,在上面做很多事情,我覺得這樣從長期看不現實。他就回到以前的那個時代,就是有多少人工就有多少智能,而且上限是很低的。
虎嗅:您之前提到的差異點在于價格,現在對于價格有什麽新的思考嗎?
譚待:保持這個價格競争力就好了,保持住的核心不是爲了競争,是說這樣的價格是有助于企業和開發者基于大模型做好創新。其實我們不太關注競争這個事情,關注的是能不能讓業界都能用得起好的模型,快速地創新就會有好的想法湧不斷現出來,這個是最重要的事情。我覺得現在我們已經做到了。
後面更關鍵是在這樣的性價比的情況下,不斷把你的模型能力提升,這樣就一定會湧現出新的商業模式。最開始模型處理都是按 token 來收費對吧?但是你處理一個難的問題和一個簡單的問題,同一個 token 的價值是完全不一樣的。
另外,ToB 跟 ToC 不同,不存在先燒錢獲取市場,後續再靠其他收費的商業模式。我們做了大量的成本優化,來維持可持續的商業模式。另外一些廠商成本沒有優化下來,如果按照這樣的價格去對外服務的話,它是虧損的,是不可持續的。
虎嗅:這半年多咱們内部做了哪些事情去保持這種可持續的平衡?
譚待:本身模型結構上我們做了非常多的優化,seed 團隊最近有論文在講這個事情。工程上,把推理波峰和波谷不同負載的混合調度可能會省三到四倍。在推理架構上,将雲原生和 AI 原生結合在一起,去打造新的體系架構。比如做了 PD 分離。
虎嗅:現在國内外一些大廠的算力儲備已經到了十萬卡級别,咱們在這方面的儲備是怎麽樣的?
譚待:我隻能說我們 MaaS 的資源肯定是非常充足的。
虎嗅:三月份去矽谷有感受到國内外雲及 MaaS 的不同嗎?
譚待:海外有一個很好的軟件和 SaaS 的生态。所以它在整個 AI 的企業應用上,其實會更快一些。SaaS 廠商在裏面起到了一個很好的橋接的工作。就很多能力是 SaaS 先應用,之後自然企業就用上了。
國内其實沒有一個很強的 SaaS 和軟件生态,所以我們就得直接跟企業對接,來解決這個問題。
但是其實從移動互聯網開始,國内在應用創新的熱情和速度上,是很快的。比如,國内移動支付的跨越式發展。國内的 AI SaaS,雖然沒有基礎,但也意味着沒有負擔。所以也許這就像移動互聯網和移動支付一樣,能找到一條彎道超車的路。
(Tips:我是虎嗅科技醫療組的王欣,關注 AI 及創投領域,行業人士交流可加微信:13206438539,請注明身份。)