沒有哪個行業比互聯網更期待大模型,就像伯樂望眼欲穿下一匹千裏馬。
作爲新興技術和商業模式的代表,互聯網天然強依賴于新技術,新浪潮,互聯網企業總是走在最前線,并且快速将技術轉化爲産品和服務,互聯網投身其中,也受益其中。
過往曆史證明了互聯網善用新技術的正确性,PC 互聯網過渡到移動互聯網,通信網絡從 2G 到 5G,上網終端從電腦到手機,數字基礎設施從傳統 IT 到雲計算,盡管互聯網從來不是新技術的策源地,卻總是把新技術用得最好的行業。
大模型是勢能更大的新技術,互聯網行業絕不能錯過,尤其是在如今的行業形勢下,互聯網行業集體遭遇增長瓶頸,上一波技術浪潮帶來的紅利逐漸褪去,互聯網企業暴露在更嚴峻的外部環境中,大模型是互聯網行業能找到的最佳答案。
但這一次,互聯網企業面臨着截然不同的命題。由技術到商業的鏈條中,缺失了關鍵的 AI 算力一環,AI 算力不再像通用算力般垂手可得;同時大模型落地商業創新落地也要慎而又慎。互聯網行業開始重新思考,如何補全大模型應用化的版圖?
華爲雲的昇騰 AI 雲服務最近受到了很多的關注,筆者注意到,雲服務自身的叠代升級與大模型 AI 算力的雙重需求,正在重新定義互聯網行業所需要的雲服務。
互聯網企業,開始湧向華爲雲
過去二十年,互聯網有兩幅截然不同的「面孔」,兩種模樣交替呈現。一面是,互聯網幾乎是所有新技術的擁趸,不管技術如何更叠,互聯網總是能夠在舊技術上疊加新技術,電商、遊戲、視頻等新業态,歸根究底都是技術的應用化。
雲計算是互聯網企業的數字基礎設施,互聯網是原生于雲的一代企業,雲計算使得企業用更低的成本,實現更高的效率和靈活性,相較于非雲原生企業,互聯網企業總是能夠快人一步推出産品,互聯網雲服務商也成爲雲計算上半場的主導廠商。
一位雲廠商銷售線人士表示," 互聯網有點‘吃自助餐’的感覺,喜歡吃就吃,不喜歡吃就走,他們更注重效率和直接的資源交換。"
2019 年,華爲雲正式進軍互聯網賽道,當時華爲雲在互聯網行業聲勢不顯,互聯網企業基本已經采用了互聯網雲服務商的産品,華爲雲内部對這件事的定義是 " 虎口拔牙 ",華爲雲沒有互聯網雲服務商的資源,例如投資、流量等資源置換,隻能選擇用技術和服務打動客戶。
以某互聯網客戶爲例,該企業有互聯網巨頭的投資,并且早期全部使用了互聯網雲服務,但在後續服務過程中,互聯網雲服務商始終未能幫助客戶解決問題,該企業不得已求助了華爲雲,華爲雲僅用半天時間召集了研發人員并給出了解決方案,自此該互聯網企業全量遷移至華爲雲。
類似 " 虎口拔牙 " 的案例,在華爲雲看來稀松平常,這也是華爲雲能夠在本不占優的互聯網行業一步步站穩腳跟的重要原因。華爲雲的這種方式注定成效要來得要慢,但一旦達成合作,華爲雲便能持久地服務客戶。
從 2019 年到 2021 年,華爲雲開啓了漫長的行業攻堅戰,從 5G 商用,到多雲選擇,再到不斷升級的數據安全問題,互聯網開始越來越多地選擇更可靠的華爲雲,而華爲雲也從互聯網用雲的 others 選項變爲業務用雲的新選擇。
2021 年,無疑是互聯網的分水嶺,在經曆了 20 年的 " 高速增長 " 之後,中國互聯網企業大都經曆了市值縮水、營收增長放緩或減少的痛苦過程,但反觀,美國互聯網企業的市值,卻在繼續高歌猛進。學術界聲讨:" 核心技術的落後、互聯網企業出海難、對實體經濟的支撐力度不足是中國互聯網的短闆。"
一時間,中國互聯網開始從快速擴張向産業賦能轉型,然而,面向産業的互聯網是無法快速複制的,因爲每個行業都有專業知識設置的門檻,互聯網的賦能需要減速。簡單高效的消費互聯網模式和粗放的管理模式都需要作出改變。
此時,華爲雲敏銳察覺到了市場新的變化,面向互聯網提出:" 向實 "、 " 向新 "、" 向外 " 的新價值主張。一是互聯網創新方向回歸技術創新,将創新應用場景滲透至産業領域,賦能實體經濟;二是堅持硬核技術創新,提升企業可持續發展韌性;三是互聯網企業積極拓展全球化市場,将經驗傳遞全球市場從而獲得新增長。
即便沒有今天的大模型,互聯網行業也在慢慢向華爲雲遷移,把部分核心業務放在華爲雲上,獲得安全穩定的體驗以及新業務增長,尤其近兩年互聯網雲服務商故障頻發,互聯網企業首選的多雲服務商大多是華爲雲,華爲雲的品牌認知已經樹立。
大模型算力,重新定義雲服務
2023 年,OpenAI 開啓了大模型時代。大模型需要大算力,AI 算力對于雲服務的重塑,偶然之中透着必然,起到了 " 一力降十會 " 的效果,這「力」便是 AI 算力。
大規模預訓練模型需要大量的 AI 算力支持,用于處理海量的數據,進行大量的計算,以學習數據的内在規律和表現方式,這種訓練過程需要高性能的 AI 芯片和大規模的計算資源,才能快速、準确地完成模型的訓練。
現實是互聯網企業往往不具備搭建大規模算力集群的條件,首先是硬件投入巨大,如 GPU、TPU 等芯片價格昂貴,其次是技術門檻高,從硬件選型、系統架構設計、集群管理、性能優化等方面都需要專業的技術人員,此外還有數據的存儲、管理、傳輸,可擴展集群的性能穩定和效率,還有後續的運營和安全保障等方面,大模型訓練是一項複雜的系統工程。
雲服務商最大程度簡化了大模型算力集群的複雜操作,讓互聯網企業可以專注于大模型應用層,不過這并不意味着複雜度就此消失,而是雲服務商來解決大模型的硬件和軟件問題,目前區别大模型雲服務的核心之一,就在于有無可持續的 AI 算力供應。
不論是海外還是國内,都在試圖尋找替代英偉達 GPU 的方案。雲廠商 " 老大哥 "AWS 早就開始自研芯片,在近日舉辦的 re:Invent 大會上,AWS CEO Adam Selipsky 宣布了其下一代 Graviton 4 和 Trainium 2 芯片硬件,重點是滿足機器學習(ML)訓練和生成式人工智能(AI)的需求。
國内雲服務商也有所跟進,但程度卻遠不及 AWS,既有投入資源的局限,也有戰略意識不足的原因。受限于海外制裁等原因,華爲對于 AI 算力的投入要更早更堅決,當大模型的火熱,将 AI 算力提到了一個新的高度,華爲雲昇騰 AI 算力結合雲服務,已經成爲互聯網企業應用大模型的優選。
華爲在最底層構建了以鲲鵬和昇騰爲基礎的 AI 算力雲平台,以及異構計算架構 CANN、全場景 AI 框架昇思 MindSpore,AI 開發生産線 ModelArts 等,爲大模型開發和運行提供分布式并行加速,算子和編譯優化、集群級通信優化等關鍵能力。基于華爲的 AI 根技術,大模型訓練效能可以調優到業界主流 GPU 的 1.1 倍。
華爲雲昇騰 AI 雲服務的存在,使得國内互聯網企業有了英偉達之外的另一選擇,并且基于昇騰雲服務,華爲雲還提供了全套工具鏈,如大模型工程化套件,覆蓋了數據工程、模型開發和應用開發三大環節。相比傳統标注平台,華爲雲的數據工程套件專門爲 SFT 訓練提供了 Prompt 在線輔助撰寫功能,爲 RLHF 訓練提供了多人 Rank 在線标注和任務分撥功能。與離線對比,這兩種任務實測效率可提升 3 倍。
雲服務向底層芯片發展,既是雲服務商下一階段的入場券,也是關乎生存的生死線。
華爲做過的難事,到了兌現價值的時候
華爲之所以是一家令人尊敬的公司,因爲它不隻考慮商業利益的最大化,有些短期不可見到價值,甚至長期有可能沒有價值的事情,華爲也願意做。
好處是,當曆史的腳步恰好落在了某一點,華爲之前的積累便能發揮很大的作用。典型如昇騰 AI 雲服務,在很長一段時間,國内企業還抱有幻想,認爲 AI 算力會像通用算力一樣可得,隻需要站在巨人的肩膀上再創新,便能複制新的成功,可惜事不遂人願。
當技術披上了政治的外衣,華爲沒有就此屈服,而是攻向外界不敢不願解決的難題,從軟件工具鏈突破烏江天險,到 MetaERP 強渡大渡河,GaussDB 樹立全棧自主數據庫第一品牌,再到 " 不作詩,隻做事 " 的盤古大模型 3.0 的發布,盡皆如此。
這些産品和服務起初看起來似乎和互聯網關系不大,但互聯網行業的技術疊加,一定是朝着新的方向,而不是在已經翻爛的領域裏刷存在感,華爲雲提供了更多的可能性,而且是超前布局,在滿足了自身需求之後,将這些能力外化輸出。
中國雲計算行業發展十餘年,簡單的事情從來不缺人做,但由先發優勢和規模築就的壁壘,總會一點點被新的需求打破,典型如互聯網企業的用雲變化,互聯網企業早期關心的是有沒有雲服務,後來關注有沒有更好的選擇,現在互聯網企業更關注一朵雲能否長久地提供價值。
制約要素理論(Theory of Constraints)指出,任何一個複雜的系統,都會由少數幾個限制因素決定它呈現的結果,一旦找到這些少數限制因素甚至那個最核心的限制因素,就可以利用它來撬動整個系統。
當雲服務行至大模型時代,決定性要素便是 AI 算力雲服務,沒有 AI 算力的雲服務,一定會被淘汰,沒有持久供應的 AI 算力雲服務,也缺少未來的想象空間,互聯網行業用雲演進與大模型的需求重合,引導雲服務朝着新的方向進化。
互聯網行業到了更新技術棧的轉折點,華爲雲做的大量難事,也到了兌現價值的時候,不管互聯網企業向何處去,華爲雲總是在下一個轉角。
(本文首發钛媒體 APP)