過去的一兩年見證了 AI 給商業世界帶來的劇變。自 " 殺手級 " 應用 ChatGPT 橫空出世," 百模大戰 " 在國内外紛紛上演,衆多垂直領域的 AI 應用百花齊放,專精特新企業們也正在新一輪的發展機遇中搶先布局。
值得關注的是,AI 的發展導緻算力的需求應聲高漲,這爲不少中小企業帶來了挑戰。據中信建投推算,未來 5 年全球大模型在訓練端、推理端的峰值的算力需求,年複合增長率分别有望達到 78.0% 和 113%。當競争日趨激烈,AI 算力已然成爲了一種新基建,而掌握 AI 算力的專精特新企業,才是掌握了面向未來的 " 新生産力 "。
2023 年 11 月 22 日,36 氪聯合聯想舉辦" 專精特新下半場:AI 算力驅動競争力升級 "線上直播,測測集團創始人 &CEO 任永亮、北京華恒盛世科技有限公司副總經理王文星、UCloud 優刻得服務器中心及 AI 算力負責人丁振雷受邀做客 36 氪 " 專精時氪 " 直播間。三位嘉賓結合自身經曆及企業實踐,分享了對于 AI 算力話題的相關見解和衆多精彩案例,以下爲對話精華總結。
重新定義:AI 塑造全新商業世界
近日,OpenAI 的高層變動被廣泛報道,僅是一家公司的内部事務就毫不費力收割了社會集中關注。不難看出,以 ChatGPT 爲代表的生成式人工智能對世界産生了多大的影響,AI 已經是現代企業的一門必修課。在整個市場爆發的背後,一些值得關注的趨勢正在顯現。
測測集團創始人 &CEO 任永亮總結說,誕生于應用端的算力需求激增,各種類型公司的算力需求都十分普遍。一方面是志在必得的大廠,他們已經在 AI 上有了多年的大量投入。另一方面是虎視眈眈的中型公司,他們在某些領域站穩了腳跟,期待借助大模型競争來縮小與頭部玩家的差距。還有更多如履薄冰的創業型公司,有了 AI 的加成,他們在更多細分領域看到了機會,但又擔心無法回避的算力成本将成爲阻礙自身在 AI 時代發展的瓶頸。
可以明确的是,這些對于 AI 算力的需求也正不斷地對基礎設施層提出更高的要求,無論是在算力本身,還是算法和數據上,需求的量級呈現了指數級的變化。
UCloud 優刻得服務器中心及 AI 算力負責人丁振雷就變化進行了 4 個方面的總結。第一,需求普遍從通用算力發展到智能算力;第二,高端芯片需求增加,某些場景對于單卡算力和顯存的要求大大提升;第三,顯卡互聯需求開始增加。過去,單卡就能滿足大部分需求,但這在今天已經行不通了,而單機多卡、多機互聯就需要大流量的互聯能力;第四,對于存儲吞吐量的要求變得非常高。
爲了支撐上述變化,底層的基礎設施也正在發生不小的改變。
北京華恒盛世科技有限公司副總經理王文星指出,算力、調度和服務是 AI 基礎設施值得關注的三個方面。第一,從算力來說,我們需要來自 GPU 芯片更大算力和更大規模的算力集群。第二,從調度層面來說,爲了實現集群算力的利用率最大化,我們需要更高效的調度能力。第三,在算力服務方面,模型都訓練好之後,我們要爲用戶提供更流暢、更穩定、更可靠的算力服務和模型服務。
随着更多企業将 AI 當作核心業務來發展,AI 技術來到戰略轉型期,算力逐漸成爲尤爲關鍵的底層基建。
穩紮穩打:AI 算力成爲企業 " 新基建 "
對于早期企業來說,基座型公司提供的 AI 基礎設施服務就能滿足大部分需求。但随着業務發展,如果想取得更好的效果,就需要在 AI 模型上有更深、更定制化的能力。于是,越來越多企業開始圍繞 AI 來布局自己的 " 新基建 "。
測測集團創始人 &CEO 任永亮分享了心理服務行業與 AI 結合後帶來的改變。過去,心理服務業面臨供給瓶頸,一個心理服務者一次隻能服務一個人。但有了 AI,更多人就能以更少的成本體驗到優質的心理服務。特别是對泛心理行業而言,AI 有可能打破供給瓶頸,幫助企業實現新的增量。
從測測的經驗來看,在實際情況下,企業評估算力需求時不僅要讓算力規模與企業的數據積累、算法能力相匹配,還要讓它和企業的商業化進度相适應。
關于算力成本,北京華恒盛世科技有限公司副總經理王文星認爲尤其要關注兩個方面。首先是采購 GPU 的成本,這部分的成本相對較高。其次是模型訓練和推理的成本,在不同 AI 應用中,這兩方面的需求量存在差異。企業要根據自身需求進行合理投入,重視關鍵環節的成本控制。
從成本及可行性考量," 超高性能 " 并非大多數專精特新企業的最優解,找到最适合自己的算力解決方案才會真正地行之有效。
UCloud 優刻得服務器中心及 AI 算力負責人丁振雷就基礎設施的标準展開了探讨。首先,基礎設施框架是統一的,這包含數據中心、算力集群與網絡集群、平台和調度層以及配套的産品應用層。而什麽是好的算力基礎設施?首要标準是與企業自己的需求場景匹配,其次就是使算力利用率最大化。
除了基礎設施,想要提升 AI 應用的競争力,高質量的數據采集和訓練必不可少。一方面,要以最高标準在企業需求和數據安全之間找到平衡。另外,數據質量也尤爲重要,在數據可靠性、分布和維度等方面,企業往往需要不小的投入。
部署未來:持續釋放 AI 的商業想象
當 AI 大模型發展到一定程度,它也正潛移默化地定義着未來的商業趨勢。
首先,AI 算力的供給在未來将會有更多種形式。UCloud 優刻得服務器中心及 AI 算力負責人丁振雷分析說,第一,我們能期待國産 GPU 快速崛起,這有賴于國内 AI 生态的玩家共同努力。第二,對于中小企業而言,除了直接購買或租賃 GPU 資源、使用公有雲,直接調用大模型廠商的 API 也是性價比不錯的選擇。
未來的理想結果是,企業和用戶不用擔心搶不到 GPU、算力成本高等問題,隻需把精力放在應用上。從交付形态上來說,最好是算力服務商能夠提供 " 開箱即用 " 的産品,就比如現在常說的 MaaS(Model as a Service,模型即服務)。
在持續釋放 AI 的商業想象的過程中,北京華恒盛世科技有限公司副總經理王文星認爲,我們仍有一些方面需要繼續提升。第一,更開放的共享環境,各家的數據集隻有流動起來才能創造更大的勢能。第二,更高效的算力調度,把空閑的存儲和算力資源有效地整合且再分配。第三,前瞻性的節能布局,把數據中心的能耗降下來,打造 " 綠色算力 ",這些都将是企業未來的必修課。
如今,國内的 AI 應用生态龐大而活躍,這反向促生了比國外更繁雜的算力生态布局,包含軟硬件、算力中心、數據中心等等環節。如果能高效融合繁雜的國内生态,讓用戶用上便捷、便宜的算力資源,中國的 AI 勢力就還有不少領先全球市場的機會,而這也是許多專精特新中小企業不容錯過的時代機遇。
" 專精特新下半場:AI 算力驅動競争力升級 " 直播由聯想冠名贊助播出。聯想百應,爲全國中小企業提供針對性服務方案,加速中小企業成長。更有聯想初創企業星辰計劃,立足全鏈路産品及生态,提供一站式、多維度、高品質的創新創業服務,設立至高 15 萬元專項數字化扶持基金,支持初創企業加速數智化,與創業者雙向賦能,共赢 AI 時代。
編輯丨黃雅蓉