如果大模型有信仰,那一定是 "Scaling Laws(規模法則)"。
所謂 "Scaling Laws",就是模型性能會随着參數、算力、數據集的規模增加而提高。時間來到 2024 年,大模型領域依舊是 "Scaling Laws" 的統治區。
人工智能時代爆炸式的數據增長,傳統 " 馬拉肩扛 " 的傳輸方式,存在易損壞、丢失的風險,也無法支持實時數據更新和交互,會直接影響到中國 AI 産業的先進性。對于攀爬 Scaling law 的中國 AI 産業來說,傳統網絡已經捉襟見肘,必須全面升級和重塑,更有效地支持大模型時代的聯接需求。
近日,紫光股份旗下新華三集團以 " × AI"(乘 AI)爲主題舉辦 2024 媒體與分析師溝通會,全新升級智算版數字大腦,并以全棧領先的靈犀智算解決方案,充分發揮新華三在算力和聯接領域的核心優勢,激發 " 算力 × 聯接 " 的乘數效應,讓算力更快、更強、更澎湃。
理念聽起來很美好,具體怎麽落地呢?網絡如何給算力做乘法?會後,腦極體采訪了新華三集團高級副總裁、網絡産品線總裁曾富貴,就承載靈犀大模型落地的新華三 AD-NET 7.0,及數據中心、園區、廣域三大場景的相關技術、産品與解決方案,展開了深度交流。在 AI 産業攀爬 Scaling law 的當下,我們不妨來看看,新華三雙 A 驅動的網絡,是如何帶攀登者們越過山丘的。
新華三集團高級副總裁、網絡産品線總裁 曾富貴
眺望 Scaling Laws 山峰
那是網絡升級的方向
數字化、智能化升級先升網,已經是一個常識。問題在于,究竟什麽是網絡的升級方向?
對此,曾富貴說過,網絡的先進性是技術問題,但是先進網絡的具體形态是用戶選擇的問題。
面向智算時代,AI 産業化和産業 AI 化所需要的網絡形态,已經被 "Scaling Laws" 法則所規定。
萬億參數,傳輸 " 費時 "。大模型的參數量巨大,需要傳輸大量的數據,傳統網絡無法滿足高帶寬需求,需要接入帶寬高達 400G 甚至達到 800G 的超大容量網絡。
萬卡集群,訓練 " 費力 "。AI 大模型并行計算模式,催生了新的大規模網絡架構,從千卡到萬卡集群,未來更新的 GPT 模型可能需要十萬卡、幾十萬卡支撐起來。而 AI 計算集群規模越大,通信量和複雜度越大,網絡設備的規模、端口數、光模塊的數量指數上升,傳統網絡面臨越來越明顯的傳輸效率瓶頸,一次通信延誤,會拖慢整個訓練過程,導緻整體計算集群效能低下、成本高昂。
萬裏部署,使用 " 費心 "。算力的分布式部署,全國一體化算網可以減少訓練推理成本,解決算力緊缺、算力貴的問題。但跨東西部的算力流動與調度,會受限于 " 聯接瓶頸 ",抖動、時延、較長的通信時間,都會讓用戶身心俱疲,甯可用硬盤坐高鐵送。
總而言之,在 AI 大模型場景和應用中,讓模型供應商、算力服務商、應用開發者及用戶不頭疼,輕松翻越 "Scaling Laws" 的網絡,就是先進網絡。幫助産業攀爬 Scaling Laws,新華三全新升級的 AD-NET 7.0,由 Application+AI 雙 A 驅動,如同一雙 " 風火輪 ",爲 AI 大模型向前發展注入澎湃動力,成爲一雙智算時代的 " 鞋履 "。
攀登者之力
雙 A 驅動網絡釋放澎湃算力
神話故事中,哪吒踩着一雙 " 風火輪 ",獲得了高速移動、自由馳騁的能力,極大地提高了戰鬥效率。對于攀爬 Scaling Laws 的 AI 産業者來說,新華三雙 A 驅動的網絡,正是一雙能夠釋放澎湃算力的加速 " 戰靴 "。
全新升級的 AD-NET 7.0,全面升級網絡聯接能力,構築行業智能底座,從三個方面,爲智算時代提供有力支撐:
1. 以網強算
AD-NET 7.0 提供的網絡基礎設施,爲 AI 模型的訓練提供高效算力支持,爲各種智能化服務提供按需的聯接服務保障。曾富貴強調,AI 賦能的網絡,對數據中心,要充分釋放大規模算力集群的潛力,讓算力增效;對園區,要讓最終客戶能夠随時随地接入算力,方便使用算力,滿足各類業務對算力的智快至簡體驗需求;對廣域網,要通過算力網絡不同規模、不同行業客戶都能享受算力建設帶來的數字紅利,實現業務智享的普惠型算力資源供給。
2. 以算提智
新華三端到端智算能力,不僅解決了 " 算力焦渴 ",還進一步結合過去 21 年積累的 ICT 運維領域知識和大量語料,融合打造出更懂行業運維需求的 AI 私域大模型——靈犀大模型。基于新華三在 ICT 領域的知識語料積累和上萬名網絡專家的專業經驗,利用充足的算力訓練和微調得到靈犀大模型,通過内置靈犀大模型升級 AD-NET 解決方案。
3. 以智增效
算力網絡變得複雜,靠人的普通管理是不行的,一定需要更強大、更高效的 AI 技術爲網絡提供 " 導航 "。爲了提升網絡的智能化水平,AD-NET 7.0 搭載了靈犀大模型,可以利用 AI 強大的創造力和交互能力,提升網絡管理效率。
曾富貴直言,很多東西說起來很容易,實現起來很難。我們希望通過靈犀大模型,加上硬件原生智能,讓整個網絡更高效。這個覆蓋面很大,目前我們在某些場景做了一些嘗試,取得突破。目前,新華三已經探索出了大模型在數據通信領域落地的幾個典型場景。
AI 可視:網絡設備與平台協同計算,對設備日志、流量模型應用等多維信息進行 AI 分析,實現貫穿應用和網絡基礎設施的信息洞察。
AI 調優:基于用戶業務提供最優配置建議,持續學習網絡狀态,提供自進化的有線無線網絡調優功能,體驗識别準确度達 92%。
AI 排障:基于海量網絡設備數據訓練結果,實現鏈路級、設備級、網絡級到應用級快速排障,覆蓋 90% 以上的網絡。
AI 安全:網安聯動,持續學習用戶網絡行爲,精準标識可疑用戶及可疑行爲,實現動态安全防護。
以應用爲牽引,以 AI 爲抓手," 雙 A 驅動 " 的新華三網絡和 AD-NET 7.0,成爲千行百業加速智能化的一雙 " 戰靴 ",提供澎湃的算力和動能。
越過山丘
從新華三網絡看見
智能中國的少年心氣
數字化、智能化是中國乃至全球經濟發展的重要趨勢,也是擺在中國社會面前的一道新題目。征服 Scaling Laws 的高峰,夯實智能中國的基礎,是一項龐大的系統工程,衆多 ICT 相關企業都參與其中。
作爲數字化解決方案領導者,新華三躬身入局智能新時代,激活了一種勇往直前的少年氣。雙 A 驅動的網絡升級,就是這種氣質的具象體現。
少年氣,就是天命在我,敢于擔起時代責任。
曾富貴提到,Application + Al Driven,既是趨勢也是使命。我們希望,新華三的網絡能夠爲後續算力的普惠化提供堅實的基礎,這既是新華三的技術趨勢,也是網絡的使命。
少年氣,就是學習能力強,始終沒有停下進步的腳步。
曾經,新華三網絡以應用(Application)爲中心單輪驅動,在 AI 時代他們進行了重新的賦能、升級和诠釋。經由靈犀大模型的全面融合,新華三網絡擁有了全面智慧。
少年氣,就是懷抱理想,爲護佑蒼生長出三頭六臂。
以對 AI 訓練最爲關鍵的智算中心爲例,AD-NET 7.0 引入了多種負載均衡技術。針對不同智算場景,提供最适合的負載均衡技術組合,讓每條鏈路都充分得到利用,提升智算中心算力規模和效率。
曾富貴介紹到,負載均衡之所以如此重要,是充分理解到傳統計算模型與智算的計算模型有巨大的差異, 智算中心的流量不同于互聯網流量,其存在單流流量大、整體流數量少、大量突發等特點,唯有通過智能化地負載均衡技術,将數據流量合理分散到不同鏈路上,才能保證無阻塞、不丢包,使智算中心得以順利完成計算需求。
此外,新華三通過多元的産品形态,支撐 AI 時代的網絡叠代。比如面向數據中心,提供了專爲 AI 而生的 S12500 AI 系列産品,爲 AI 模型的訓練提供高效算力聯接支持。面向廣域網,升級 400G 端口能力、将算力因子納入路由計算算法,提供服務化算力專線等,實現廣域算力傳送的全面優化。面向園區,全光 +Wi-Fi 7,爲基于 AI 的各種場景智慧化應用提供了最後一跳的高質量接入體驗。
和新華三一樣,中國 AI 産業及千行萬企,也都勇敢踏上了智能時代的創新旅程。縱然攀爬 Scaling Laws 充滿艱難,但越過山丘後的智能中國,也格外讓人心馳神往。
對智能攀登者來說,新華三雙 A 驅動的網絡,是承載數據要素的路,是加速釋放算力價值的 " 風火輪 ",也是一同走過山高水遠的同路人。
越過山丘的智能中國,恰似少年遊。