技術創新的節點性時刻,往往是以基建變革的形式展現。
現在,中國 AI 頭号玩家百度,再次明确複現了這一規律:
AI 大底座,已正式對外推出。
就在剛剛結束的百度 AI 開發者大會上,李彥宏判斷,深度學習算法是第四次科技革命的标志。
并且 " 創新驅動增長,反饋驅動創新 ",這種技術力量向産業蔓延的過程中,真正的應用創新要靠在産業實際應用中的 " 反饋 " 才能實現。
△百度創始人、董事長兼首席執行官李彥宏
而集百度 AI 能力之大成的 AI 大底座,正是百度交出的答卷。
什麼是 AI 大底座?
可以這樣理解:這一基礎設施涵蓋從芯片、框架,到大模型、應用的 AI 發展全要素。等于是把大數據、大算力、大模型集結到了同一個體系結構當中。
相比于傳統雲服務,可以說是全面 "AI 化 ",把計算跟智能更緊密地綁定在了一起。
百度此舉,如何解讀?又具體印證了怎樣的技術大勢?
我們照例一層層拆解來看。
AI 大底座如何構成?
還是先來看看 AI 大底座的完整構成。
具體分為兩層:
基礎架構 AI IaaS 層:最核心的組成部分是提供 AI 算力支持的芯片。在百度 AI 大底座中,核心芯片包括百度自研的 AI 芯片昆侖芯,以及太行 DPU等。
應用平台 AI PaaS 層:整合百度 AI 兩大王牌飛槳深度學習框架和百度文心大模型,能夠實現從數據存儲,到 AI 模型訓練、生産、部署、測試的全鍊路、批量化生産。
從架構上來看,AI 大底座既在底層的 AI 計算、存儲、加速、容器方面進行了系統優化和産品自研,也在更高層的 AI 開發、模型供給能力方面,釋出了百度長期積累的 AI 技術優勢。
更值得關注的是,由于百度在全要素上都實現了核心産品自研,集大成的 AI 大底座各層之間深度耦合,使得端到端的整合優化成為可能。
基于這樣的架構,AI 應用開發的模式不再是手工作坊式的 " 一項目一訓練 ",需要耗費大量數據标注成本和人工調優成本,而是更像流水線工廠:
AI 底層技術被抽象出來,形成了通用化、模塊化的平台套件,企業隻需要按照實際業務需求 " 搭積木 "。
AI 大底座有何用?
這樣一種基礎設施的形式,能帶來什麼新價值?
核心還是與産業升級最本質的需求有關,即降本增效。
結合實際案例來看。理想汽車和百度智能雲合作,基于百度 AI 大底座,構建了用于自動駕駛研發的 " 理想汽車智能雲 "。
理想的需求在于,随着自動駕駛研發的深入,其所面對的業務場景越來越龐大、複雜;并且随着智能汽車出貨量越來越多,很多車載數據要回傳進一步再訓練,其中涉及到複雜的 AI 開發應用環節,對算力、模型泛化能力的要求也很高。
于是,百度 AI 大底座一方面為其提供了完整的開發應用工具鍊,涵蓋數據采集标注、數據閉環、模型開發、雲仿真等 AI 開發環節,讓理想可以不用花費額外的時間精力,考慮資源調度、訓練性能、模型部署驗證等問題。
另一方面,在百度 AI 大底座的體系之中,應用落地過程中出現的模型效果問題,能夠在深度學習框架的支持之下,快速驅動叠代新的模型結構;同時當上層應用對底層芯片算力提出新的要求,也能夠迅速得到反饋調整。
通過這樣端到端的優化,AI 大底座使自動駕駛常用的算子訓練和推理速度平均提升了 100%,同時使研發叠代效率提升了 100%。
從這個案例中可以看出,企業做智能化、做 AI 開發的核心痛點包括兩方面:
其一,基礎設施構建需要花費大量時間精力。尤其在智能計算占比加重的情況下,芯片、框架、模型、應用各個環節,都需要大規模投入和長期技術積累。
其二,所構建的基礎設施如果不能從底層硬件到上層應用深度耦合,就會影響 AI 開發的實際效率和叠代速度。
而 AI 大底座作為一個全棧融合的智算基礎設施,憑借其全要素、端到端優化的特點,在滿足産業對基礎設施的最新需求的同時,恰恰能解決智能化過程中資源效能和模型效能的瓶頸問題。
此外,上層文心大模型的引入,還驅動 AI 大底座形成了平台化的反饋閉環機制。
簡單來說,就是産業應用中産生的新知識和經驗,還能不斷被用來再訓練大模型,讓 AI 實現 " 自我升級 ",以适應不同的業務環境。
國網福建,就已受益于這一機制。
為了解決複雜自然環境中的設備巡檢等業務問題,國網福建同樣選擇了智能化升級。
他們遇到的一個問題是,雖然攝像頭、無人機等設備可以充當巡檢人員的 " 眼睛 ",替人進入到複雜、危險環境中回傳數據,再靠 AI 來輔助判斷安全隐患、瑕疵點。但實際上,自然界的陽光、雲彩、光線、植被,任何一點變化都可能給數據帶來新的噪音,影響模型的準确率。
另外,國網是一個大集團,底下各個分公司面對的自然環境都不一樣,因此通用模型落實到本地,效果往往不盡如人意。
國網福建的最新解決方案,是依托于百度 AI 大底座,打造了一個電力大模型。
這個電力大模型每到一處,通過吸收少量當地樣本信息進行微調,就能快速适應當地需求。同時,微調的過程又會被反饋到通用大模型本體當中,進一步加強通用大模型的泛化能力。
數據顯示,這種 AI 自我升級能力的引入,使得電網巡檢場景中安全隐患識别率提升了 30%,識别效率提升了 5 倍。
AI 大底座,為什麼是現在?
簡單總結起來,百度 AI 大底座,從技術的角度來看,就是百度 AI 技術的集大成者。從産業價值的角度來看,則是以集中力量辦大事的方式,解決了産業升級當前面臨的痛點問題。
但,為什麼是現在?
當 ChatGPT 為首的一衆大模型,在 2022 年裡掀起一波又一波 AIGC 的狂歡。
在更靠近實際應用的産業側,新一輪技術沖擊也正在引爆各行各業對 AI 應用的需求增長。
無論是理想的案例,還是國家電網的案例,本質上看,這一輪基礎設施之變,實際上就是圍繞智能之變。
這一點,在數據上亦有反饋。IDC 最新報告就預測,2022 年,中國 AI 公有雲服務市場規模将達到 74.6 億人民币。相較于 2021 年的 44.1 億元人民币,增長了近 41%。
所以,為什麼百度選擇在此時推出 AI 大底座,第一重答案,就是時代所需,大勢所至。
如果說基礎雲計算,加速了企業數據、業務電子化、數字化的進程,那麼當 AI 開始更深層次地被嵌入到企業發展的鍊路之中,新一代 AI 基礎設施的推出就變得勢在必行。
百度集團副總裁侯震宇也坦承:
AI 大底座正是應經濟加速智能化的大潮流而生。
△百度集團副總裁侯震宇
而盡管在通用雲産品上,百度智能雲更多扮演的是 " 追趕者 " 的角色,但其與 AI 的淵源,卻是時間跨度最長的。
有不少行業分析認為,百度智能雲從誕生起就是百度 AI 技術的輸出窗口,可以說從出生起就是一朵打着 AI 标簽的雲。
這就是第二重答案:在 AI+Cloud 這一方向上,百度具有 " 人無我有 " 的技術優勢和經驗積累。
AI 領域出身的玩家,在底層芯片和系統能力上往往欠缺經驗。而有着深厚底層設施基礎的廠商,在上層 AI 軟件能力上,又缺少豐富的落地案例積累。
從這個層面上來說,在芯片、深度學習框架、大模型、産業應用各個環節都有自研基礎,且已積累豐富落地經驗的,百度算得上是獨一家:
芯片方面,2011 年,百度就啟動了自研 FPGA AI 加速器項目。2017 年,已經有超過 1.2 萬片 FPGA 在百度業務體系中被部署。
2018 年,百度更是發布了自主研發的 AI 芯片昆侖芯。2020 年,第一代昆侖芯開始大規模部署。目前,這顆芯片已經落地超過 2 萬片,并且被廣泛應用在百度搜索和自動駕駛等領域,同時服務 50 多家外部客戶,是國内為數不多真正經受過大規模算法考驗的芯片。
框架方面,百度飛槳是國内最早啟動研發的自研深度學習框架。2016 年開源至今,已凝聚 406 萬開發者,服務過 15.7 萬企事業單位,開發模型達 47.6 萬個。
根據 IDC 報告,截至 2021 年上半年,TensorFLow、PyTorch 以及百度飛槳成為國内最高頻使用的開源框架。
大模型方面,百度文心大模型是基于百度逾 10 年的 AI 技術積累,和 20 年來産品業務沉澱下的用戶真實需求打造。從 2019 年 ERNIE 1.0 發布算起,文心大模型在公開權威語義評測中已斬獲十餘項世界冠軍。
基于文心大模型,百度目前已發布 11 個行業大模型,大模型總量達 36 個,已構成業界規模最大的産業大模型體系。目前已大規模應用于搜索、信息流等互聯網産品,并在工業、能源、金融、汽車、通信、媒體、教育等各行業落地應用。
這些技術布局,往往始于技術微末之時,甚至被冠以 " 燒錢 " 的字眼。
但也正是十年飲冰的堅持投入,使得百度 AI 大底座成為了行業内首個全棧自研的智算基礎設施。
又正是長期技術積累帶來的全棧自研能力,給行業和百度本身,都帶來了更深遠的影響。
對于行業而言,一個全要素、端到端的基礎設施,實際是在 AI 應用密度越來越高、需求計算量越來越大的情況下,把高門檻技術以低門檻方式輸出實現,同時還使得更高性價比成為可能。
用百度自己的話說,是:
别人用 100 張卡來做的事,我們用五六十張就能解決。
百度 AI 大底座可提升千卡并行加速比至 90% 以上,訓練場景資源利用率 70% 以上,模型開發叠代效率提升 100% 以上。
這一點,還更為具象化地體現在了百度首次對外開放的陽泉智算中心上。
這一智算中心是目前已建成的亞洲最大單體智算中心,具備 4EFLOPS 的算力,千卡加速比達到 90%,異構資源利用率超過 70%。
在綠色節能方面,其 PUE 值(電能使用效率)低至 1.08。這意味着百度一家企業一年節省的電量等于德國一個中型城市全年用電量。因節能而節省的成本,随着智算中心的對外開放,也将投射到客戶的成本節約上。
注:PUE= 數據中心總能耗 /IT 設備能耗,越接近 1 表明能效水平越好。
這也就意味着,未來能參與到智能化升級進程中的企業,将不止于實力更為強勁的産業頭部企業,更多中小企業亦将為前沿科技所輻射。
而對于百度而言,自主可控本身亦是更深層次社會價值的體現。
技術的創新,驅動着基建的變革,又通過新一代基礎設施的種種特征,更為清晰地被标注在産業應用之中,切切實實地影響着産業智能化轉型的節奏和發展速度。
背後科技自立的價值,不言而喻。
是以,時候到了。
△百度集團執行副總裁、百度智能雲事業群總裁沈抖
并且就如百度集團執行副總裁、百度智能雲事業群總裁沈抖所分享的那樣:
智能化為行業創造價值的浪潮才剛剛開始。
— 完 —
點這裡關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~