目前,AI 技術潛力并沒有完全釋放出來,去年僅 10% 的企業推出生成式 AI 方案。
作者|林志佳
編輯|胡潤峰
本文首發钛媒體 APP
北京時間 4 月 10 日淩晨,美國亞利桑那州 Intel Vision 2024 會議上,芯片巨頭英特爾(Intel)發布性能最強的新一代 Gaudi3 AI 加速芯片,以及全新的下一代英特爾至強 6 處理器等産品。
其中,英特爾 Gaudi 3 AI 芯片采用台積電 5nm 工藝,支持 128GB HBMe2 内存。相比上代産品,英特爾 Gaudi 3 帶來 4 倍(400%)的 BF16 AI 計算能力提升,1.5 倍的内存帶寬以及 2 倍的網絡帶寬提升。同時,在 AI 模型算力中,相比于英偉達 H100 GPU,Gaudi3 AI 芯片的模型訓練速度、推理速度分别提升 40% 和 50%,平均性能提高 50%,能效平均提高 40%,而成本僅爲 H100 的一小部分。
英特爾預計,Gaudi 3 将于 2024 年第二季度起出貨,戴爾、惠普、聯想、超微電腦等企業将成爲首批客戶。
與此同時,今晨舉行的谷歌雲年度大會 Cloud Next 2024 上宣布推出一款基于 ARM 架構的服務器芯片 Axion,其性能比通用 ARM 芯片高 30%,比英特爾生産的 x86 最新芯片性能提高 50%。谷歌旨在減少對英特爾和 AMD x86 芯片的依賴。
全球圍繞 AI 算力戰争已經拉開帷幕。
" 現在的半導體競争是一場産業戰争,也是一場全面的國家戰争。" 韓國總統尹錫悅 4 月 9 日宣布該國全面押注 AI 半導體發展,投入 9.4 萬億韓元(約合 500 億元人民币),以幫助韓國成爲與中國、美國并駕齊驅的全球三大 AI 半導體國家之一。
英特爾突襲英偉達 H100
新 AI 芯片訓練快 40%,推理快 50%
就在深夜,英特爾 CEO 帕特 · 基辛格(Pat Gelsinger)手舞足蹈地亮出了最新 AI 芯片—— Gaudi3。
新一代 Gaudi 3 AI 加速器專爲高性能、高效率的生成式 AI 計算而構建,每個加速器都具有獨特的異構計算引擎,由 64 個 AI 定制和可編程 TPC 和 8 個 MME 組成,每個 Gaudi 3 MME 都能夠執行 64000 個并行運算,支持 128 GB HBMe2 内存容量、3.7 TB 内存帶寬和 96 MB 闆載靜态随機存取内存 ( SRAM ) 。
同時,每個 Gaudi 3 當中都集成 24 個 200 Gb 以太網端口,提供靈活且開放标準的網絡。而 Gaudi 3 的 PCIe 功率爲 600w,帶寬爲每秒 3.7TB。
性能方面,模型訓練層面,Gaudi3 比英偉達 H100 快 40%;推理層面 Gaudi3 比英偉達 H100 快 50%。即便相比最新英偉達 H200,Gaudi3 AI 芯片的推理速度竟然也提升了高達 30%。
實際上,随着 ChatGPT 爆火,AI 模型、數據、算力基礎設施成爲生成式 AI 技術發展的三大要素。
據 Gartner 數據顯示,2024 年,企業在生成式 AI 方向上預期支出達 400 億美元,到 2027 年這一數據增至 1510 億美元。與此同時,到 2026 年,企業對生成式 AI 使用程度達 80%,同時至少有 50% 的邊緣計算部署将與 AI、機器學習(ML)等方向有關。
然而,AI 技術的全部潛力并沒有完全釋放出來。僅 10% 的企業組織去年推出面向生産的生成式 AI 方案;同時,有 46% 的的專家指出,基礎設施是将大模型産品化的最大挑戰。
因此,英特爾希望能夠利用長期的 AI 技術積累,通過開放生态系統的力量,乘上 AI 熱潮。與英偉達部分類似,英特爾也将提供一整套 AI 算力基礎設施方案,從而 " 解鎖 " 企業 AI,推動生成式 AI 的廣泛應用和快速商業化,有望幫助企業應對 AI 項目時所面臨的挑戰。
基辛格在會上表示,到 2030 年,半導體市場規模将達 1 萬億美元,而 AI 是其中的主要推動力。
從整體路線圖來看,AI PC、Edge AI(邊緣)、Data Center AI(數據中心)将成爲英特爾三大重要的計算生态系統,比英偉達覆蓋面積更廣,加上其開放、可擴展的軟件和算法特性,廣泛适用于多個 AI 領域,從而推動英特爾持續爲企業客戶打造全新 AI 方案。
具體到技術産品層面,除了英特爾 Gaudi3 之外,此次開幕活動上還公布了其他四個方向的重要進展:
1、全新英特爾至強 6 處理器品牌,應用于數據中心、雲和邊緣場景。
其中,與第二代至強處理器相比,配備能效核(此前代号爲 Sierra Forest)的全新至強 6 處理器每瓦性能提高 2.4 倍,機架密度提高 2.7 倍,客戶能以近 3:1 的比例替換舊系統,大幅降低能耗,預計将于 2024 年第二季度推出;而配備性能核的英特爾至強 6 處理器,可将下一個令牌(token)的延遲時間最多縮短 6.5 倍,能運行 700 億參數的 Llama2 模型,預計不久後推出。
2、預覽下一代英特爾酷睿 Ultra 處理器。英特爾宣布将推出下一代酷睿 Ultra 客戶端處理器家族(代号 Lunar Lake),将具備超過 100 TOPS 平台算力,以及在神經網絡處理單元(NPU)上帶來超過 46 TOPS 的算力,從而爲下一代 AI PC 提供強大支持。據悉,英特爾預計将于 2024 年出貨 4000 萬台 AI PC 設備。
3、面向網絡互連層面的新品部署。與 NVLink 一樣重要,通過超以太網聯盟(UEC),英特爾公布面向 AI 高速互聯技術(AI Fabrics)開放技術的以太網解決方案,利用高速互聯技術支持 AI 模型訓練和推理,産品組合包括英特爾 AI 網絡連接卡(AI NIC)、集成到 XPU 的 AI 連接芯粒(Chiplet)、基于 Gaudi 加速器的系統,以及一系列面向英特爾代工的 AI 互聯軟硬件參考設計。
4、全面更新的邊緣計算和 Tiber 業務組合。英特爾還發布新的 Edge 芯片産品,包括酷睿 TM Ultra、酷睿 TM、淩動處理器以及面向 Edge 的英特爾 ArcTM GPU,預計所有新品将于本季度上市,應用于包括零售、工業制造、醫療保健等關鍵領域,并将于今年獲得英特爾 Tiber 邊緣平台的支持。另外,英特爾還發布 Tiber 業務解決方案組合,以簡化企業對生成式 AI 軟件服務的部署工作,預計 Tiber 方案将于今年第三季度全面推出。
英特爾披露,截至目前,英特爾邊緣計算處理器銷量達 2 億塊,已邊緣部署超過 9 萬個解決方案。
另外,英特爾還宣布聯合 Hugging Face、RedHat、SAP、VMware 等 15 家公司,将共同創建一個開放、多供應商的生成式 AI 系統平台,通過 RAG(檢索增強生成)技術,提供運行大量現存專有數據源得到增強版開放大模型。
英特爾強調,公司不僅将提供包括硬件、軟件、框架和工具,而且希望設備制造商、數據庫提供商、系統集成商、軟件和服務提供商等參與其中,推動英特爾 AI 開放生态系統的構建,以及将生成式 AI 技術進行場景落地。
總體來說,基于英特爾 5nm Gaudi3 AI 芯片,以及至強 6 處理器和軟件棧,該公司正逐步構建 AI 領域的算力基礎設施生态,全面挑戰英偉達以及現有 AI 芯片市場格局。
英特爾方面去年 7 月對钛媒體 App 表示,市場需要替代品。客戶非常歡迎英特爾 Gaudi 方案在向大衆部署 AI 方面發揮重要的領導作用。" 幾十年來,英特爾一直緻力于把新的技術普及、普惠到各行各業。通過降低進入門檻,提高市場參與度,從而加快創新速度。"
基辛格在會上強調," 創新技術正在以前所未有的速度發展,每家公司都在加速成爲 AI 公司,這一切都需要半導體技術提供支持。從 PC 到數據中心再到邊緣,英特爾正在讓 AI 走進千行百業。"
爲減少對英偉達依賴
谷歌推出 ARM 服務器芯片
與微軟、亞馬遜一樣,谷歌也推出了多款自研芯片,以減少對英偉達 GPU 芯片的依賴。
美東時間 4 月 9 日周二,谷歌在今年的年度雲計算大會 Cloud Next 2024 上宣布推出一款基于 Arm 架構的數據中心芯片 Google Axion,以及更新 TPU v5p 芯片。
谷歌表示表示,Google Axion 處理器基于 Arm Neoverse V2 CPU 構建,以 Titanium 爲基礎,性能比通用 ARM 芯片高 30%,而且比英特爾生産的當前一代 x86 芯片高 50%。預計 Axion 用于多種谷歌服務,并在 " 今年晚些時候 " 向公衆開放。
谷歌雲副總裁兼計算和機器學習基礎設施總經理 Mark Lohmeyer 表示:" 我們正在讓客戶輕松地将現有工作負載轉移到 ARM。Axion 建立在開放基礎之上,在任何地方使用 ARM 的客戶都可以輕松采用 Axion,而無需重新架構或重新編寫應用程序。"
" 谷歌推出的新型 Axion CPU 标志着交付定制芯片的一個重要裏程碑,該芯片針對谷歌的基礎設施進行了優化,并構建在我們的高性能 Arm Neoverse V2 平台上。數十年的生态系統投資,再加上 Google 的持續創新和開源軟件貢獻,确保爲在各地運行 Arm 的客戶最重要的工作負載提供最佳體驗。"Arm 首席執行官 Rene Haas 表示。
事實上,Axion 隻是衆多定制發一份芯片中的最新産品。自 2015 年以來,谷歌已經發布了五代張量處理單元(TPU);同時,2018 年,谷歌發布了第一個視頻編碼單元 ( VCU ) ,視頻轉碼效率提高了 33 倍;另外,2021 年,谷歌通過投資 " 片上系統 " ( SoC ) 設計,加大了定制計算的投入,并發布了用于移動設備的三代 Tensor 芯片中的第一款。
如今,谷歌推出新的芯片意味着,該公司正在追趕亞馬遜和微軟這些雲領域競争對手的步伐。亞馬遜和微軟 2021 年就已經推出 Arm 架構的 CPU,作爲提供差異化計算服務的一種方式。而谷歌之前爲 YouTube、AI 及其智能手機推出過定制芯片,但還沒有打造過 CPU。
具體來說,Axion 将适用于一系列任務,包括支持谷歌的搜索引擎和 AI 相關的工作。谷歌表示,該芯片可以通過幫助處理大量數據并爲數十億用戶部署服務,在 AI 領域發揮重要的支持作用。同時,未來谷歌逐步轉移到基于 Arm 雲服務器用例上使用,Datadog、Elastic、OpenX 和 Snap 都計劃采用 Axion。
除了 Axion 之外,谷歌還宣布全面推出 TPU v5p,用于訓練和推理的最強大、可擴展且靈活的 AI 加速器,其計算能力是上一代的 4 倍(400%)。
谷歌 CEO 桑達爾 · 皮查伊表示,生成式 AI 的進步需要強大的底層基礎設施。谷歌 AI 超級計算機結合了我們的 TPU、GPU、AI 軟件等,爲訓練和服務模型提供性能和成本優勢。如今,領先 AI 公司和 Google Cloud 客戶(例如 Anthropic、AI21 Labs、Contextual AI、Essential AI 和 Mistral AI)正在使用其基礎設施。
數據顯示,雖然廣告依然是谷歌最大收入源,但雲計算的增長更快,在谷歌的收入中占比不斷提高,已接近占公司總收入的 11%。據 Gartner 估算,2022 年,谷歌占雲基礎設施市場 7.5% 的份額,而亞馬遜和微軟合計控制着 62% 左右的份額。
谷歌表示,現在已經有超過 90% 的 AI 獨角獸企業在使用谷歌的計算資源、模型和開發環境。
如今,谷歌成爲繼微軟和亞馬遜之後,第三家用 ARM 架構推出數據中心 CPU 的科技巨頭,這顯示了新的趨勢。而且,谷歌還利用 TPU 優勢,全面提供服務器和數據中心閉環服務,降低英偉達、英特爾、AMD 芯片的依賴。
有評論稱,谷歌開發新芯片是在 AI 競賽白熱化之際減少對外部廠商的依賴。不過,谷歌的官員并沒有将芯片新品視爲一種競争之舉。谷歌負責自研芯片業務的副總 Amin Vahdat 說:" 我覺得這是做大蛋糕的基礎。"
從整體來說,Google Next 2024 上展現了整個谷歌雲構建的 AI 開放和垂直優化技術棧。
AI Hypercomputer (算力層):TPU v5,Axion,2025 年将上線的英偉達 Blackwell GB200,以及新增 A3 Mega 計算單元。
Gemini Models(模型層):今天谷歌正式開發 Gemini 1.5 Pro API,新增語音模态理解能力、文件訪問 API、系統指令以及 JSON 模式等功能。
Vertex AI(容器環境層):最方便的 AI 應用開發和運行環境,集成了除 OpenAI 之外的所有模型,方便調用、微調和各種開發測試。
應用層:谷歌提供 Gemini for Cloud、Workspace & Agent 等産品組合中,即 Gemini AI 産品将全面集成到 Cloud 與 Workspace 兩大産品線,而且還預開發了一堆 AI Agent(代理),支持客服、雇員、創意、代碼、數據、安全代理等等。
英偉達真的危險了嗎?
黃仁勳:依然很穩
那麽,前有谷歌、微軟、亞馬遜 " 造芯 ",後有英特爾 " 彎道超車 ",英偉達真的危險了嗎?
2023 年 12 月初,AMD 高調推出了 MI300 系列産品。據介紹,MI300X 芯片擁有超過 1500 億個晶體管,内存密度是目前英偉達 H100 的 2.4 倍,内存帶寬是其 1.6 倍。AMD 首席執行官蘇姿豐稱,這款新芯片在訓練 AI 軟件的能力方面與英偉達的 H100 相當,并且在推理方面表現得更好,不過這一說法也未得到獨立驗證。
今年 3 月底,英偉達正式發布了新一代人工智能計算芯片 B200。英偉達 CEO 黃仁勳表示,B200 GPU 的 AI 運算性能在 FP8 及新的 FP6 上都可達 20 petaflops,是前一代 H100 運算性能的 2.5 倍。
如今,随着 Gaudi 3 的正式發布,當前 AI 芯片市場呈現出英偉達 B200、AMD MI300 系列和英特爾 Gaudi 3" 三巨頭 " 競争的格局。英偉達在 AI 芯片領域 " 一家獨大 " 的局面面臨來自另外兩家廠商的挑戰。
不過,從黃仁勳角度來看,英偉達的生态系統很穩定,在當前 AI 算力 " 軍備競賽 " 中,英偉達依舊暫時是市場的佼佼者。
黃仁勳前段時間這段話其實表達的非常明确:" 數據中心需要你運營它。購買和銷售芯片的人考慮的是芯片價格。運營數據中心的人考慮的是成本,我們總擁有成本(TCO)非常好。即使競争對手芯片是免費的,他們也不如我們,客戶也不會買。我們的目标是增加更多的價值。
但這背後需要很多努力,我們必須不斷創新、我們不能把任何事情視爲理所當然、我們有很多競争對手。"
事實上,AI 芯片是一個不斷向前 " 奔跑 " 的高技術行業。它沒有壟斷,隻有不斷創新提供更大價值,才有可能讓企業持續保持領先地位。因此,無論是英偉達還是英特爾,他們都有非常強大的市場競争力,也都有望成爲 AI 加速計算市場的 " 領先者 "。
如今,在服務器市場,AMD 正在逐漸蠶食該公司的市場份額。據市場調研機構 Mercury Research 所公布的 2023 年第四季度 AMD 處理器市場份額統計數據,AMD EPYC 已經拿下了 23.1%服務器市場份額,份額占比再次擴大。盡管 EPYC 作爲通用處理器,算力上不如 GPU 加速器,不過該産品可與 GPU 加速器、AI 加速器等協同工作,實現效率的最大化。
而全新英特爾 AI 芯片 Gaudi,預計将不太會在中國大陸市場銷售。但從全球來看,它是否真的能如其所言的,憑借性能優勢、極具競争力定價優勢而占領更大的市場份額,一切還有待時間的檢測。
(本文首發钛媒體 App)