亞馬遜發力捍衛在雲計算領域的領先地位,一邊升級自研的雲芯片、推出亞馬遜版的 GPT ——人工智能(AI)聊天機器人,一邊深化同英偉達的合作,推出基于英偉達芯片的新服務、和英偉達共同研發超級計算機。
AWS 的副總裁 Dave Brown 表示,通過将自研芯片的設計重點放在對客戶重要的實際工作負載上,AWS 能爲他們提供最先進的雲基礎設施。此次推出的 Graviton4 是五年内的第四代芯片産品,随着人們對生成式 AI 興趣的高漲,第二代 AI 芯片 Trainium2 将幫助客戶以更低的成本和更高的能效更快地訓練自己的機器學習模型。
Graviton4 計算性能較前代提高多達 30%
美東時間 11 月 28 日周二,亞馬遜旗下雲計算業務 AWS 宣布,推出新一代的 AWS 自研芯片。其中,通用芯片 Graviton4 的計算性能較前代 Graviton3 提高多達 30%,内核增加 50%,内存帶寬提升 75%,從而在亞馬遜雲服務器托管服務 Amazon Elastic Compute Cloud(EC2)上提供最高性價比和能源利用效果。
Graviton4 還通過對所有高速物理硬件接口進行完全加密提高安全性。AWS 稱,Graviton4 将應用于内存優化的 Amazon EC2 R8g 實例,讓客戶能改進高性能數據庫、内存緩存和大數據分析工作負載的執行。R8g 實例提供更大的實例大小,比前代 R7g 實例的 vCPU 高最多三倍的,内存高三倍。
應用 Graitons4 的電腦将在未來數月内上市。AWS 稱,啓動 Garviton 項目約五年來,已生産超過 200 萬個 Garviton 處理器,AWS EC2 的前 100 位用戶都選擇使用 Graviton。
Trainium2 速度提高四倍 訓練萬億參數級模型
AWS 的另一款新品——新一代 AI 芯片 Trainium2 速度比前代 Trainium1 快四倍,将能在 EC2 UltraCluster 中部署多達 10 萬個芯片,讓用戶能在很短的時間内訓練數以萬億參數的基礎模型(PM)和大語言模型 (LLM),同時能源利用率較前代提高多達兩倍。
Trainium2 将用于 Amazon EC2 Trn2 實例,單個實例中包含 16 個 Trainium 芯片。Trn2 實例旨在幫助客戶在下一代 EC2 UltraCluster 中擴展芯片應用數量至多達 10 萬個 Trainium2 芯片,聯通 AWS Elastic Fabric Adapter ( EFA ) petabit 級網絡,提供高達 65 exaflops 的算力。
AWS 稱,Trainium2 将從明年開始用于支持新的服務。
升級版 Grace Hopper 的首家大客戶 DGX 雲采用 GH200 NVL32 速度最快 GPU 驅動 AI 超算
除了自研芯片,AWS 周二還在年度大會 re:Invent 期間同英偉達共同宣布,擴大戰略合作,提供最先進的基礎設施、軟件和服務,助力客戶的生成式 AI 創新。
AWS 将成爲第一家在雲上采用全新多節點 NVLink 技術英偉達 H200 Grace Hopper 超級芯片的雲服務商,也就是說,AWS 将是升級版 Grace Hopper 的第一個大客戶。
英偉達的 H200 NVL32 多節點平台将 32 個 Grace Hopper 芯片與 NVLink 和 NVSwitch 技術共同用于一個實例。該平台将用于與亞馬遜網絡 EFA 連接的 Amazon EC2 實例,并由高級虛拟化 ( AWS Nitro System ) 和超大規模集群 ( Amazon EC2 UltraClusters ) 提供支持,使亞馬遜和英偉達共同的客戶能夠擴展部署數以千計的 H200 芯片。
英偉達和 AWS 将共同在 AWS 上托管英偉達的 AI 訓練即服務 DGX Cloud,它将是第一個采用 GH200 NVL32 的 DGX 雲,能爲開發人員提供單個實例中最大的共享内存。AWS 的 DGX 雲将提高尖端生成式 AI 和超過 1 萬億參數的大語言模型的訓練。
英偉達和 AWS 正在共同研發名爲 Ceiba 的項目,設計世界上速度最快的 GPU 驅動 AI 超級計算機,這是一個采用 GH200 NVL32 和 Amazon EFA 互連的大規模系統。它是搭載 1.6384 萬塊 GH200 超級芯片的超級計算機 ,AI 處理能力達 65 exaflops。英偉達将用它推動下一波生成式 AI 創新。
企業客戶機器人亞馬遜 Q 預覽版上線 幫助在 AWS 上開發 App
除了芯片和雲服務,AWS 還推出了自己的 AI 聊天機器人預覽版,名爲亞馬遜 Q。它是生成式 AI 技術支持的新型數字助手,可根據企業客戶的業務進行工作,幫助企業客戶搜索信息、編寫代碼和審查業務指标。
Q 接受了 AWS 内部有關代碼和文檔的部分培訓,可供 AWS 雲的開發者使用。
開發者可以用 Q 在 AWS 上創建 App、研究最佳實踐、改正錯誤、獲得爲 App 編寫新功能的幫助。用戶可以通過對話式的問答功能與 Q 進行交互,學習新知識、研究最佳實踐以及了解如何在 AWS 上構建 App,無需将注意力從 AWS 控制台上移開。
Q 還将被添加到亞馬遜的企業智能軟件、呼叫中心工作人員和物流管理的程序。 AWS 表示,客戶可以根據公司的數據或個人資料,對 Q 進行定制。
Q 對話式問答功能目前在所有提供企業 AWS 的地區提供預覽版。