最強雲計算、最快 GPU,聯手出大招了!
就在剛剛,雲計算霸主亞馬遜雲科技和英偉達宣布:
推出首款雲 AI 超級計算機,結合了英偉達 H200 Grace Hopper 超級芯片和亞馬遜 UltraCluster 擴展功能。
據悉,該合作項目代号爲Project Ceiba,而這個超級計算機是配備了 H200 NVL32 與 Amazon EFA 互連技術的大規模系統,将部署在亞馬遜雲科技之上。
它共計搭載了16384 顆英偉達 H200 超級芯片,能夠處理 65 exaflops 速度等級的 AI 運算。
爲了這個合作項目,老黃也是親自來到亞馬遜雲科技年度盛會 re:Invent 的現場站台,重視程度可見一斑。
△左:亞馬遜雲科技 CEO:Adam Selipsky;右:英偉達 CEO:黃仁勳
與此同時,亞馬遜雲科技也成爲了英偉達 H200 Grace Hopper 超級芯片的第一個大客戶。
而之所以兩大巨頭要這般合作,雙方的目标也是非常明确——劍指生成式 AI。
亞馬遜雲科技 CEO Adam Selipsky 在現場表示:
我們與英偉達合作了 13 年,推出了最廣泛的英偉達 GPU 解決方案可用于各種工作負載,包括繪圖、遊戲、HPC 高性能計算、機器學習,以及現在的生成式 AI。
我們将會讓亞馬遜雲科技成爲運行 GPU 的最佳雲端環境。
黃仁勳也對生成式 AI 與雲計算發表了他的觀點:
生成式 AI 正改變各種雲端負載,爲多元内容創作在底層注入加速計算動能。
我們共同目标是爲每個客戶提供具有成本效益、先進生成式 AI,爲此英偉達與亞馬遜雲科技在整個計算堆棧展開合作,橫跨 AI 基礎設施、加速庫、基礎模型以及生成式 AI 服務。
而這次強強聯手的合作,也僅僅是亞馬遜雲科技 re:Invent 活動中的一隅。
現在,我們就來一同看下更多的重磅發布。
亞馬遜雲科技升級 AI 芯片
除了與英偉達展開合作之外,亞馬遜雲科技自家的芯片也迎來了大升級。
首先便是發布了升級後的通用 AI 芯片——Graviton4。
據了解,與上一代 Graviton3 相比,Graviton4 的計算性能提高了 30%,核心數量增加了 50%,内存帶寬增加了 75%。
Graviton4 帶來的一個新轉變之一,便是通過對所有快速物理硬件接口的全面加密,這就顯著提升了它的安全性。
亞馬遜雲科技透露,這款芯片将被應用于内存優化型的 Amazon EC2 R8g 實例,幫助客戶提升高性能數據庫、内存緩存和大數據分析工作的效率。
而且,R8g 實例的大小更大,其 vCPU 和内存容量比前一代的 R7g 實例最多增加了三倍。
搭載 Graviton4 的電腦預計在接下來的幾個月内上市。
亞馬遜雲科技進一步表示:
自從大約五年前推出 Graviton 項目以來,他們已經生産了超過 200 萬個 Graviton 處理器。
而且,亞馬遜雲科技 EC2 的前 100 位用戶都已經選擇使用 Graviton,這證明了其在市場上的受歡迎程度。
亞馬遜雲科技在大會中帶來的第二款升級芯片,則是Trainum2。
如其名,這款芯片的主要用途就是針對擁有超大參數模型的訓練。
相比于上一代 Trainium1,Trainum2 在速度上快出了 4 倍,同時在能效方面也有 2 倍的提升。
在亞馬遜雲科技内部,Amazon EC2 Trn2 實例将采用的正是 Trainium2,每個實例内置 16 個 Trainium 芯片。
這些 Trn2 實例的目的是爲了支持客戶在下一代 EC2 UltraCluster 中大規模擴展,最多可達 10 萬個 Trainium2 芯片,通過亞馬遜雲科技彈性織物适配器(EFA)的 petabit 級網絡連接,能夠提供高達 65 exaflops 的強大計算能力。
有了這種規模,客戶就可以在數周而不是數月時間内訓練 3000 億參數的大語言模型!
正如 Claude 背後公司 Anthropic 的聯合創始人 Tom Brown 所述:
我們正在與亞馬遜雲科技密切合作,使用 Trainium 芯片開發我們未來的基礎模型。
Trainium2 将幫助我們大規模構建和訓練模型,我們預計它比第一代 Trainium 芯片快至少 4 倍,适用于我們的一些關鍵工作負載。
據悉,Trainium2 将從明年開始用于支持新的服務。
Amazon Q:亞馬遜工作版 ChatGPT 出道
在生成式 AI 方面,亞馬遜雲科技還發布了自家工作版的 ChatGPT ——Amazon Q,重新構想了未來的工作方式。
Amazon Q 主要面向的是企業用戶,它讓員工可以利用公司的數據和專業知識獲得答案、解決問題。
Amazon Q 基于亞馬遜雲科技 17 年的知識來訓練,所以很懂亞馬遜雲科技,于是在使用亞馬遜雲科技過程中,可以随時随地提供幫助。
Adam 說,Amazon Q 改變了開發人員在亞馬遜雲科技上構建、部署和操作應用程序的方式。
它可以通過提出問題來了解亞馬遜雲科技功能和工作原理,或者确定最佳服務。
Amazon Q 不僅能介紹亞馬遜雲科技的各項功能,還可以根據用戶需求,提供利用亞馬遜雲科技各項服務構建應用的方法。
在使用亞馬遜雲科技遇到問題和故障時,Amazon Q 也可以一鍵分析原因并想辦法解決。
在亞馬遜雲科技控制台之外,Amazon Q 還可以在 IDE 中調用,實時幫助開發者生成或解釋代碼,并進行測試和優化。
更爲精彩的是,Amazon Q 可以完成從計劃到代碼,再到完成後的測試和用戶文檔的全流程自動開發。
假如要給應用添加新功能,開發人員隻需要用自然語言描述需求,然後檢查 Amazon Q 給出的建議并進行必要調整就可以了。
不過,開發不是一勞永逸,程序的維護和升級也至關重要。
而如果這之中涉及到了編程語言的更新叠代,開發者可能需要花費幾個月甚至幾年對代碼進行逐行調整。
而 Amazon Q 的代碼轉換功能,将這一時間縮短到了幾分鍾。
開發人員隻需在 IDE 中打開他們想要轉換的代碼,然後要求 Amazon Q 對其進行 "/transform" 即可。
最近,5 名開發人員用 Amazon Q 在短短兩天内将 1000 個應用從 Java 8 升級到 Java 17,平均每個用時還不到 10 分鍾。
除了面向開發者的 Builder 版本, Amazon Q 還有爲商業從業者提供的 Business 版本。
可以在亞馬遜 QuickSight 數據分析平台和亞馬遜雲科技 Connect 中使用。
将 Amazon Q 連接到企業系統,還能得到定制版的 Q,我們還可以看到 Amazon Q 幫助用戶分析了下遊客戶的需求。
在此基礎之上,Amazon Q 更是可以直接充當使用者的客服代表,解決下遊用戶提出的問題。
做個總結的話,Business 版本的 Amazon Q 一共擁有四重 " 專家 " 身份:
亞馬遜雲科技專家,對亞馬遜雲科技的每一個功能、模塊都有充分的了解。
生意專家,能夠分析行業狀況下遊客戶的需求。
商業智能專家,能夠對大量商業數據進行分析。
客服專家,對用戶企業情況充分了解,可以充當智能客服工作。
價格方面,Business 和 Builder 版本的價格分别是每用戶每月 20 美元和 25 美元。
還有其它發布
與這些芯片和聊天機器人 Amazon Q 同時發布的,還有全新的雲存儲服務亞馬遜雲科技 S3 Express One Zone。
它的速度是标準版 S3 的 10 倍,可以在 1 分鍾之内處理數百萬次請求,請求成本和計算成本分别降低了 50% 和 60%。
工具層面,生成式 AI應用搭建平台 Bedrock也值得關注。
Adam 将其稱作最簡單的利用大模型搭建和擴展生成式 AI 的方式。
此外還有和 Trainium 芯片配套的ML 優化 SDK 亞馬遜雲科技 Neuron。
排行前 100 的 ML 模型中,亞馬遜雲科技 Neuron 支持 93 種。
按照基礎設施層、工具層和應用層這三個層級進行劃分,此次發布中涉及生成式 AI 的産品都在下面這張圖裏了:
One More Thing
據說這屆亞馬遜雲科技的 re:Invent 活動吸引了來自全球的 5 萬多人。
來,感受一下 Keynote 結束後的人山人海……
參考鏈接:
[ 1 ] https://press.aboutamazon.com/2023/11/aws-unveils-next-generation-aws-designed-chips
[ 2 ] https://press.aboutamazon.com/2023/11/aws-and-nvidia-announce-strategic-collaboration-to-offer-new-supercomputing-infrastructure-software-and-services-for-generative-ai