來源:AI 星球,文 / 王非
一年時間,AI 從 iPhone 時刻,來到了變革時刻。
當地時間 3 月 18 日下午(北京時間 3 月 19 日淩晨 4 點),英偉達 CEO 黃仁勳發表 " 見證 AI 的變革時刻 " 的主題演講,發布了全新 AI 芯片架構 Blackwell,基于該架構的首款 GPU 産品 B200。
基于此,英偉達提供了 GB200、DGX GB200 NVL 72、DGX SuperPOD 超算平台等 " 組合産品 "。
硬件産品之外,英偉達還發布了創造營收的新産品——集成 AI 開發軟件微服務系統 NIM,用以幫助企業快捷部署公司級專有模型。
此外,英偉達還推出了 GR00T 人型機器人項目——人型機器人基礎模型,支持通過語言、視頻和人類演示,爲人形機器人生成行動指令。
值得一提的是,在回顧完英偉達發展曆史,正式發布新産品之前,黃仁勳通過一個短片向外界展示了 " 英偉達的靈魂 ",該片是 " 世界上第一場一切都是(AI)自制的音樂會 "。
"God,I love NVIDIA !" 觀看完畢,黃仁勳忍不住贊歎。
黃仁勳如此激動興奮,在于大模型時代,英偉達自身 " 賣鏟人 " 的定位,使得該公司 2024 财年營收 609.22 億美元,同比增長 126%,淨利潤 297.60 億美元,同比增長 581%。而這,更是助推其股價在一年來翻了近兩倍。
新架構新産品,更快更強
作爲英偉達 GTC 大會的重磅環節,黃仁勳宣布推出新一代 GPU Blackwell(緻敬統計學家兼數學家大衛 · 哈羅德 · 布萊克威爾),"Hopper(緻敬格蕾絲 · 赫柏)固然已經非常出色了,但我們需要更強大的 GPU"。
黃仁勳表示,8 年時間,AI 算力已增長 1000 倍。他認爲," 加速計算到達了臨界點,通用計算已經過時了。我們需要另一種方式來進行計算,這樣我們才能夠繼續擴展,這樣我們才能夠繼續降低計算成本,這樣我們才能夠繼續進行越來越多的計算。"
據黃仁勳介紹,許多組織預計将采用 Blackwell,如亞馬遜網絡服務、戴爾、谷歌、Meta、微軟、OpenAI、甲骨文、特斯拉、XAI。
在 Blackwell 的支撐下,黃仁勳再次爲英偉達升級了 " 核武庫 "。
當下 4 nm 制程工藝仍處于瓶頸期,于是英偉達将兩個芯片拼接,通過 10 TB/ 秒的帶寬互聯,組合而成包含 2080 億晶體管的 B200 GPU,将于今年晚些時候上市。單 GPU AI 性能達 20 PFLOPS(即每秒 2 萬萬億次),前代 H100 僅爲 4 PFLOPS。B200 的内存 192 GB,基于第五代 NVLink,帶寬達到 8 TB/s。
黃仁勳展示兩款 GPU,左爲新款 Blackwell 架構 B200 芯片
通過搭積木的方式,英偉達還提供了超級芯片 GB200,包含 1 個 Grace CPU+2 個 B200 GPU,通過 900 GB/s 的超低功耗 NVLink 芯片間互連技術連接在一起。而兩個 GB200 裝到主闆上,就成爲了一個 Blackwell 計算節點。
将 18 個 Blackwell 計算節點疊加,則誕生了英偉達 " 新一代計算單元 "DGX GB200 NVL 72,包含 36 個 CPU+72 個 GPU。它們之間由 NVIDIA Quantum-X800 InfiniBand 和 Spectrum ™ -X800 以太網平台連接,可提供速度高達 800Gb/s 的網絡。
單獨使用的 DGX GB200 NVL 72,其 FP8 精度的 AI 訓練性能高達 720 PFLOPs,擁有 1.4 EFlops 的 AI 推理算力和 30 TB 高速内存。與相同數量的 72 個 H100 相比,大模型推理性能提升 30 倍,成本和能耗降低 25 倍。
将 8 個上述 " 新一代計算單元 "Quantum InfiniBand 交換機連接,配合散熱系統,則形成了 DGX SuperPOD 超算平台,包含 8 個 " 新一代計算單元 ",即 288 個 CPU+576 個 GPU,内存高達 240 TB,FP4 精度計算性能達到 11.5 EFLOPs(每秒 11.5 百億億次)。
此外,英偉達的超算平台,還支持增加額外的機架擴展性能,最終成爲包含 32000 GPU 的分布式超算集群。
黃仁勳難掩興奮," 英偉達 DGX AI 超級計算機,就是 AI 工業革命的工廠 "。
由硬及軟,發布新創收産品 NIM
事實上,僅憑 GPU 與算力," 賣鏟人 " 英偉達已經坐穩萬億美元市值。但顯然,黃仁勳不甘心将公司僅僅定位爲 GPU 公司、硬件公司。
在 2023 年的 GTC 大會上,英偉達即發布了 DGX Cloud 人工智能雲服務。這是一項人工智能超級計算服務,它可以讓企業快速訪問爲生成式人工智能和其他開創性應用訓練高級模型所需的基礎設施和軟件。黃仁勳稱,該服務可讓企業和軟件開發人員通過浏覽器登入,即可獲得英偉達的超級計算機 DGX 的 AI 算力。
疊加 NVIDIA AI Enterprise 5.0 等軟件産品,英偉達在 2024 财年第四财季,來自軟件部分的收入就已達 10 億美元。
于是在本屆 GTC 大會上,爲了讓傳統企業," 簡單粗暴 " 地部署并完全利用自己數據,打造專屬行業模型。英偉達推出了全新的 AI 推理微服務—— NVIDIA NIM,能夠幫助開發者将部署時間,從周縮短至分鍾級。企業可以使用這些服務在自己的平台上創建和部署自定義應用,同時保留對其知識産權的完全所有權和控制權。
據介紹,NVIDIA NIM 可對來自英偉達及其合作夥伴生态系統的 20 多個主流的 AI 模型進行優化推理。
此外,英偉達自己的開發套件、軟件庫和工具包都可以作爲 NVIDIA CUDA-X ™微服務訪問,用于檢索增強生成 (RAG)、防護欄、數據處理、高性能計算(HPC)等。通過這些微服務,客戶可以輕松構建基于大模型和向量數據庫的 ChatPDF 産品,甚至智能體 Agent 應用。
NVIDIA NIM 支持客戶使用舊的英偉達 GPU 進行推理,并允許這些公司繼續使用英偉達已經擁有的數億個 GPU。黃仁勳還表示,NVIDIA NIM 将幫助在配備 GPU 的筆記本電腦上運行人工智能,而不是在雲服務器上運行。
在商業模式上,黃仁勳則似乎用上了 " 薄利多銷 " 的策略:購買英偉達服務器的客戶需要注冊英偉達企業版," 一個 GPU 一小時一美元 ",同時也支持年費打五折,即每個 GPU 每年收取 4500 美元。
目前,英偉達全公司已經都用上了 NVIDIA Nim,包括 Box、Cloudera、Cohesity、Datastax、Dropbox 等合作夥伴也都已經參與 NVIDIA Nim 的使用和優化過程。
黃仁勳表示:" 成熟的企業平台坐擁數據金礦,他們掌握了大量可以轉化爲副駕駛的數據,當你準備好運行這些人工智能聊天機器人時,你将需要一個人工智能鑄造廠 "。NVIDIA NIM 正是這樣一個鑄造廠,它幫助構建企業 AI 轉型的 Copilot 級産品,可以被視爲公司 AI 化所需的基石。
值得一提的是,在本次 GTC 大會上,黃仁勳還宣布,兩年前發布的 NVIDIA Omniverse Cloud 将可以連接到蘋果公司混合頭顯 Vision Pro。而在他演講時展示的諸多場景中,Vision Pro 也是頻頻出鏡,諸多開發者佩戴該産品,在元宇宙的工業領域探索 " 空間計算 "。
GR00T 人形機器人項目,加速具身智能浪潮到來
早在 2023 年 5 月,黃仁勳就曾表示,人工智能的下一個浪潮将是 " 具身智能 "。
彼時,GGII 發布的報告也預測,預計到 2026 年,人形機器人在全球服務機器人市場中的滲透率預計将達到 3.5%,市場規模超過 20 億美元,到 2030 年全球市場規模有望突破 200 億美元。
而對機器人領域的開發賦能,也被外界視爲英偉達下一個萬億美元市值的增長點。
爲了加速這一浪潮的到來,今年初,英偉達資深科學家 Jim Fan 剛剛宣布建立 GEAR 工作室,相關研究成果以及研究基礎環境成爲英偉達新機器人解決方案的基礎。
在本次 GTC 大會上,黃仁勳還宣布了一個名爲 GR00T 的人形機器人項目,旨在進一步推動英偉達在機器人和具身智能的突破性工作。
現場展示中,除了機器人影像外,迪士尼的 orange 和 green 機器人也來到現場,這款機器人用的就是英偉達爲機器人設計的首款 AI 芯片 Jetson。
據介紹,由 GR00T 驅動的機器人可以理解自然語言,并通過觀察人類動作來模拟運動。
目前,英偉達正在構建包括 NVIDIA IAI、Omniverse、ISAAC 三大平台,三大平台均與機器人産業高度關聯。
其中,NVIDIA IAI 搭載 DGX 系列産品,用于模拟物理世界;Omnivese 搭載 RTX 和 OVX 系列産品,用于驅動數字孿生的計算系統;ISAAC 搭載 AGX 系列,用于驅動人工智能機器人。
爲了給 GR00T 項目提供軟件支持,基于英偉達 Omniverse 構建的 ISAAC Lab 也進行了同步更新,允許開發者利用該平台模拟機器人學習技能、與物理世界模拟互動,支持數千個機器人同步訓練與模拟。
黃仁勳表示:" 爲通用人形機器人構建基礎模型,是當今人工智能領域最令人興奮的問題之一。這些使能技術正在彙聚在一起,讓世界各地領先的機器人專家在人工通用機器人領域取得巨大飛躍。"