在剛過去不久的 Microsoft Ignite 2023 大會上,微軟一口氣扔出了多顆「炸彈」。
首先是兩款新芯片,一款是基于 arm 的 CPU,一款是自研 AI 芯片;其次是将 Bing Chat 更名爲 Microsoft Copilot,至此完成了 AI 産品的全面 Copilot 化;最後是推出了允許任何人自定義 AI 對話機器人的 Copilot Studio。
毫不誇張地說,這場大會讓微軟再一次登上了神壇。畢竟在過去幾個月間,OpenAI 推出了一系列的更新和計劃,重新抓住了全世界的目光。
但如果說生成式 AI,甚至 AI 的未來就集中在了微軟和 OpenAI 兩家公司上,英偉達的可能是第一個不服的。就在 Ignite 大會上,微軟 CEO 納德拉邀請英偉達創始人兼 CEO 黃仁勳上台,并問了一個問題:
AI 的未來會走向何方?
老黃表示,生成式 AI 是過去 40 多年計算曆史中最重要的一次範式轉換,比 PC、移動設備乃至互聯網都要來得更大。以 OpenAI GPT 引發的大模型「爆發」可以視爲生成式 AI 的第一波浪潮;第二波則是微軟當下正在實踐的 Copilot 模式。
圖 / YouTube@微軟
而第三波也是最大的一波,将是英偉達的 Omniverse 與生成式 AI 相結合幫助重工業實現數字化,「世界上絕大多數工業都依賴于重工業,」老黃解釋。
這不是英偉達第一次強調 Omniverse 與生成式 AI 的結合。
今年 8 月的圖形技術頂會 SIGGRAPH 上,英偉達就大談特談生成式 AI 與 Omniverse 的結合,并展示了一個「從 PDF 到工廠」的 demo。簡單來講,英偉達把「建工廠」——一個複雜的工程「搬到」了數字世界,利用生成式 AI 與圖形技術将 2D 平面圖轉爲 3D 模型,再加入光照、紋理以及大量的信息,最終打造出工廠的「數字孿生」版本。
「虛拟工廠」,圖 / 英偉達
而另一方面,盡管微軟新發布的自研 AI 芯片表現出了不俗的競争力,再加上 AMD 帶來的威脅,讓不少人和公司看到了打破英偉達算力霸權的希望。但事實上,英偉達 GPU 依然占據很大的優勢,不管是去年發布 H100,還是前幾天剛推出的 H200。
微軟發布自研 AI 芯片 Maia 100,估計沒有人會感到意外。一是早前就有消息透露了這一點,二是地球上最大的幾家雲計算公司——谷歌、亞馬遜都已經推出了自研 AI 芯片。當然,另一個直接因素還出在英偉達身上。
衆所周知,英偉達 GPU 在事實上成爲了大模型「硬件标準」,H100 成爲了所有科技巨頭都在囤積的戰略資源,即便是遠在 2020 年發布的 A100 依然能夠引發「哄搶」。但一方面受限于産能,英偉達 GPU 始終供不應求;另一方面,英偉達 GPU 巨額的利潤與大模型的燒錢戰争,也引發了「隻有英偉達在賺錢」的廣泛讨論。
問題是,科技巨頭沒能在英偉達之外找到太好的選擇,自研 AI 芯片反而可能是更好的選擇。但以微軟的 Maia 100 爲例,自研 AI 芯片能夠替代英偉達 GPU 了嗎?
Maia 100,圖 / 微軟
按照納德拉的說法,微軟的自研 AI 芯片 Maia 100 基于英偉達 H100 同版本的台積電 5nm 工藝打造,晶體管數量達到了驚人的 1050 億個。從公開數據來看,這顆芯片也是迄今爲止最大的 AI 芯片。
半導體研究機構 SemiAnalysis 透露,Maia 100 在 MXInt8 下的性能爲 1600 TFLOPS,在 MXFP4 下則達到了 3200 TFLOPS 的運算速度。同時據分析,自研 Maia 100 每年的成本大概也就在 1 億美元左右。
如果單從數字來看,Maia 100 的算力完全碾壓了谷歌的 TPUv5 以及亞馬遜的 Trainium/Inferentia2 芯片,就算與英偉達 H100 相比,差距也不大了。
但需要指出的是,MXInt8、MXFP4 都是最新的數據格式,MXInt8 預期将替代 FP16/BF16,MXFP4 預期将替代 FP8。然而實際上,還沒有任何公司基于這些新的數據格式訓練過大模型,所以至少在訓練環節上,Maia 100 的算力其實并不适合與其他 GPU 或者 AI 芯片進行直接比較。
另外值得一提的是,微軟 Maia 100 擁有 1.6TB/s 的内存帶寬,仍然碾壓亞馬遜的 Trainium/Inferentia2,但卻遜于谷歌的 TPUv5,更不用說是英偉達 H100。
事實上,微軟也明白「一口吃不成胖子」,Maia 100 距離替代英偉達 H100 乃至更新的型号還有很遠的距離。據報道,Maia 100 采用直接液體冷卻,目前僅爲 GitHub Copilot 運行 GPT-3.5,明年也隻是擴展到爲 Azure 雲的部分負載提供支持。
而就在幾天前,英偉達剛剛發布了 H200 GPU,僅依靠大幅升級内存帶寬和容量,就将大模型的訓練和推理性能提升了 60% 到 90%。
這可能也是爲什麽,在發布自研 AI 芯片 Maia 100 的同時,微軟在 Ignite 大會依然宣布将與英偉達繼續打造下一代 AI 超級計算機和工廠了。
作爲絕對的領先者,擁有最深的護城河,英偉達或許并沒有太過重視微軟自研 AI 芯片這件事。但顯然,英偉達更在意還是 Copilot 之後,Omniverse 要如何結合生成式 AI 成爲新時代「最大的一波浪潮」。
對于英偉達大力鼓吹的 Omniverse,可能很多人早已淡忘了,但肯定忘不了兩年前的「真假黃仁勳」。
圖 / 英偉達
2021 年 4 月,英偉達再次舉辦了一場線上「廚房」發布會,慣例由「黃仁勳」主講。此後的三個多月,誰也沒有發現這場發布會真正的神奇之處,直到英偉達在當年 8 月的 SIGGRAPH 大會上主動揭秘:
那場「廚房」發布會畫面中的廚房、皮衣、烤箱 …… 乃至「黃仁勳」本人以及他的動作、表情等等一切都是「假的」,或者更确切地說,是現實的「數字孿生」。
Omniverse 平台也是這個時候開始浮出水面,彼時「元宇宙」概念大熱,也有人将其視爲英偉達版本的元宇宙。但有一點是 Omniverse 和元宇宙截然不同的,英偉達想要創造一個數字孿生世界,核心目的在于影響現實世界。
虛拟鐵路,圖 / 英偉達
就像英偉達去年 GTC 大會提到的,德國鐵路已經在 Omniverse 上構建、運營鐵路軌道的「數字孿生」,包含了 5700 個站,全長 3 萬多公裏。而在這個「虛拟鐵路」裏,德國鐵路能進行訓練、驗證 AI 模型,持續監控鐵路、火車的運行情況,制造各種意外狀況來發現問題對運營造成的影響。
最直接實際的價值是,基于在 Omniverse 上的測試和驗證,能夠在不需要造新軌道的同時,增加鐵路運載容量和運行效率,降低碳排量。
通過「數字孿生」的測試驗證,數字世界的結果能夠指導現實世界,這就是黃仁勳對 Omniverse 始終推崇備至的核心原因之一。也是爲什麽,就算「元宇宙」概念已經被全世界抛棄,英偉達每一屆 GTC 和 SIGGRAPH 大會都還在「推銷」自己 Omniverse,包括這次在微軟 Ignite 大會上也不例外。
當然,數字孿生技術也并非完美,目前最大的挑戰可能還是成本。
兩年前英偉達那場以假亂真的發布會上,數字孿生版本的「黃仁勳」實際隻出場了 14 秒,但背後卻是一系列的複雜工作,需要不小的人力、物力。與之相對的是,今年 SIGGRAPH 大會上展示的「從 PDF 到工廠」demo,實際就大量應用了生成式 AI 進行參與。
先将 2D 轉成 3D,圖 / 英偉達
基于 Omniverse 平台,通過與各種生成式 AI 的對話,就能将 2D 平面圖轉成完整的「數字孿生」。放在兩年前,我們根本無法想象,但現實是,生成式 AI 已經向全世界證明了自身的實力和潛力。
而從這個角度來看,站在微軟 CEO 納德拉的旁邊,老黃說出了「Copilot 很重要,但 Omniverse+ 生成式 AI 更重要」,就不難理解了。
題圖來自微軟 Ignite 大會