幾天後的中國公司們将迎來英偉達的縮水 AI 芯片 H20、L20 PCle 和 L2 PCle。當中性能最好的 H20,理論綜合算力差不多是舊旗艦 H100 的 20%。
幾個月後的全球其他公司也将迎來英偉達的新旗艦 HGX H200。由于搭載更快的内存,H200 内存容量幾乎翻倍、内存帶寬增加 2.4 倍,使其比上一代産品 H100,在 Llama 2(700 億參數)上的推理速度快了幾乎一倍,INT8 張量核心下提供的每秒浮點運算次數達到 3958 萬億次,同樣是上一代的兩倍。
在充滿危機意識的英偉達創始人黃仁勳眼中,速度意味着一切,他不滿足于 " 摩爾定律 " 每 18 個月性能翻一番,提出了比之快 3 倍的 " 黃氏定律 ",還喜歡在各個場合強調要奔跑。
當 H100 老客戶抱怨買不到更多顯卡、準客戶抱怨連 H100 都沒入庫的時候,H200 就這麽來了。緊俏的供需關系讓官方售價 3.5 萬美元的 H100 已經成爲 AI 圈子裏最硬的通貨,而英偉達從中賺走九成以上利潤。
今年上半年,英偉達的毛利率差不多趕上賣奢侈品的 LVMH,淨利率接近其兩倍。就連集成供應商對下遊的話語權也大得驚人。A 股上市公司彙納科技 11 月 14 日宣布其内嵌英偉達 A100 的算力服務收費翻倍。
英偉達的最大客戶們也都成爲了其競争對手。媒體報道稱微軟即将在本周的年度開發者大會上推出首款自研 AI 芯片;Google 和亞馬遜一邊投資 AI 初創公司,一邊要求對方承諾用自己的 AI 芯片和服務器;就連 OpenAI 都有研發 AI 芯片的打算。
這也是爲什麽上周參加一場媒體活動時,已經壟斷 AI 芯片九成生意、坐擁萬億美元市值公司的黃仁勳說,沒有一家公司可以确保生存,英偉達仍處于危險之中。
今年 5 月底在台灣大學演講時,他鼓勵畢業生們不管前方是什麽," 像我們一樣追上去。向前跑,不要走 …… 你要麽在尋找食物,要麽在避免成爲食物。很多時候,你無法分辨是哪種情況。但不管怎樣,都要向前奔跑 "。
14 年前接受《東方衛視》專訪時,主持人問他,爲什麽每 6 個月更新一次産品那麽重要,黃仁勳答:" 因爲别人做不出來 …… 技術會更新很快,誰最快一定會赢 …… 我們的跑道足夠長、足夠蜿蜒,跑得快是最佳策略。"
此前爲了顯示自家 TPU 芯片有多出色,Google 發明了 AI 芯片的性能測試标準 MLPerf。英偉達的副總裁 Marc Hamilton 稱,黃仁勳想讓 Google 的人每一次運行 MLPerf 都發現,英偉達的 GPU 更快一點。(邱豪)