有迹象表明,長達一年的 GPU" 短缺 " 問題正在緩解。
據 The Information 周五報道,超過六家使用 AI 芯片的公司表示,從雲提供商那裏租用英偉達最先進的芯片(H100)變得相對容易。因此,一些在早期瘋狂搶購 GPU 的買家,現在正尋求出售部分存貨。因爲如果不使用,會帶來非常昂貴的持有成本。
與此同時,現在的 GPU 買家也在減少訂單,并對租用芯片的價格更爲挑剔。
VMind AI 的首席執行官 Miguel Solano 說:" 三個月前,你無法從谷歌雲那裏獲得 H100,而現在你可以了。" VMind AI 是一家幫助大模型公司降低計算成本、提高芯片效率的企業。
一些因素可能導緻需求減少。據知情人士透露,亞馬遜推出了一項新的服務,允許客戶一次性按天或周安排 GPU 租賃時間。而在以前,客戶隻能以較長的合同期限租用 GPU,或按需租用。谷歌的一位發言人則表示,公司能夠 " 滿足幾乎所有客戶需求,并不斷提供新的容量。"
此外,由于對芯片的使用更加熟悉,一些企業也可能會降低它們對實際需要多少 GPU 的預期。據一位 GPU 租賃公司的員工稱,他們可能感受到更大的壓力,需要确保他們的業務在經濟上可行。
這一切都與去年形成鮮明對比,當時初創公司和投資者正想方設法獲得英偉達的 GPU。
專注于 AI 初創公司的風投機構 Conviction 的創始人 Sarah Guo 表示:" 當時有一種恐慌和稀缺感。在 2023 年年中,大模型圈都在熱議一個詞——‘ GPU 貧民’(GPU Poor)。"
當然,并非所有人都解決了 GPU" 短缺 " 問題,像 OpenAI 這樣訓練大模型的公司,仍在努力獲得足夠多的 AI 芯片。
值得一提的是,英偉達競争對手英特爾的 CEO Pat Gelsinger 在周三表示,雖然他沒有感覺到 AI 芯片的需求有任何放緩,但他預計公司對在 AI 芯片上的投入會更加謹慎。
Gelsinger 說:
" 你不能把數百億美元投入到這些大型數據中心,卻不開始建立支持這些數據中心的經濟模型。"