IT 之家 11 月 14 日消息,Meta 生成式人工智能工程總監謝爾蓋・埃杜諾夫近日在矽谷數字工人論壇上分享了他對人工智能推理需求的預測。他認爲,明年全球新增的人工智能應用推理需求,如果使用合理規模的語言模型,僅需兩座核電站的發電量就可以滿足。
圖源 Pexels
人工智能推理是指利用已經訓練好的人工智能模型,在實際場景中進行各種任務,如生成文本、回答問題、識别圖像等。埃杜諾夫表示,他通過簡單的數學計算,估計了明年全球推理需求的用電量。他假設,明年全球會新增 100 萬到 200 萬個 Nvidia H100 圖形處理器,每個處理器的功率約爲 1 千瓦。如果每個處理器每天運行 24 小時,每人每天可生成 10 萬個 "token"。他認爲以人類規模來看,這用電量尚屬合理。全球僅需新增兩座核電站,就可以提供足夠電力。
不過 IT 之家注意到,埃杜諾夫也指出,人工智能的發展還面臨着一些挑戰和限制,其中之一是數據量的問題。目前,人工智能模型的訓練需要大量的數據,而公開的互聯網數據已經不足以支撐下一代模型的訓練。下一代模型可能需要 10 倍的數據量,這意味着需要更多的專業領域的數據,或者更多的多模态數據,如視頻、音頻等。另一個挑戰是供應鏈的問題。由于全球芯片産能的緊張,人工智能模型的改進速度也會受到影響。因此,研究人員正努力提高模型的效率,以減少對數據和硬件的依賴。例如,Salesforce 公司開發了 Blib-2,這是一種能夠自動調整模型大小的技術,可以根據不同的任務和資源需求,動态地縮小或擴大模型。
業内專家普遍認爲,語言模型在兩年内将爲企業帶來巨大價值。埃杜諾夫預計,三四年内我們将知曉當前技術是否能實現通用人工智能。