文丨李安琪
編輯丨李勤
" 下半年開始,理想幾乎把渠道商手裏的卡都買了。" 一位知情人士說。
AI 大模型創業催生的搶購算力潮,今年陡然遷移到了汽車行業。以理想、華爲和小鵬汽車爲首,向端到端智駕發起猛沖的公司,尤爲激進。
和 AI 大模型技術趨同,端到端的智能駕駛技術,同樣有數十億參數,也在向百億級進發。算力就是這座數據熔爐的燃料。這也決定,端到端技術和算力資源拼搶,成了智能駕駛新的決勝規則。
" 李想(理想汽車 CEO)經常問我,算力資源夠不夠,不夠再去買。" 接受 36 氪專訪時,理想智能駕駛副總裁朗鹹鵬曾表示。據 36 氪了解,目前理想汽車已經囤夠了萬張算力卡," 同時還在物色數據中心的地址。"
7 月,理想的雲端算力爲 2.4 EFLOPS ,到 8 月底,理想算力已經陡增至 5.39 EFLOPS。幾乎一個月時間,理想的雲端算力增加了近 3 EFLOPS。
同樣,小鵬汽車宣布,到 2025 年,雲端算力将從目前的 2.51 EFLOPS 增加到 10 EFLOPS。
華爲智駕也在兩個月内迅速将雲端訓練算力規模從 5EFLOPS 擴張到 7.5 EFLOPS。
這是什麽概念?有智駕行業人士告訴 36 氪,目前車企們使用的訓練顯卡主要是英偉達 H100 和 A800。美國禁令後,市場上能流通的大多是 A800。
據 36 氪汽車了解,一台 A800 服務器(含 8 張顯卡)報價約爲 95 萬元。按照 FP16 精度計算,單張 A800 的算力爲 320TFLOPS,1 EFLOPS(等于 1000000TFLOPS)大約可計算爲 3125 張 A800,即 390 個 8 卡模組。
按每 8 卡模組按照 95 萬元價格計算,1 EFLOPS 算力大約需要約 3.7 億元。
也就是說,理想汽車在過去 1 個多月,僅囤置算力芯片就耗費超 10 億元,而小鵬想要實現明年總算力目标,則需要耗費約 37 億元。
雖然耗資巨甚,但不容車企懈怠。智能駕駛技術已經在 AI 大浪潮下,發生新的範式革命:從傳統方案的規則驅動,變成了 " 端到端 " 方案的 AI 驅動、數據驅動。
想要量産端到端的智能駕駛産品,車企們需要先成爲吞噬海量數據、巨大雲端算力的猛獸。
特斯拉先成爲 " 算力狂魔 "。去年 9 月,特斯拉 AI 訓練芯片儲備不過萬張左右,而在今年三季度财報會數字顯示,目前特斯拉 AI 算力約等效爲 6.75 萬張英偉達 H100 芯片。一年時間算力儲備翻超 6 倍。
圖源:特斯拉官網
這是相當恐怖的數字。目前特斯拉總算力約爲 67.5 EFLOPS,對比之下,去年全球算力總規模爲 910 EFLOPS。
但在海量數據喂養和超大算力訓練下,特斯拉基于端到端的 FSD v12 版本,提供了比以往更絲滑、拟人的智駕能力。這也誘使汽車行業進入這場數據和算力遊戲。
車企患上數據饑渴症
端到端下的智能駕駛技術,是數據和算力的合謀。
對于端到端智駕所需要的數據,特斯拉曾給出過一些判斷标準:一個端到端自動駕駛訓練至少需要 100 萬個、分布多樣、高質量的 clips(視頻片段)才能正常工作。到了 1000 萬個 case 後,系統能力會變得難以置信。
有行業人士告訴 36 氪,一般 1 個 clip 在 15-30 秒左右,沒有絕對固定的時間長度。
特斯拉有相當明顯的數據優勢。目前特斯拉已經在全球賣出 700 萬輛車,即便有效的數據車輛爲百萬輛,如果單車每天貢獻一個 clip,那麽特斯拉每天就有百萬個 clips 能被拿來訓練。
也有行業人士向 36 氪假設,假如在雲端訓練一個 80 億參數的模型,至少需要在這個模型 " 煉丹爐 " 中投入 1 萬個小時訓練數據,并且每兩周更新要更新一遍數據。
越早建立數據驅動的智駕閉環,車企的技術與産品壁壘就越厚,也越有機會将後來者拒之門外。
理想表示,最晚明年年初,會推出大概通過超過 1000 萬 clips 訓練出來的端到端 +VLM。前段時間小鵬智駕負責人李力耘也在公開表示,小鵬端到端模型的訓練數據量已達到 2000 萬 clips。
但高質量數據并不容易尋得。馬斯克曾表示,有效的用戶幹預行爲(高價值的訓練數據)捕捉正變得越來越難。" 每行駛 10000 英裏,隻有 1 英裏對訓練 FSD 神經網絡有用。"
理想也表示,目前超 80 萬輛車主,但真正能提供高質量數據的用戶隻有 3%。
多位智駕行業人士告訴 36 氪,目前車企和智駕公司獲取數據主要有 2 種方式。
一是從量産車上挖掘。比如針對車企賣出的幾十萬台車,工程師會寫下專門規則,如果用戶的駕駛行爲符合條件,特定數據(經過脫敏處理)會被上傳。車企用戶也可以主動上傳一些特别案例。
而智駕供應商,也許在量産車數據回傳上沒有優勢,但内部往往會組建一支能優質駕駛的車隊,專門路跑采集數據。
數據回傳本身是一筆不小的成本。據 36 氪汽車了解,一家頭部智駕供應商公司,每年回傳數據的流量費以億元爲單位。如果是新造車公司,這項費用支出會更高。
二是在存量數據中挖掘數據。在早期智駕還不成熟的階段,車企和智駕公司往往積累大量數據,很多都是無效數據,工程師隻能通過一些算法規則來挖取。
高質量數據作爲養料,會決定智駕系統叠代的質量。這持續考驗着車企的智駕自動化閉環能力:從數據采集、數據清洗、标注、訓練、仿真驗證、發版、解 bug,再經曆新一輪閉環。
而這背後每一步的數據流轉,都在吞噬算力資源。車企和智能駕駛技術公司們,似乎難有退路。
智駕要賣錢," 端到端 " 雖難必做
端到端智能駕駛帶來的收益正在觸手可見。
在 2023 年末推出基于端到端的 FSD 後,馬斯克曾發郵件督促一線銷售讓更多用戶體驗智駕的拟人能力,原因是 FSD 的體驗變得更好了。
今年以來,特斯拉甚至采用了全員免費限時使用(北美地區)、訂閱費從 199 美元 / 月下降至 99 美元 / 月,買斷費用從 1.2 萬美元下降至 4500 美元等方式,來提升 FSD 的滲透率。特斯拉還表示 FSD 将于明年一季度在中國落地。這将有另一番商業想象空間。
換句話說," 端到端 " 讓智駕比過往任何時刻都接近商業化。
在國内," 端到端 " 也在加速智駕商業化進程。
華爲最早嘗到智駕商業化甜頭。去年末,華爲與賽力斯合作的問界新 M7,上市兩月餘斬獲 10 萬個訂單,智駕版用戶超 60%。
除了推出智駕版車型,華爲還通過智駕軟件包的方式進一步收費。而目前行業大多數車企智駕軟件都是免費開放給用戶。
跟特斯拉降價促銷不同,華爲智駕軟件費用正在逐步上漲。有鴻蒙銷售人士告訴 36 氪汽車,華爲智駕 ADS 1.0 階段買入價格是 3000 元,ADS2.0 階段買入是 6000 元,ADS3.0 是 1 萬元。" 後續價格還會漲。"
而 ADS 1.0 到 2.0 到 3.0 版本,正是華爲從傳統多模塊智駕逐步轉向了端到端智駕後,帶來的技術和産品體驗提升。
另一個嘗到智駕技術紅利的選手是理想。在增程 + 家庭車産品力足夠打動用戶的前提下,理想從今年開始猛追補足智駕短闆,其端到端智駕版本已經全量推送給所有車型 MAX 版本,智駕口碑回升。
今年二季度财報電話會議上,理想汽車稱其 30 萬以上的車型 AD Max(即智駕版本車型)訂單占比接近 70%。而 AD Max 版車型比 AD Pro 版車型貴 2 萬元。用戶爲更貴的車型買單,實際上也是在爲智駕買單。
美國作家菲利普 · 迪克曾在小說《仿生人會夢見電子羊嗎 ?》中描述,仿生人擁有感情、會做夢,并希望擁有一隻活寵物。
端到端加持下,智駕系統可能已經開始 " 夢 " 到電子羊。但電子夢境的維持,需要大量資源灌注,車企與智駕公司也由此患上了數據、算力饑渴症。
算力遊戲,買卡建機房
除了賣車獲取更多數據養料,車企智駕團隊還在籌備芯片算力資源。
特斯拉三季度财報電話會數據顯示,目前特斯拉 AI 算力約等效爲 6.75 萬張英偉達 H100 芯片,總算力約爲 67.5 EFLOPS。
特斯拉稱,到 10 月底,特斯拉還将增加 2.1 萬張 H100,可大緻推測出,特斯拉屆時總算力将達 88.5 EFLOPS。
除了瘋狂購入英偉達顯卡之外,特斯拉自研的芯片也在路上。馬斯克此前在 X 上發帖稱,其超級計算機 Dojo 1 到年底,将會有約 8000 台 H100 GPU 提供等效的訓練能力。特斯拉此前期望是,Dojo 進入投産後,其算力集群總規模能達到 100 EFLOPS。
望不見頂的算力儲備,讓國内車企玩家不敢輕易掉隊。
不過芯片限售後,英偉達的高端 AI 芯片 H100 難以在國内流通,國内企業更容易買到的,是英偉達針對中國市場推出的特供版芯片 A800 等,性能與價格都不如 H100。
目前,華爲智駕是國内算力儲備最高的玩家,達 7.5 EFLOPS。有華爲人士告訴 36 氪,内部不僅使用英偉達的訓練芯片,同時還在使用華爲自研的晟騰芯片,兩者混合使用。晟騰工具鏈雖然不算特别好用,但由于自研的緣故,供給充足,華爲能在雲端算力上進展很快。
理想汽車則以 5.39 EFLOPS 位居華爲之後。而這背後,是萬張左右的英偉達顯卡儲備。
有行業人士給 36 氪算了一筆賬:以 A800 芯片爲例,按照深度學習訓練一般适用的 FP16 精度來計算,單張 A800 算力爲 320 TFLOPS,那麽 5.39 EFLOPS 算力實現,需要超 1.68 萬張 A800。(理想不完全是 A800,此處僅大緻計算,1EFLOPS=1000PFLOPS=1000000TFLOPS)
有行業人士告訴 36 氪,今年 AI 大模型公司算力搶購熱潮消退後,雲端訓練顯卡相對好買。去年 A800 的 8 卡模組價格輕松賣超百萬元,如今回落到 95 萬元左右。即便如此,國内車企玩家想要囤積算力,依然是一筆巨額投入。
理想的目标是年底達到 8EFLOPS。據 36 氪了解,理想此前已經與雲廠商火山引擎聯合建立數據中心,但目前還在籌備新的數據中心選址。
小鵬智駕中心算力則是 2.51 EFLOPS,同理可換算爲超 7800 張 A800,小鵬的目标是 2025 年算力将達 10 EFLOPS 以上。蔚來目前的雲端算力是 1.4 EFLOPS,可換算爲超 4300 張 A800。
可以對比的是,據工信部信息,截至 2024 年 6 月,國内算力規模達 246 EFLOPS(基于 FP32 計算)。如果換算成 FP16,即 492EFLOPS。而華爲、蔚小理 4 家企業雲端算力總和,就占全國算力規模約 3.5%。
但端到端不僅是巨頭的遊戲,中小玩家也在擠進圍場。智駕供應商往往聯合車企快速攻入戰場,比如出現了智己與 Momenta、長城與元戎啓行等組合。
據 36 氪汽車了解,一些頭部智駕供應商的訓練芯片也達千張級别。如 Momenta、地平線等去年就跟火山引擎達成合作,訂單在億元級别。
過去兩年,全球都陷入了 AI 大模型瘋狂狀态。國内 AI 大模型公司的創業入場門票高達 5000 萬美元,目前估值最高的大模型公司 " 月之暗面 " 身價已經去到 236 億元。
目前國内頭部 AI 大模型公司正朝着萬億參數量模型發展,這背後也需要巨大的算力池支撐。階躍星辰,Kimi 等大模型公司,都在通過與雲廠商合作來搭建萬卡集群訓練。
如今同樣的局面在汽車行業上演。車企們不甘心隻賣車,而是朝着 AI 科技公司的方向進發。車企們天然擁有海量數據資源,在大模型大算力的加持下,目光已經投向了更廣的無人車、具身智能等方向。
他們需要在微薄的利潤水平下,投入巨資,競逐越來越高的算力數字。這能持久嗎?汽車行業正陷入價格鏖戰,如果把 AI 作爲決勝籌碼,這場 " 經費在燃燒 " 的算力遊戲才剛剛開始。