過去,智駕方案領域一直有着 " 地大華魔 " 等四家國内頭部智駕玩家的說法。如今,以城區高階智駕爲一道分界線,以 " 華元魔 "(華爲、元戎、momenta ) 爲代表的第三方 " 端到端 " 技術供應商,逐漸搶占了技術方案與車型落地上的先機。
北京車展期間,華爲、元戎、Momenta 均推出了端到端的量産智駕方案。
華爲一直是話題流量的王者,擁有極強的技術号召力,研發規模達 7000 人。2022 年之前,華爲也在用高精地圖,而後堅定地走無圖路線。2023 年 4 月 16 日,華爲正式發布不依賴高精地圖的 ADS 2.0。
Momenta 則是依靠自己豐富的量産經驗,與比亞迪、廣汽、豐田、奔馳、通用等車企的合作,爲它的端到端方案提供了數據養料。
相比于前兩者,元戎的特點在于原生的 AI 基因,發力時間早。如果以端到端的研發時間來看,元戎 2023 年 3 月就确定了端到端方向的研發,8 月就完成了端到端模型的道路測試。從這點看,元戎是國内最早把端到端模型測試車跑在城市公開道路的方案商。
據雷峰網了解,元戎的第一款車的量産僅僅花了 8 個月的時間,而後續一個新的車型适配時間會縮短到 3-4 個月。10 月,吉利與奔馳合資的 Smart 品牌旗下的 smart 精靈 #5 上市,該車型也采用了元戎啓行提供的無圖城區 NOA 功能方案。
11 月初,元戎啓行完成一輪 1 億美元的融資。截至目前,元戎啓行已完成 6 輪融資,累計融資金額超 5 億美元,高階智駕平台 DeepRoute IO 已成功搭載上車,與車企共同打造的量産車已超 2 萬台,并與多家主流車企共同推進 10 個量産項目,涵蓋了 SUV、MPV、越野等各種車型。
端到端的原理無需贅述,想要做好一個端到端模型有三個因素:好的模型、海量的優質數據和大算力。更容易形成壁壘的,是前兩者。
與大語言模型在互聯網上爬取海量文字數據用于訓練不同,端到端智駕需要的視頻數據獲取成本和難度極高。量産上車,是獲取優質數據、叠代模型的一條必經之路。這也決定了端到端是一條 " 強者恒強 " 的技術路線,留給後來者的時間窗口則會越來越小。
元戎啓行 CEO 周光說,元戎已經投入了更多的精力在下一站的 VLA 模型。VLA 模型是一個融合了視覺、語言和動作的多模态模型,可提高模型的泛化能力和判斷推理能力。到 2025 年,元戎的 VLA 模型将基于英偉達下一代智能駕駛計算平台 Thor 正式發布,屆時元戎将成爲業内首批将 Thor 芯片部署上車的智駕公司之一。
目前,行業裏流行的做法是 One Model 端到端 +VLM 技術架構。
在周光看來,VLM+ 端到端與 VLA 模型的區别在于,前者是教練通過語言的形式教學員開車,後者是教練自己開車。" 教練開車和學員開車,兩種方式你更放心哪一個?"
元戎有着不同于行業的競争心态:不打價格戰、不搞車海戰術。周光表示," 如果合作的車型隻能賣 100、200 台沒有意義。我們需要的是數據,所以我期待有更多的爆款車,來補齊工程化的基因。
明年,元戎會基于端到端架構去拓展 Robotaxi 業務,并且積極開展海外業務,明年還會參加日本車展。
周光認爲," 元戎啓行的公司願景是爲真正的 AGI 做一些貢獻,汽車不應該定義成汽車,而是一個機器人的載體,希望元戎啓行的技術能夠應用到整個物理 AI。"
11 月 3 日,雷峰網《新智駕》與周光進行了一次對話。以下爲對話内容,結合了部分元戎融資溝通會的問答。
新智駕:元戎的這輪融資,應該是今年智駕行業比較重磅的一筆。
周光:近兩年從投資機構拿錢挺難的,其實我們也有能力去融一些比較好拿的錢,但沒必要。我們賬上還有餘糧。而且,我們的風格是該花的花,該砍的砍,我們砍掉了港口,也砍掉了 L4。
新智駕:這筆錢對于行業有什麽樣的激勵作用?
周光:行業裏有做得好的拿到了錢,這很正常。最差的情況是什麽?你做到最好也拿不到錢。
新智駕:能不能談談你們跟客戶第一次見面時的場景?對方提了那些要求?
周光:我挺佩服他們的。第一次就見了他們總裁,隻對我們提了一個要求,要求我們 all in,在量産車上實現跟今天一樣的效果。實際上,做到今天這樣上車的效果,沒有雙方 all in 是不可能的。他們也是全力以赴,特别開放地投入。
而且,我們量産真的是第一次走完全程,不是幾百台工程車,所有的問題都是在萬級的數量級去體驗。你不知道我們客戶會把車開到哪裏,就好像有的 case 在農村,到處都是雞。但最後,我們也都處理好了。
新智駕:在這些極端場景裏,元戎做的怎麽樣?
周光:跑得可以。2023 年 3 月,我們就發布了 " 無圖 " 方案,我們第一個搞出來的。但當時我們做了一個非常巨大的決定:量産端到端。這就意味着,我們是原生的端到端,一開始就是端到端的技術架構,所有的産品、工具鏈都是圍繞端到端來開發,不能先上一套 rule-based 的無圖方案再去叠代。
我們是唯一一個,你跟我約定一個城市,我們就能在約定地點一起接車,馬上去測試的公司,我覺得直到今天也很難有公司這麽做。
做得好也因爲我們足夠 all in,我有三四個月待在主機廠所在的城市,回到深圳的家都有點陌生。但做項目需要雙方都 all in,如果是各懷鬼胎沒有意義。
新智駕:八個月的量産時間是如何做到的?
周光:我們之前也有過幾乎量産的定點項目,這個項目還是現在智能化營銷做得最好的一個品牌。借這個機會,我們也積累了很多的項目經驗。
雖然我們在技術上走得最早,但當時行業認知是,做自動駕駛必須有圖,大家都認爲 " 無圖 " 是皇帝的新衣。光靠元戎根本不可能(把市場教育起來),連車都上不了。隻有這個品牌有能力成爲 " 鲶魚 ",去把智能駕駛行業攪活起來。
這個公司學習了元戎的技術,幹出了第一版 " 無圖 " 方案推向市場。所有主機廠才慌了,才掀起了國内的智能化浪潮,中國汽車市場的智能化水平才能像現在這樣。
新智駕:跟主機廠的合作,讓你們學到了什麽?
周光:我們跟主機廠的合作,本質是把我們變成更 to C 的公司。哪怕是端到端、" 無圖 " 技術,沒到量産前,都還是通過 demo 獲取客戶,你隻關心這個系統的上限。
但是真正的量産,需要把産品交到消費者手中。你對底線的把控、對穩定性的把控、對一緻性的把控,這非常重要。2020 年,我們 10 台車裏隻有 7 台能用,其餘 3 輛不知道什麽原因用不起來,這也是量産上的經驗不足導緻的。
跟頭部主機廠從 0 到 1 量産合作,是極其難得的機會。因爲 0 到 1 是最關鍵的,市場機會是逐漸收斂的,沒有人再願意冒險把車給沒有量産經驗的廠商。我覺得元戎是最有 tech vision 的。
新智駕:第一個量産項目有沒有掙到錢?
周光:營收很可觀。但如果要覆蓋研發成本,那(第一個項目)還不夠。高階智駕和低階智駕不一樣,高階智駕的市場沒那麽惡劣。我們現在跟别人談都說:元戎比别人貴,但是效果好。并且比現在某頭部廠商,我們(智能駕駛系統的)價格還是很親民的。
新智駕:有哪些量産經驗可以沉澱下來?
周光:核心還是系統穩定性。本質我們是一個 AI 系統,不是靠代碼,按道理我們的工程難度比中低階 rule-based 公司難度低。他們寫 if-else,遇到問題就反複調。我認爲這不是工程學問題,我們是 AI,爲什麽要調整那些規則呢?
新智駕:基于 AI 就不會出現 bug 嗎?
周光:不能叫 bug,并且我們有安全機制。第一,我們出現問題的概率很低,第二,我們對安全問題有兜底。另外,安全兜底機制肯定要叠代。随着 AI 能力的提升,你會更不想去限制這個 AI。隻是在某些場景下,兜底機制會去接管這個車輛,避免風險發生。其實,今天的 AEB 就是人類智駕的兜底,我覺得未來 AI Safety 會變成新的 AEB。
新智駕:未來合作車型有什麽進展?
周光:在共同推進 10 餘款車型的量産。我們是和客戶深度合作,跟一些廠商的車海戰術風格不一樣。這樣的邏輯,車企也願意跟我們一起打造爆款車型。
新智駕:數據背後,數據的帶寬和存儲費用就很巨大,這個成本和算力儲備問題如何解決?
周光:端到端跟 VLA 對算力要求沒有語言大模型那麽大,今天的 Orin 能夠實時跑的也就是 10 億的參數,車端的端到端 VLA 跟真正的大語言模型比起來是個小網絡。
做端到端和 VLA 的時候,算法是巨大的差距,對算力的要求沒有大模型那麽大,我們自己投了不少錢在卡上,也有自己的算力儲備。同時阿裏也是我們的股東,我們在有算力需求時候也可以跟股東尋求幫助,這并不是問題。
新智駕:目前元戎團隊規模如何?
周光:集團人數 800 人左右。人越多說明你越原始,越不是端到端。AI 相關人才難以快速擴招,但是量産交付的工程團隊相對好點,這麽多年,主機廠、傳統 Tier1 已經培養了很多工程人才。
新智駕:元戎是行業裏比較早做無圖的公司。但是此前,在我們的采訪中,有地圖廠商的負責人直言:過去,高精度地圖全部裝在車機端的,現在變成在訓練端。一些車企每時每刻都在用高精度地圖,同時通過數據采集,進行雲端訓練。什麽才是真實的無圖 NOA?
周光:我們是最早的,不是比較早。比較早期的版本,确實很難看出來是不是無圖。但是端到端模型做出來的時候一定是基于 " 無圖 "。你想做好 AI,你就沒辦法用高精地圖的形式去做。高精地圖是矢量數據,AI 不擅長處理矢量數據,就跟人對加減乘除一樣天生不擅長。
新智駕:目前,高階智駕裏有一個不成文的 " 華大地魔 " 的第一梯隊的說法,您認可嗎?
周光:華大地魔是去年的說法。去年能跑高速 NOA 的就能稱爲高階,但今年的高階就是真高階,要有城市 NOA。現在已經量産城市 NOA 的智能駕駛公司也就三家,元戎是其中一家。
新智駕:今年的快速發展,元戎是不是已經進入了第一梯隊?在您的标準裏,哪些要素是成本第一梯隊必備的?
周光:具備 " 無圖 " 端到端的城市智駕能力,才有可能進入第一梯隊。但這是一個雞生蛋、蛋生雞的問題。你要做端到端就要先量産,沒有量産數據玩不了端到端。但你現在沒有端到端,之後就量産不了。這就是爲什麽我說以後的智駕方案商會很難,身位會被拉得越來越遠。沒量産經驗的,想讓車廠付出一定的時間成本陪你玩,這很難了。
另一方面,成爲第一梯隊,你需要有萬台級起步的量産車,低于萬級沒有意義。端到端 1.0 能有萬台級的車,效果就很好。要做 VLA,10 萬台車的規模才是一個理想狀态。VLA 對數據量的要求會比端到端 1.0 多一個數量級。國外的一些端到端公司沒有量産項目,解決不了數據問題,10 億美金也買不到數據,物理 AI 在中國的機會還是比較大的。
新智駕:此前,元戎被媒體報道會采用高通的智駕芯片。但是您在公開演講中也表示,基于端到端模型,元戎啓行正基于 Thor 芯片研發 VLAM(Vision-Language-Action Model,視覺 - 語言 - 動作模型),該系統将于明年推出。高通的這一說法靠譜嗎?
周光:我們還在評估。我們的方案可以适配各家芯片廠商,可以根據主機廠的要求去做适配。芯片是主機廠選,尤其是海外的主機廠,會更提前選定芯片廠商。
新智駕:現在是 11 月,明年到這個時候,端到端會有什麽樣的變化趨勢?
周光:可能今天你用高速 NOA 覺得很舒服。但在端到端出來之前,城區高階智駕就不是好用的狀态,真正好用還是在端到端出來之後。
到明年這個時候,你用城市 NOA 就會像高速 NOA 一樣舒服,百公裏級的接管頻率明年應該能看到。當消費者很願意用的時候,市場就真的收斂了。
新智駕:今年年初,您關于 L4 的說法引起了不少争議,您的看法還是這樣嗎?
周光:L4 這條路就是有局限性,它商業化落地就是很難。我覺得,大模型出來之後,大家更信 AI 了,這是一個價值觀的變化。你不能對這個世界發生的事情無動于衷。
我是 2020 年就意識到(基于高精地圖方案的)L4 這條路存在不足,但是我們會做 robotaxi,以端到端架構支持運營,而不是基于模塊化的、基于高精度地圖去做,那沒有意義,沒有商業化。我們的運營模式就是沒有區域限制的運營。
物理 AI 最根本的目的一定是取代人,自動駕駛的最終目的也是把人去掉,讓機器幫我們開車。技術線路的問題,就是說你不要拿 Waymo 這套技術線路和特斯拉的技術線路比,兩個出發點是不一樣的。
新智駕:元戎有上市計劃嗎?
周光:我們不急。因爲我們走在正确的路上,也有自我造血能力,沒有什麽上市壓力。