更深刻了解汽車産業變革
出品: 電動星球 News
作者:星球君
10 月 17 日,極越搞了個大新聞。
當天上午,極越官方發布了兩個視頻:一個是極越 PPA 點到點領航輔助駕駛,在上海外灘陸家嘴的「純視覺」一鏡到底視頻,另一個則是基于 Occupancy Network 占用網絡的感知技術 DEMO 視頻。
截止到 2023 年末,一鏡到底的城市智駕不少見,但官方發布 OCC Demo 的例子并不多,展示純視覺城市領航的主機廠,在中國更是幾乎沒有。
盡管今年城區智駕卷得不可開交,BEV、Occupancy Network 等技術底座大家都在講,但「講」和極越直接「秀」,還是兩個概念。
關鍵在于,從極越當天所展示的 Demo 來看,這是一套基于純視覺路線的高階智駕。
這意味着,極越已經具備了量産純視覺高階智駕的能力——在「擺脫 LiDAR 」這件事上,極越和特斯拉有着同樣的追求——甚至這次國内首發純視覺 +OCC 雙視頻,已經讓極越的本土化智駕能力,搶先了特斯拉一步。
從概念車到實際跑通城區智駕,極越的純視覺能力走到了哪一步?如果這套純視覺方案真的量産,又能否讓極越在 2023 年末,與特斯拉,又或者是其他新造車正面對壘?
我們 17 日下午在北京采訪了極越 CEO 夏一平和百度智能駕駛事業群組技術委員會主席王亮。
結合訪談内容,我們今天來聊聊極越的「後發先至」。
丢掉拐杖
想要聊清楚爲什麽行業内很多玩家都在「密謀」擺脫激光雷達,我們先要了解當初激光雷達爲什麽上車。
回到 2015 年,自動駕駛的洪荒時期,激光雷達同時獲得了 L4 技術公司,以及乘用車工程路線兩邊的認可。
原因很簡單,當時純視覺路線還沒有得到 BEV、Transformer 等新技術的助力,提取信息極其困難。特别是對于「3D 可達空間」,也就是覆蓋真實物理世界行車環境的感知來說,當年的純視覺遠談不上成熟。
而激光雷達直接能得到 3D 立體感知,并且無論是理論研究還是工程落地,感知層面都簡單直接得多。
于是激光雷達成爲了量産自動駕駛第一個七年之癢的「肌肉記憶」,直到 2023 年末,帶有激光雷達的量産智駕方案,仍然是主流。
但同樣是 2023,我們觀察到一些變化。
比如供應鏈端,今年大疆車載的成行平台、毫末智行的第二代 HPilot,都提出了不依賴激光雷達,隻用純視覺實現城區領航駕駛的方案;博世 9 月份也已經表示,不再投入任何資源開發激光雷達。
前不久,10 月 11 日毫末智行 AI Day 上,董事長王凱接受采訪時也對我們表示,長遠來看,激光雷達是要去掉的。
再比如車企層面,前小鵬汽車自動駕駛副總裁吳新宙也曾透露,盡管他們不确定激光雷達是否一定需要,但在實際的建圖、定位等功能上,都跟激光雷達沒什麽關系。
「我們用激光雷達一直非常收斂」,吳新宙 7 月份接受晚點 Auto 采訪時這樣說。
激光雷達開啓了自動駕駛感知進化的滾滾洪流,但随着技術進展,我們發現純視覺路線正在補全立體感知曾經的劣勢,而從供應鏈到主機廠,逐步減輕,甚至嘗試擺脫激光雷達的依賴,也在行業頭部玩家的讨論當中。
于是回到一個問題:爲什麽偏偏是極越,國内首個發布了純視覺方案跑通點到點城區智駕的視頻?
事實是,極越的速度,4 年前就有迹可循。
早在 2019 年初,馬斯克就曾表示「激光雷達就像是拐杖」,當年 4 月份 Autonomous Day 上那句「你會開車不是因爲眼睛發射激光」,更是純視覺路線的名場面。
冷知識:那時大洋彼岸的中國,同樣有着純視覺自動駕駛方案的探索者。
2019 年 CVPR 國際計算機視覺會議上,4 年前的王亮這樣說:
「相比成像原理和時空采樣密度各異的激光雷達,視覺成像技術的發展趨勢清晰,視覺感知在數據标注、數據複用和模型泛化技術上都更加成熟可控」。
2023 年 10 月 17 号的王亮這樣說:「我們想辦法戒掉激光雷達」。
從 2019 年的探索,再到 2021 年極越正式成立,這條純視覺之路遠在大衆視野之外延伸。
極越成立的最早階段,伴随着 BEV、transformer 等新技術的出現,夏一平和王亮就打算對純視覺路線做徹底的技術重構。
但站在 2021 年那個節點,純視覺還不夠成熟,BEV+Transformer 路線尚未得到足夠充分的檢驗,大家都需要激光雷達把好最後一關。
所以第一個版本的極越智駕研發方案,是有激光雷達的——這可以算是極越的「1.0」時期,憑借激光雷達的本征安全,彌補純視覺算法和算力的暫時不足。
伴随着這次雙視頻的公布,我們看到了極越的「2.0」時期,也就是純視覺能力具備較高成熟度的時期。
在一鏡到底的城區智駕視頻裏,極越展示了不借助激光雷達的純視覺能力,跑完上海陸家嘴 - 外灘 - 南浦大橋等路段,全程零接管。
從路段選擇上,我們能看到極越的信心,這是上海的核心繁華地段,同時 9 分鍾的視頻裏,極越的純視覺方案展示出了全面的能力:
包括機動車 / 非機動車 / 樁桶的避讓,以及城區内的變道、上下匝道、隧道分流等極其考驗感知和處理能力的「老司機」級别場景。
一鏡到底的背後,也代表着極越 BEV+Transformer 的純視覺技術方案,正在走向成熟。
雖然不是最早的新造車,但極越的純視覺智駕方案,卻是和特斯拉同一時間,向純視覺高階智能駕駛發起沖擊的先行者。
後發先至的信心
除了展示純視覺方案以外,極越 17 号還公開了号稱「國内首個」的占用網絡技術(Occupancy Network,下面簡稱 OCC)DEMO 視頻,這是純視覺智駕能力的又一次「秀肌肉」。
視頻中,極越展現了完整而清晰的 OCC 能力,包括欄杆、綠植、路障的标準障礙物以外,還另外識别出了施工中的工程車、樹木中被遮蔽的路燈等等異形障礙物。
OCC 是智能駕駛感知領域的關鍵技術,基于 BEV 鳥瞰視覺的 OCC 占用網絡,是真正實現 3D 可達空間感知的「利器」——純視覺 OCC 的終極目的,就是不依賴激光雷達,甚至也不依賴毫米波雷達和超聲波雷達,實現複雜環境下的智能駕駛功能。
那麽,OCC 如何幫助純視覺擺脫對 LiDAR 的依賴?
占用網絡技術(Occupancy Network),以視覺信号爲基礎,在傳統 3D 目标識别能力之上,通過體素(Voxel)化的方式理解和處理空間信息。
體素,可以簡單理解爲立體的「像素」,像素組成計算機眼裏的平面世界,體素則組成車輛識别的立體物理世界。
由于增加了體素占用的感知,感知系統可以對 3D 物理空間的可通行區域進行高保真度還原,不需要考慮物體是什麽,隻考慮體素是否被占用,從根本上避免傳統視覺對非訓練集内物體的漏檢問題,使模型的泛化能力大幅提升,能更好适應不同場景和環境。
相比激光雷達産生的稀疏且不連續的點雲,高清攝像頭采集的信息内容更豐富,讓占用網絡更好地将 3D 幾何信息與語義信息融合,幫助汽車機器人更準确還原 3D 場景。
另外,在如今智駕攝像頭信息豐度持續提升的背景下,OCC 能更好地将 3D 幾何信息與語義信息融合,幫助智駕系統更準确還原 3D 場景,和視覺 + 激光融合的方案比起來,泛化和模型叠代的速度都更優異。
從終局回到現在,夏一平表示速度決定勝負。
他采訪時透露,實際上純視覺方案的模型能力提升速度、泛化速度,都超過了極越團隊的預期。
極越的 OCC 也同樣争分奪秒,爲了長期競争力,團隊選擇盡快上線,然後形成「BEV+Transformer 的純視覺方案 +OCC 占用網絡」的技術體系——極越官方表示,這套架構已經具備了量産能力,激光雷達不再是唯一的解決方案。
「這是一套未來幾年都撐得住的架構」,王亮這樣形容極越自 2021 年開始重寫的這套純視覺技術底座。
2021 發生的另一件事,是 1 月份馬斯克開了一場會,他說「我們應該用純視覺方案解決(自動駕駛)問題,如果我們能做到,我們就能颠覆遊戲規則」。
很多現在看來足夠激進的技術路線,都源自當初一次更加激進的拍闆。兩個大陸,同一時間,兩個團隊同時向純視覺發起沖擊,于是兩年後,我們看到了極越的純視覺 +OCC 速度。
速度的背後不止有拍闆的堅決,還有智能體系化能力,進場兩年的極越怎麽「卷」嬴「老牌新勢力」?
夏一平給出的答案是:如果你認爲汽車是智能設備,需要非常龐大的軟硬件生态支撐,極越背靠的技術體系,是最完美的。
不論是 AI 算力、數據能力、原子化能力,他認爲這些技術能力,都可以成爲極越的「後場發動機」。
高階智駕的中場戰事
本周,特斯拉在華正式推送 32.9 軟件,更新 Tesla Vision。
從 17 号極越公布去激光雷達城區智駕,正式版 Tesla Vision,大家對這兩家公司在中國、在純視覺路線正面對壘的期待,被連續激發。
夏一平前段時間去了美國,開了 FSD Beta,他覺得不錯。但是他提了一個關鍵問題:美國的不錯,是不是就等于中國的不錯?
他強調爲極越賦能的百度智駕深耕國内多年,對于中國的法規、路況、行車習慣來說,無論是城市間的泛化能力和本地化适配,一定比特斯拉更好、更快,「我們的 NOA 一定比他強」。
特斯拉 FSD 和極越 PPA,是目前基于占用網絡 + 純視覺 BEV 路線的兩大高階智駕功能。而在中國本土化道路上,目前 PPA 已經搶先落子,繼上海之後,其他主要城市也已經在并行檢驗。
當基于 OCC 占用網絡和 BEV+Transformer 組成的技術底座,組成了新時代的純視覺路線,這同樣是極越和百度作爲本土企業,在交通理解、數據閉環方面的速度優勢。
雖然官方尚未透露 OCC 占用網絡的具體量産節點,但夏一平表示,極越 01 的 PPA 點到點領航駕駛功能,會是「開箱即用」級别的迅速。
開箱即用的意思,是極越 01 從第一台交付開始,就将踏入高階智能駕駛的擂台,從上海開始鋪向全國。
從「開箱即用」開始積累的起點加速度,能否讓曾經與特斯拉同一梯隊沖擊純視覺智駕的技術先驅,轉變爲極越在城市智駕功能落地上的超越和領先?
我們量産車見。
(完)