關于激光雷達的必要性,業内一直有着不同聲音。
理想在成都車展上表示,激光雷達的作用非常像安全氣囊,雖然沒有它也能實現智駕,但視覺總有未見過的場景,激光雷達能對此起到安全兜底的作用。
理想高層劉傑的表态更明确——短期内不會放棄激光雷達。
至于另一邊的馬斯克則說到,激光雷達并非最佳選擇,數字神經網絡 + 攝像頭組合使用的效果才是更好。
面對激光雷達的争議性,這尴尬處境能有破局嗎?
01
特斯拉,走得太前了
說到智能駕駛,特斯拉是一個無法繞開的對象。
早在 10 年前,馬斯克就從航空領域拿來了 "Autopilot"(自動駕駛)一詞,用在自身智駕系統身上,借此來宣告正式投身到智駕賽道。
當時,谷歌自動駕駛汽車項目選擇了頭頂激光雷達的方案,立心實現 L4 級自動駕駛能力。
反觀當年特斯拉的體量,實際跟現時新勢力品牌幾無差異。
于是在成本控制能力和普及智駕目标都跟谷歌有着明顯差異以後,馬斯克毅然提出以攝像頭爲主的視覺路線來實現智能駕駛。
從事後總結來看,谷歌和特斯拉實際是兩派技術路徑代表,谷歌采取的是 "Top-down" 的自上而下路線,試圖從一開始就幹掉駕駛員的位置。
反之馬斯克作爲車企代表,"Bottom-up" 自下而上的方案要更合适走量的量産車。
這大概就是特斯拉視覺路線的起源。
按照馬斯克強調的第一性原理,既然人可以用雙眼來開車,那麽智能駕駛也應該隻需攝像頭也能完事。
因此在 2021 年的時候,特斯拉就宣布北美市場的 Model 3 和 Y,不再配備毫米波雷達和超聲波雷達,隻标配攝像頭。
如今,國産新款 Model 3,也砍掉所有雷達。
日前馬斯克再次表達了對視覺路線的看法,他認爲激光雷達并非汽車的最佳選擇,道路更适用于生物神經網絡和眼睛,數字神經網絡 + 攝像機組合使用的效果更好。
不過馬斯克也直言,他并不讨厭激光雷達。
在此其中,馬斯克提到的 " 數字神經網絡 "(transformer)是關鍵一環。
攝像頭在各個領域已經使用很久了,但要說它在智駕領域真正起到作用,這還得歸功于特斯拉技術路線上的創新。
2020 年 10 月,特斯拉第一次向用戶推送了 FSD Beta 測試版本,這是 BEV+transformer 路線開始證明自己實力的起點。
接着到了 21 年,國内大多數新勢力紛紛轉向同樣技術路線的研究,其中目前國内領跑的蔚小理和華爲,其實都采用了跟特斯拉一樣的技術方案。
BEV+transformer,究竟有什麽魔力?
02
已成主流的技術方案
首先來看,BEV 的英文全稱是 bird ’ s eye view,中文譯名是鳥瞰圖,說得直白些是 " 上帝視角 "。
BEV 實際也不是剛冒出來的新鮮事物,此前沒把它用在智駕層面,是因爲它有着一個比較突出的弱點——适應場景能力很弱。
比如說在經過崎岖不平的路面時,當攝像頭角度發生變化以後,導緻輸出效果出現了非常大的失真。
但 BEV 有個好處,就是能夠把多路攝像頭數據放在同一個模型裏運行,省去更多後處理的人力。
這時候 transformer 就派上用場了。
transformer 可以按照時間序列,給不同的特征和信息賦予權重,更好完成比對多路攝像頭的特征,以達成一緻的結果,借此實現更準确的感知識别效果。
你可以理解爲,transformer 是一個有資曆的廚師,它可以在旁邊輔助你怎麽做菜,教導你如何根據不同菜品,來分配好不同比例的油鹽醬醋茶,從而做出一道美味的菜品。
不過有了 transformer,也不是說就能一了百了。
BEV 本身的弱點還是很突出,它要先識别、再跟蹤,如果有一個東西它不認識,它就無法識别出來,更談不上會追蹤它。
另外,BEV 對遠距離物體的探測,也不能做到十拿九穩,這看着很遠的東西在高速場景下可能也就幾秒鍾事情,然而這可是人命關天。
于是業内又想出了一個解決辦法—— occupancy 占用網絡。
占用網絡是對真實世界物體的一種 3D 描述方法,具體來說是 " 栅格化 "。
相比于 BEV 需要先認識該物體,再來完成跟蹤的做法,占用網絡則是直接把物體給 3D 栅格化,也就是以一個個小方塊的形式來投射到 BEV 空間,并不用去知道這個物體究竟是什麽。
占用網絡的到來,進一步讓感知工作做得更準确了。
站在特斯拉角度,它認爲在 BEV+transformer+ 占用網絡的底層技術支持下,有攝像頭作爲硬件組合就夠了。
其中原因,還是因爲人家做得早,數據積累得多,同時算法亦更加成熟。
根據此前特斯拉 Q2 财報披露,截至到今年 6 月,特斯拉 FSD Beta 累計行駛裏程約合 4.8 億公裏,另外測試車隊人數已經超過 10 萬人。
事實上,數據積累得多隻是最表層因素,在 BEV 方案下要想收集數據并不困難,關鍵是要有一套數據閉環體系。
這需要你有量産車的運行數據,在得到數據以後再去做清洗,以保留高質量的數據,接着再去實現自動化标注,讓神經網絡得到更好訓練。
讓系統變得更聰明,這不是一天兩天的事,并且目前 FSD Beta 還隻是在算力隻有 144TOPS 的 HW3.0 硬件上運行。
結合日前馬斯克試駕了世界首個端到端方案的 FSD Beta V12 版以後,從中再次彰顯了特斯拉算法能力之強大。
正因如此,特斯拉不用激光雷達,确實是有它的厲害之處。
但激光雷達真是一無是處,純粹是中國品牌爲堆配置而生嗎?
事實非也。
03
激光雷達,該怎麽存在?
從感知能力而言,激光雷達和攝像頭之間還是起到相互補充的作用。
一方面由于激光雷達的點雲數據比較稀疏,穩定性不算強,那麽作爲底層建築的數據出現問題的話,在此之上所構建的軟件自然也更容易出錯。
反之攝像頭的數據量足夠大,它采用了非常多像素去描述周圍環境,因此整個穩定性是有着更高冗餘度。
就此角度來說,馬斯克極力推崇攝像頭也不隻是從成本出發,當中亦有對數據穩定度的考慮。
不過激光雷達的優勢,在于它的測距能力和精度是攝像頭所無法比拟的。
特别對于一些體積細小、非規則物體,激光雷達的點雲還是能夠對視覺探測起到補充作用。
正因如此,激光雷達可以說給系統起到安全兜底的作用。
事實上關于激光雷達 " 安全兜底 " 的定位,核心一點還取決于系統對極限場景的應對能力。
如果能像特斯拉那樣視覺能力已經足夠出色,那麽不采用激光雷達也是可取的。
但如果系統本身能力上限一般,同時又要求在當下就達到業内領先水平,那麽配備激光雷達這樣的 " 高性能工具 ",則是無可避免。
因此從本質來說,車企是根據自身能力和階段任務目标去決定,該不該用激光雷達。
打個比方,特斯拉 FSD 已經是一個高中生,它要去迎接高考是順理成章的事情。
但咱們多數中國車企可能還是初中生的水平,就想去跟特斯拉一起去參加高考,這難免是要多上點工具才行。
這也是爲什麽理想在成都車展表示,短期内不會放棄激光雷達的原因。
另外,此前吳新宙也說到,基于目前的技術能力,激光雷達在中國這種特别複雜的城市場景,還是起到了非常重要的作用,但這個作用未來能否由視覺完全取代,現在還太早去下定論。
" 我們用激光雷達一直非常收斂,其中建圖、定位、傳感器和激光雷達都沒有什麽關系,但現在還不是特别确定,一定要或者不要。"
雖然頭部玩家沒有明确要放棄激光雷達,但耐不住激光雷達最大的弊端—— " 貴 "。
上汽集團副總裁祖似傑說到," 我認爲不要去放棄激光雷達,但現在的問題是激光雷達太貴,如果它隻賣 100 美元,那我就全配。"
" 我跟華爲海思聊激光雷達,他們的觀點跟我蠻重合,他們認爲激光雷達的成本不低下來,就是死路一條。"
面對貴的東西,大家都樂意去找替代品。
盡管之前特斯拉高呼要走純視覺路線,但大概是發現自己走過頭了,後面在 HW4.0 硬件裏,又偷偷報備上 4D 毫米波雷達。
和普通毫米波雷達相比,4D 毫米波雷達可以測出高度數據,分辨率也更高,同時還能像激光雷達一樣生成點雲。
盡管在能力上較難比肩激光雷達,但 4D 毫米波雷達勝在便宜,相比于激光雷達高達幾千元的成本,4D 毫米波雷達隻有前者售價的 20% 左右。
就此角度來說,4D 毫米波雷達在一定程度上會是激光雷達很好的替代品。
不久前上汽集團就宣布,飛凡 R7 将搭載國内首批量産的 4D 毫米波雷達,此舉或将引領 4D 毫米波雷達的普及。
這樣看來,未來激光雷達大概率隻會在高價車型上才會搭載。
事實上,參照作爲旗艦車型問界 M9 隻搭載 1 顆激光雷達的做法,這比起阿維塔 11 标配 3 顆激光雷達的奢侈搭配,已然是要收斂許多。
可以預見,持續降低激光雷達的作用權重,乃至是放棄,還是大概率的選擇。
要想實現高階智駕,激光雷達不能說是 100% 的必需品,但它會是一定時間内多數玩家的選擇。
一方面是受自身軟件能力限制,另一方面是想更快追趕頭部玩家的步伐,那麽這中間所要付出的代價,自然是售價高昂的激光雷達。
不過激光雷達的成本曲線也在往下走,結合國内向來突出的産業降本能力,未來激光雷達有沒有可能降本至讓更多車企接受的範圍,咱們邊走邊看了。