"2022 毫末三大戰役穩健收官。" 毫末智行董事長張凱在第七屆 HAOMO AI DAY 上說。
張凱所指的 " 三大戰役 ",是毫末面向 2022 年提出的 " 數據智能技術之戰 "、" 智能駕駛城市場景之戰 "、" 末端物流自動配送車的規模之戰 "。
在此屆大會上,毫末智行也交出了 2022 年的成績單,具體來看:
2022 年毫末三代 HPilot 産品已搭載至魏牌、坦克、歐拉、長城炮等近 20 款車型,輔助駕駛用戶行駛裡程突破 2500 萬公裡;
目前毫末城市 NOH 軟件封版達到交付狀态;
末端物流自動配送車已初步完成商業閉環,交付超 1000 台,小魔駝配送訂單量突破 13 萬單;
MANA 學習時長超 42 萬小時。
對于 2023 年自動駕駛行業的發展預測,張凱表示:"2023 年,智能駕駛下半場的競争将進入加速期,高階智能駕駛産品商業應用将迎來大規模落地。"
基于這一基礎判斷,張凱從行業、技術、産品、人才等方面對 2023 年自動駕駛行業發展做出十大預測。
行業層面,2023 年自動駕駛将全面進入 3.0 時代;高級别智能駕駛将成為中端車型标配;全新一代芯片、傳感器進入市場,自動駕駛生态呈現更豐富多樣性。
技術層面,大模型在數據合成、知識提取等方面的能力将助力自動駕駛叠代速度實現量級提升;自動駕駛系統比拼将由功能競争轉變為通勤效率競争;超算中心會成為自動駕駛企業的入門配置。
産品層面,城市導航輔助駕駛進入重感知階段,大規模量産交付大幕拉開;智能駕駛的用戶體驗将從嘗鮮轉變為用戶依賴;末端物流自動配送車整體成本降至 10 萬元以内,将進一步改善生産關系。
人才領域,張凱判斷 AI 自動駕駛領域激烈的人才競争将會延續到 2023 年。
面對接下來一年所要迎接的趨勢和機遇,張凱提出毫末智行要打響 "2023 年四大戰役 ",包括 " 智能駕駛裝機量王者之戰 "、MANA 大模型巅峰之戰 "、" 城市 NOH 百城大戰 "、" 末端物流自動配送商業之戰 "。
張凱表示," 智能駕駛裝機量王者之戰 " 是重中之重,毫末智行将完成多平台、數十款車型、數十個項目的異步并行開發,通過智能駕駛流程化開發和标準化交付,進一步推進未來搭載毫末輔助駕駛産品的乘用車達百萬量級的目标。
"MANA 大模型巅峰之戰 " 是指毫末将在智算中心助推下,将大模型的應用落地進行到底。" 城市 NOH 百城大戰 " 則是将毫末城市 NOH 有序落地到國内 100 個城市。至于 " 末端物流自動配送商業之戰 ",張凱表示毫末智行将繼續堅持 5S 合作服務模式,實現産品和解決方案落地,加速無人配送行業應用進程。
相較于去年提出的 " 三大戰役 " 可以看到,毫末智行對于輔助駕駛在城市場景和車端的應用落地有了更具體、更明确的目标規劃。
所謂的智算中心則是在此次 HAOMO AI DAY 上,毫末智行還發布了和火山引擎聯合打造的智算中心 " 雪湖 · 綠洲 "(MANA OASIS)。
毫末智行 CEO 顧維灏表示," 在 MANA OASIS 加持下,毫末将沖刺進入自動駕駛 3.0 時代。"
按照毫末智行方面的說法,MANA OASIS 是中國自動駕駛行業最大智算中心,每秒浮點運算達到 67 億億次,存儲帶寬每秒 2T,通信帶寬每秒 800G。
有了 MANA OASIS 的加持,毫末智行亮相了 MANA 五大模型,包括視覺自監督大模型、3D 重建大模型、多模态互監督大模型、動态環境大模型以及人駕自監督認知大模型。
在顧維灏看來,為了更低成本、更高效獲取更多高價值數據,需要解決從離散幀自動化擴充到 Clips 形态的問題。由此,毫末首先利用海量 videoclip,通過視頻自監督方式,預訓練出一個大模型,用利用部分人工标注的 Clip 數據進行 Finetune(微調),訓練檢測跟蹤模型,使得模型具備自動标注的能力。
然後,将已經标注好的千萬級單幀數據所對應的原始視頻提取出來組織成 Clip,其中 10% 是标注幀,90% 是未标注幀,再将這些 Clip 輸入到模型,完成對 90% 未标注幀的自動标注,進而使視頻自監督大模型實現 4D Clip 标注 100% 的自動轉化,同時降低 98% 的 Clip 标注成本。
3D 重建大模型則是用更低成本解決數據分布問題。面對 " 完全從真實數據中積累的 corner case 困難且昂貴 " 的行業難題,毫末智行将三維重建 NeRF 技術應用在自動駕駛場景重建和數據生成中,它通過改變視角、光照、紋理材質的方法,生成高真實感數據,實現以低成本獲取 normal case,生成各種高成本 corner case。
多模态互監督大模型則緻力于精準識别異形障礙物。其引入了激光雷達作為視覺監督信号,直接使用視頻數據來推理場景的通用結構表達。通用結構的檢測,補充已有的語義障礙物檢測,以提升自動駕駛系統在城市複雜工況下的通過率。
動态環境大模型則進一步使用重感知技術,降低對高精地圖依賴。毫末智行認為,解決了路口問題實際就解決了大部分城市 NOH 問題。
基于此,毫末智行在 BEV(鳥瞰圖)的 feature map(特征圖)基礎上,以标精地圖作為引導信息,使用自回歸編解碼網絡,将 BEV 特征解碼為結構化的拓撲點序列,實現車道拓撲預測,提升車輛感知能力。
至于人駕自監督認知大模型,則是緻力于讓汽車掌握高水平司機的開車技法。據顧維灏介紹,毫末先引入了用戶真實的接管數據,同時用 RLHF(從人類反饋中強化學習)思路先訓練一個 reward model(獎勵模型)來挑選出更好的駕駛決策。
需要指出的是,盡管毫末在數據利用上下足了功夫,但從現有的數據積累來看——毫末用戶輔助駕駛行駛裡程 2500 萬公裡;作為對比,特斯拉 FSD Beta 行駛裡程已經超 1 億公裡——毫末 NOH 還需要更多的裝機量以積累數據。
小結
事實上,在過去的 2022 年,無論是毫末智行,還是主攻 L4 級自動駕駛的公司,如文遠知行、小馬智行、馭勢科技、元戎啟行、輕舟智航等,都在着重布局前裝量産的輔助駕駛功能,毫末的競争對象已不再局限于小鵬、特斯拉等車企。
如果說 2022 年隻是燃起了城市輔助駕駛之戰的硝煙,那麼 2023 年将是量産應用的關鍵占位期。
對毫末而言,背靠長城這棵大樹,其城市 NOH 已上車 20 餘款車型,取得了階段性成果。然而,随着越來越多競争者進入城市輔助駕駛這一角鬥場,毫末顯然還未迎來喘息時刻。
(本文首發钛媒體 App,作者 | 肖漫,編輯 | 張敏)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App