2023 上海車展,在各方期待中開啓。
一方面新能源車型、新智能化體驗,眼花缭亂,但另一面是百年汽車工業變革迎來最重要的分水嶺、轉折點——智能汽車的 " 安卓時刻 " 已經到來。
" 自動駕駛 3.0 時代 "、"Transformer+BEV"、" 重感知、輕地圖 "、"GPT 上車 " ……
伴随國内自主玩家對汽車智能化,特别是智能駕駛的猛烈沖擊,新的技術、名詞一下湧現出來。不過仔細梳理過去幾年的發展,會發現這些趨勢并非偶然。
相應的 AI 技術、思路、理念,早有行業前瞻性玩家呼籲和驗證,并且一直在踐行推進,比如有 " 自動駕駛量産第一 " 之稱的毫末智行。
智能車,在朝什麽方向卷
所謂智能汽車的 " 安卓時刻 ",從現象上看,早有蹤迹可尋。
首先是在智能駕駛的功能、方案配置上,L2 智能駕駛逐漸成爲标配。
L2 智駕功能開始向 15w 左右入門的車型滲透,代表着占汽車消費市場絕大多數的用戶,可以享受智能駕駛帶來的便捷,也就同時有更多機會挖掘智能座艙的功能。
其次是感知算法上,重感知、去高精地圖技術路線正在成主流。這也讓視覺感知的重要性進一步上升。
第三點,AI 模型上收斂到 Transformer 架構。起源自 NLP 領域、以 Transformer 爲代表的大模型開始被引入到自動駕駛系統的研發中。
最後,在 AI 裝置層,超大算力的智算中心成爲标配。幾乎所有自研玩家都走上了自建超算基礎設施的道路,預先儲備日後 5-10 年算力需求。
所以,本屆車展上,理想提出智能汽車已經進入 3.0 時代,标志是智能駕駛能力延伸到了城市場景,擺脫對高精地圖的依賴,像人類司機那樣實時地感知、決策、規劃。
而且 " 重感知 " 的提法,今年更是成爲主流聲音。包括小鵬、華爲、百度等等重要玩家,都開始強調視覺感知算法。
談到重感知,幾乎所有的自動駕駛團隊,都在說這兩個詞:BEV、Transformer。
幾乎所有玩家都達成了一個共識,自動駕駛量産落地,目前必須通過規模化性價比的路線邁出第一步。
這樣的的認知,有些玩家是在與主機廠的磨合中獲得認知,有的則是在無人駕駛方向上碰壁後尋找的新出路。
但與衆不同的是,3 年前這樣的趨勢就已經有迹可循,并且有人一直在踐行。
背後的玩家,是行業内被稱爲 " 量産自動駕駛第一名 " 的——毫末智行。
毫末做了什麽?
自動駕駛行業内,3 年以來一直有這樣一個神奇的現象:
毫末智行總是先人一步探索實踐 AI 技術的最前沿,無論是 BEV、大模型、重感知…而後行業的發展方向總是能證明,毫末是對的。
按照時間線劃分,毫末智行率先實踐的理念和技術依次爲:
2021 年 3 月,提出自動駕駛三定律:從低速到高速,從載物到載人,從商用到民用。
2021 年 6 月,國内第一個探索将 Transformer 大模型落地應用到自動駕駛産品中。
2021 年 12 月,率先發布中國首個自動駕駛數據智能體系 MANA(雪湖)。
2022 年 4 月,率先發布行業首個基于 " 重感知,不依賴高精地圖 " 技術的城市 NOH。
2022 年 4 月,國内首家研發落地 BEV 感知技術。
2022 年 9 月,率先提出自動駕駛 3.0 時代概念。
2023 年 1 月,建成國内首個自動駕駛行業最大的智算中心 MANA OASIS(雪湖 · 綠洲),浮點運算每秒 67 億億次。
2023 年 1 月,率先發布視覺自監督大模型、3D 重建大模型、多模态互監督大模型、動态環境大模型、人駕自監督認知大模型等五大模型。首次将 GPT 大模型技術引用到自動駕駛認知模型訓練。
2023 年 4 月,正式發布行業首個自動駕駛生成式大模型 DriveGPT,重塑汽車智能化技術路線。
今天業内幾乎所有達成共識的觀點,毫末幾乎都在 1-2 年時間前進行了驗證。
的确令人驚奇。
但回溯毫末的曆史,不難發現這些現象都是必然。
毫末成立之初,确定了公司戰略:利用成本和規模的優勢,使用數據智能,逐步落地自動駕駛産品。
這是毫末一直以來貫徹的 " 第一性原理 ",一切的決策都是爲這個原則服務。
成立之初:做什麽樣的自動駕駛
2021 年 3 月毫末首提自動駕駛商業發展三定律——「從低速到高速,從載物到載人,從商用到民用」。
三定律折射出的是毫末對于做自動駕駛的态度:「可行、可靠、可商用」,而且是漸進式落地。
而在推進量産落地的過程中,毫末智行自然而然意識到以 AI 爲主的算法,必須有大量數據輸入叠代反饋組爲前提,才有可能達到商用的可靠性。
所以,毫末提前 " 預知 " 大模型的重要性,并且在 2021 年 6 月(國内)率先開始探索将 Transformer 大模型落地自動駕駛産品。
而從自動駕駛技術的客觀規律和因果性出發,毫末随後的一系列前瞻性舉動,其實都是圍繞 " 大模型大數據 " 的核心展開。
比如,緊随 Transformer 而後的,是 2021 年 12 月發布的國内首個完整的數據智能體系 MANA。MANA 雪湖對于自動駕駛研發的意義,是一套完整的技術體系。
由通用基礎服務、核心算法原型(感知、認知、地圖以及仿真系統)、數據驅動系統、數據可視化系統組成,提供全局的數據洞察等能力并且提供車輛管理、平行駕駛等平台工具。
MANA 對于自動駕駛和新的感知、認知、自動标注、自動驗證等等環節全部覆蓋。
" 基礎設施 " 問題解決好以後,毫末的速度開始展現。
快速發展期:大模型威力初顯
2022 年 4 月,毫末率先發布行業首個基于 " 重感知 " 技術的城市 NOH。這也是行業内第一次公開提出 " 去高精地圖依賴 " 的路線。
與其他玩家在落地過程中遭遇挫折尋求改變不同的是,毫末 CEO 顧維灏一開始就意識到了高精地圖的 " 掣肘 " 之處:除了在政策準入方面會拖慢落地進度,更重要的是它在地圖采集維護的成本和實時性上永遠無法滿足量産要求。
所以在提出重感知輕地圖路線的同時,毫末還首次在國内首次公布了 BEV Transformer 感知技術的細節。
通過自研的 BEV Transfomer,毫末智行在城市道路上實現了多傳感器融合車道線識别,對自車姿态的容忍度更高,減少了車道線的抖動;面對城市環境複雜路面,縱向誤差上能夠表現更好,對于路面起伏的魯棒性也更高。多相機之間相互的輔助,還擴充了檢測視野,相比之前的融合跟蹤方法,響應更快。
這對于城市領航輔助的量産落地,至關重要。現在成了幾乎所有自動駕駛自研玩家的必修課。
2022 年 9 月,随着對大模型應用的逐漸深入,毫末智行又首次在行業内提出 " 自動駕駛 3.0 時代 " 的概念,明确了以數據規模作爲劃分标準,并且強調了大模型和可解釋的理念,現在看起來這個趨勢更加明顯:
最早的硬件驅動方式,稱爲自動駕駛的 1.0 時代;最近幾年的軟件驅動方式,稱爲自動駕駛的 2.0 時代;即将很快發生,并将持續發展的數據驅動方式,稱爲自動駕駛的 3.0 時代。
自動駕駛裏程由硬件驅動、軟件驅動時代的百萬公裏、上千萬公裏,直接飙升至 1 億公裏以上。
毫末所有的預判,無論是率先引入 Transformer 大模型、BEV、建設數據智能體系 MANA、等等,都是在爲 3.0 時代做準備。
因此,毫末順理成章成爲了國内第一個建成智算中心 MANA OASIS(雪湖 · 綠洲)的自動駕駛公司,浮點運算每秒 67 億億次,爲今後 5-10 年的算力需求提前做好了儲備。
毫末智行在技術上的前瞻布局,也在實際商業落地上獲得了豐厚的回報——用戶累計使用裏程超 4000 萬公裏,落地數十款量産車型。
2023 年這個節點上,智能駕駛在性能和成本的平衡上,有了新的突破,促成這一進展的原因,是在研發上新技術的落地讓算法能力快速進步。
近期,在實現自動駕駛路線之争上,比亞迪董事長王傳福炮轟 " 無人駕駛 ",等于将這一争論擺在公衆層面。
實際來看,自動駕駛達到成熟的無人駕駛會是一個長期過程,但通過自動駕駛技術升級方式,從輔助駕駛走向完全的自動駕駛,已經成爲全行業公認的實現路徑。
之前關于自動駕駛路線、方案的所有的争論分歧幾乎都統一到下面幾點共識上:
首先無論從法規還是技術層面,L2 商業落地一定比 L4 更快。
其次,智能駕駛技術需要重感知輕地圖。而在這個基礎上,雖然純視覺方案還沒法十全十美,一段時間内多模态融合感知方案仍然是高階功能落地的必須。
但這樣的發展趨勢,另一個側面展現的是 L2/L2+ 功能,現在可以用較輕的傳感器、算力方案實現,具備了向大衆化市場普及的條件。
第三,國内用戶對于智能駕駛的反饋,由 " 嘗鮮 " 變成對性價比、産品價值的權衡,說明市場需求出現了本質的變化,智能車區别于傳統功能車,這個概念已經深入人心。
而在對自動駕駛最重要的數據叠代層面,量變到質變的門檻也越來越近。
3.0 時代自動駕駛的該走什麽樣的方向和路線?毫末智行也剛剛給出了自己的判斷和參考。
自動駕駛 3.0 時代是什麽?
2023 年 1 月,毫末智行率先發布視覺自監督大模型、3D 重建大模型、多模态互監督大模型、動态環境大模型、人駕自監督認知大模型等五大模型。
這是行業内首次将 GPT 大模型技術引用到自動駕駛認知模型訓練。
而十多天之前,毫末智行又正式發布行業首個自動駕駛生成式大模型 DriveGPT。
3.0 時代的第一步棋,毫末給出的參考是——類 GPT 技術 " 上車 "。
毫末的邏輯是,生成式大模型的思路在目前階段,既可以率先應用在認知決策模塊,不斷學習認知系統的拟人化駕駛風格,形成駕駛決策優化,又可以在仿真訓練環節大大提高高價值數據密度,大幅提高自動駕駛算法在感知側的叠代效率。
而之後逐漸将 DriveGPT 大模型應用到自動駕駛的各個模塊,實現感知、認知的端到端打通。
大模型大算力能力帶來的自動駕駛技術飛躍式的發展,這一波浪潮最先觸及用戶端的,幾乎可以肯定就是端到端的自動駕駛技術開始普及。
毫末智行所開先河,可能重塑傳統的汽車智能化技術路線。也有可能是以計算機視覺技術爲主的自動駕駛行業,一直盼望的屬于自己的 "ChatGPT 時刻 "。
車展前後,類 GPT 技術上車,我們看到了更多的蛛絲馬迹。無論是座艙還是智駕,生成式大模型的價值被越來越多的玩家挂在嘴邊,而有實力的,已經開始實踐。
星星之火,是可以燎原的。
汽車工業百年大變革下,新的一輪競速,誰最有可能先到終點?
這次車展之後,可能不會再有疑問了。
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~