網通社快訊 9 月 28 日,由中國電動汽車百人會舉辦的 2023 年全球智能汽車産業大會(GIV2023)在合肥召開。在以 " 智能汽車産業化發展新階段 " 爲主題的高層論壇上,智己汽車副 CTO、智能駕駛首席科學家郭輝以 " ‘更像人’的智能駕駛,智己對智駕技術的探索與思考 " 爲題發表演講。
郭輝表示,打造 " 更像人 " 的智能駕駛,是智己在智能駕駛領域一直追求的目标。智己實現的路徑是基于數據驅動,立足于各種交通場景,打造有溫度、" 更像人 " 的智能産品,實現差異化的用戶體驗。
以下爲演講實錄
首先我簡短介紹一下智己汽車,我們是一家年輕的公司,也是一家快速成長的公司,成立于 2020 年 12 月 25 日,是上汽集團牽頭成立的一家合資公司,緻力于成爲智能時代出行變革的實現者。我們在 2021 年發布了第一款車 L7,并在去年 6 月開始交付給用戶,也在用戶的心目中打造了電動車駕控的品質标簽。今年一季度我們開始交付第二輛 SUV S7,在用戶端也獲得了好評。今年 10 月我們将發布第三款車 LS6,将搭載最新的智駕技術。
今天我的報告分三部分:
第一,打造 " 更像人 " 的智能駕駛體驗,這是在開發領域一直追求的目标。
第二,我們如何打造 " 更像人 " 的智能駕駛體驗。
第三,報告一下我們在智能化技術演進方面的思考。
打造 " 更像人 " 的智能駕駛,是智己在智能駕駛領域一直追求的目标,我們實現的路徑是基于數據驅動,立足于各種交通場景,打造有溫度、" 更像人 " 的智能産品,實現差異化的用戶體驗。
智己在智能化、智能駕駛領域所積累的優勢來自于在上汽集團,2014 年就已經依托于上汽的前瞻工程團隊在智能駕駛領域進行相關的研究,在規控、智駕系統方面建立了豐富的技術積累。2017 年,上汽集團成立了人工智能實驗室,開啓了在深度學習方面的全面布局。2020 年,我們成立了智己汽車以後,和 Momenta 進行了強強合作,率先在智能駕駛這個垂直領域使用傳感器、多任務的 Transformer 模型,基于時序 BEV 的機制實現了 OneModel 感知模型的邏輯量産,2023 年一季度,我們聯合 Momenta 發布了基于深度學習的規劃這樣一個人工智能模型。
什麽是 " 更像人 " 的智能駕駛呢?我想借助幾個場景的案例可能更容易幫助大家理解。
第一個案例,關于擁堵插空變道,這是我們在日常生活中最常見的交通場景,這個場景對于現在的智能駕駛挑戰還是比較大的,因爲這個過程中車輛在不斷加減速,周圍的環境在動态變化,車與車在擁堵的情況間隙也非常小,一方面要求感知精度要非常高,對于周圍車輛的軌迹預測要非常準。二是對于我們在關聯系統,包括像橫向的控制、縱向的控制,要求非常精準。這個視頻展示的是智己汽車的智駕系統在擁堵的交通場景下實現了絲滑的編導,體現了 " 更像人 " 的感知和規劃決策。
第二個案例,一個擁堵跟車的場景案例。從左邊這個視頻可以看到,這個橙色的框代表了智己的智駕系統基于算法做出來的結果,白色的框是專家司機開車時候的狀态。從這個圖可以看到,他們之間的差距相對是較小的。在整個智駕的開發過程中,我們通過大數據的驅動,也會根據用戶的駕駛風格去學習用戶所習慣的跟車安全距離、以及相應的車速,帶給用戶最舒适的智駕感受。
第三個案例,這是一個複雜的場景用戶交互的例子,因爲在自動駕駛的時候,往往用戶的痛點是不知道什麽時候要接管,在智己的智能駕駛當中,我們通過風險等級預警和多模态的交互方式,通過直觀的表達,比如類似于 WiFi 信号這樣的标記,能夠讓用戶清晰的感知到系統對于當前場景處理的信心,提升用戶在使用智駕系統時候的安心感和信任感。
當然正如前面張院士所提到的,我們現在智駕技術一方面在快速的發展,朝着 L4+ 這樣的方向前進,同時我們也還将長時間處于人機共駕的階段,所以一方面智駕技術本身的發展非常重要,另一方面在人駕的環境下、場景下智駕如何服務于人駕,這也是具有很高價值的用戶場景。
我們舉了三個例子,這是智己的智駕系統當中我們認爲對于人駕當中能夠提供比較高的用戶價值的場景。
1、一鍵脫困。這是我們用視覺融合泊車能夠輕松的泊入一些困難的車位,當然當我們要泊出來的時候不那麽容易,可以使用一鍵脫困的功能,輕輕一鍵可以用智駕系統幫你能夠從複雜的環境當中輕松脫困。
2、一鍵貼邊。我們在水平車位泊車的時候,即便有經驗的司機都會感覺到還是有一些困難、有一些障礙的,使用一鍵貼邊的功能可以幫助我們的司機尤其是新收司機可以輕松的對齊一鍵貼邊。
3、一鍵循迹。針對小區的場景,大家開到小區找車位,開到那個地方發現已經停滿了,但是要從裏面倒出來,隻有一條道怎麽辦,一鍵循迹的功能可以幫助駕駛員輕松的返回原來的位置。
當然在 L2+ 方面智己已經量産了非常多的功能,包括像高速領航功能,我們今年 4 月份發布之後今年年底也會覆蓋全國,包括去高精地圖的 NOA,昨天也已經開始了正式的公測,城市 NOA 在 10 月份我們會開啓正式公測。
這裏舉的兩個場景案例,關于城市領航輔助的場景。
第一個案例,在路口的時候,這是一個右轉,會經曆一個突然穿插出來的兩輪車、還有過路的行人,這個過程中可以看到,我們的智駕系統做的精準的判斷,并沒有刹停,而是通過平穩避讓的方式、通過無接管的方式通過了轉彎的路口。
第二個案例,在夜間的人車混流的場景,大家可以看到,在畫面的上方還有一部分是逆光的環境,即便在這樣的複雜環境中遇到前方有障礙車輛,智駕系統頁能夠輕松應對繞行通過。
整體來講,智能駕駛特别是在 L2++ 這個階段如何爲用戶提供更大的可感知的價值是我們追求的方向,這也是我們爲什麽打造 " 更像人 " 的智能駕駛。從智己的智駕功能叠代路線來看,泊車方面,從更多的停車場場景的擴展,從功能上現在的視覺融合泊車、到記憶泊車、到代客泊車,不斷進行拓展。行車方面,從原來依賴于高精地圖的領航輔助,到逐漸實現重感知、輕地圖的領航輔助,同時從原來少量場景的領航輔助行駛到端到端的智慧出行,這是我們在行車方面的一個技術路線。
如何實現 " 更像人 " 的智能駕駛?智己也打造了智能駕駛的技術平台,下面我從三個方面來進行解釋。
第一個,硬件方面,要有一個高效的計算平台。從智己在硬件方面的規劃,我們堅定的走視覺融合的一條技術路線,從傳感器規劃方面,我們使用了 11 個攝像頭、5 個毫米波雷達、2 顆激光雷達,随着算法能力的提升,我們會減少毫米波雷達和激光雷達的數量,攝像頭是我們主要的傳感器。算力平台方面,我們使用英偉達的大算力芯片,硬件形态上,從原來的行泊一體的功能域控制器會向艙駕融合的計算平台發展。
計算效率,對于模型的工程化我們實現了 500% 的效率提升,帶來的結果是 90% 的算力下降。因此,基于有限的算力平台可以實現全域的視覺融合,同時單激光雷達就可以覆蓋全量的城市場景以及區域高精地圖這樣的算法。
第二個,很重要的是算法的持續叠代和性能的快速升級。包含兩方面,一方面是感知智能方面,我們叫 DDLD 和 DDOD,就是基于數據驅動的道路環境檢測和基于數據驅動的目标檢測。基于數據驅動的道路環境檢測,是指我們在車輛的行進過程當中可以進行實時的建圖,并且能夠通過多次的行駛将感知的結果進行融合,能夠更好的去識别道路的特征。在 DDOD 來講,我們會結合使用空間占用網絡,能夠對通用障礙物進行識别,接下來在即将發布的智駕系統當中會應用 DDOD 的算法。今年 4 月份,前面提到我們發布的基于深度學習的規劃算法,從 DDOD 到 DLP 都代表了我們在數據驅動這個方法論上不斷的去演進我們的感知算法包括規劃算法。
當然數據驅動離不開高利用率的數據驅動平台,智己也搭建了完整的數據鏈路工廠 CLA4.0,可以實現對長尾場景的數據篩選,包括采集、處理、标注、評測、部署的整個自動化,可以實現從數據到算法的快速叠代。數據當然不光是用于算法的叠代,也用于研究用戶的痛點在哪裏,對實踐的場景爲未來的開發指明方向。當然我們所有的這些數據都會在車端進行脫敏,符合國家對于數據安全的要求。
最後簡單談一下我們對于未來智能化技術演進的兩點思考。
第一個,在算法方面,前面張院士也提到,從算法的演進路線來看,從原來的單個模塊的比如感知或者規劃的數據驅動的鏈路,逐漸會演進爲端到端的人工智能模型。
第二個,還有一個很重要的,在人工智能模型基礎上要加一個安全的框架,因此我們也在開發基于規則的安全框架,作爲未來智駕系統能夠達到更高安全等級的技術儲備。
除了智駕本身以外,目前随着電子電氣架構的發展,艙和駕逐漸在融合,特别是結合人機共駕的場景,艙和駕是密不可分的。就像我們前面所講到的,新的技術包括 GPT 的技術等等,都會帶來智能駕駛和智能座艙進一步提升的可能,也使得他們加速融合。在生成式預訓練技術的應用方面,智能駕駛我們目前正在探索的包含了在雲端的仿真、包含用大模型訓練小模型的探索,在智能座艙方面,基于在語義識别方面的優勢,GPT 技術可以一方面在雲端提升人類對指令理解的準确度,同時這個模型小型化之後也可以部署到車端。
在智駕領域,一方面是智駕的算法在快速叠代,我們還是相信系統對于環境的理解,甚至在某些方面是可以超過人類的,所以會持續提升智能化的程度。當然随着 V2X 技術的發展,智慧的路也會對智能化起到非常大的幫助作用。
正如前面提到的,我們也相信智能駕駛不光是單獨的發展,在今天人機共駕的場景下,我們使用智駕的技術去服務于人駕,更好的賦能人駕,能夠實現用戶體驗更大的增值。
(圖 / 文 網通社 卓陸)