文 | 小即是大創業夥伴
6 月 27 日,由小即是大創新夥伴和啓迪之星(上海)聯合主辦的 " 大模型 X 汽車 " 互動沙龍在楊浦區成功舉辦。百餘位行業專家、創業者、技術愛好者、投資機構等齊聚一堂,共同探讨大模型技術在自動駕駛、智能座艙、營銷服務、汽車維修等場景的落地機遇與挑戰。
活動由小即是大創業投資合夥人、啓迪之星(上海)産業合夥人楊巍主持。
活動開場,啓迪技轉副總裁、啓迪之星(上海)副總經理衛冕代表主辦方介紹了啓迪之星在孵化加速、投融資、産業賦能等多個方向上的專業服務和功能平台。
以下是嘉賓内容分享精選:
01 "GenAD 比 UniAD 更快更準确 "
上海人工智能實驗室青年研究員李陽:作爲行業趨勢,端到端模型的核心優勢在于消除以往多模塊所導緻的累積誤差。我認爲端到端自動駕駛并不會完全替代車載模塊化方案,而是更可能成爲現有方案的備選(backup)。團隊今年建立了當前自動駕駛最大的開源數據集 OpenDV-2K并提出生成式端到端自動駕駛模型(Generalized AD Model),從而打通零樣本(Zero-shot)泛化、語言控制預測、仿真和規劃等智駕任務。在廣泛使用的 nuScenes 基準上進行的實驗表明,GenAD 實現了基于視覺的端到端自動駕駛的最佳性能,并且相較于 UniAD 具有更高效率和準确度。
參考文獻:https://arxiv.org/abs/2403.09630
02 " 主機廠更關注大模型技術的産品化過程 "
智己汽車自動駕駛中心高級經理蔣達夫:主機廠更關注大模型技術的産品化過程,把技術變成具體的功能,給用戶帶來特殊的體驗。智己團隊以數據驅動爲核心,對感知、地圖、規控、仿真等相關深度學習模型,采用車端智能篩選,實現全鏈路數據閉環;同時智己在端到端模型的上車應用經曆了從 1.0 到 4.0 的發展(pic.1),在算法架構的升級,從傳統規控基于規則的邏輯判斷,到規控模塊的模型化,以及感知規控全融合的 E2E 架構,更好地爲智駕産品賦能。同時通過大模型技術在車端地應用,全方位立體地賦能視覺、座艙以及整車功能,讓車 " 聽得清 "、" 看得多 "、" 看得遠 ";打造了典型的亮點功能,包括有DZT 高亮追蹤技術,捕捉周圍交通參與者并實時提醒行車安全;有高光時刻模塊,視覺識别行車途中的精彩瞬間,提供專屬記憶時刻;還有座艙語音大模型應用,語音交互及場景理解更智能和貼近人的意圖,極大提升了智能座艙的體驗。
pic.1 E2E 大模型技術發展路線
03 " 高階智駕開發 3/4 的成本發生于數據閉環 "
輝羲智能産品經理周海聃:汽車行業存在摩爾定律,在不斷滿足用戶需求提升的同時,成本将不斷下降。高階智能駕駛現階段線性投入模式不可擴展(unscalable),我們希望打造可擴展的計算引擎,實現芯片、算法、系統的協同設計,通過中國工程師的創新和工程執行能力,提升傳感器的感知性能、輕地圖甚至無圖路線擴城,算法模式叠代升級,并進行芯片架構創新支持等一系列協同設計,降低數據閉環的試錯成本,最終實現高階智能駕駛量産成本的顯著下降。
04 " 自動駕駛和通用機器人的技術路徑現階段是一緻的 "
鑒智機器人聯合創始人兼 CTO 都大龍博士:我們希望通過傳感器和 AI 算法範式的創新,使得原先自動駕駛的 " 特定任務 AI 範式 " 轉向 " 通用 AI 範式 ",推動面向現實世界的通用 AI 加速實現。傳感器方面,數據驅動的 AI 雙目傳感器可以極大提升面向現實世界的感知能力;算法方面,我們已經完成BEV&Occupancy 的端到端 4D 感知,提升了自動駕駛感知能力上限,接下來将不斷向 one model 進化,完善基于大模型的閉環學習系統,實現對于現實世界的真正理解。我們認爲,泛機器人系統同樣需要構建面向現實世界的通用 AI,因此現階段與自動駕駛的技術路徑是一緻的。
05 " 智駕模型訓練場景的特點之一在于高計算、高任務并發 "
Zilliz 解決方案架構師劉漢卿:過去非結構化數據的搜索主要在 " 感知相似度 " 層面,其可解釋性較差;而随着 embedding 模型的進化,通過将圖片語義和對應文本語義映射到同一向量空間,利用文搜圖可以爲智駕模型訓練場景的海量圖片樣本提供精準召回。當圖片樣本量級達到十億甚至百億規模時,相較于單純的向量檢索算法庫,Zilliz Cloud 向量數據庫不僅爲使用者省去了單獨配置存儲的工作,同時針對智駕模型訓練場景的重計算、高任務并發等特點,通過存算分離、讀寫分離等架構優化,以及更強大的自研索引算法,讓百億數據的毫秒級檢索和百萬條召回更穩定地輕松實現。
06 " 數據驅動已成爲自動駕駛技術提升和規模化落地的關鍵手段之一 "
無問智科創始人兼 CEO 劉盛翔:數據閉環是一項複雜的系統工程,包括數據鏈條與測試驗證鏈條的無縫銜接與閉環(見 pic.2)。應用大模型和仿真技術可以實現場景挖掘、場景模拟、數據自動标注、數據合成及泛化等一系列能力,有效解決以往數據閉環成本高效率低、測試場景多樣性、仿真真實度不足等難題。我們緻力于應用大模型和仿真技術爲智能駕駛提供專業領先的 AI 數據與仿真驗證一體化解決方案,助力客戶打造高效高可靠性的數據閉環能力,加速智能駕駛規模化落地。
pic.2 數據閉環系統工程
07 "GenAI 或将颠覆傳統汽車營銷服務全鏈條 "
尋鹿智能創始人孫廣宇:生成式人工智能(Generative AI)将爲主機廠賦能全鏈條營銷、服務方案,革新用戶旅程體驗。具體産品體現爲AI 導購、汽車用車助手、能夠激活非智能汽車的超級 APP等等。同時,積極開發AI 夥伴、客服、培訓、智能線索與救援保險維修等數字員工服務,引領汽車服務未來。
08 " 部件失效模型、接口特性、系統模型是現階段的開發重點 "
樂意修創始人兼 CEO 蔡鵬:主機廠診斷能力存在綜合故障難分析、報碼模糊難定位、誤報問題難判斷、偶發故障難複現、診斷能力難評估、排故經驗難傳承六大難題。車輛健康管理 L2(telematics providing real-time data)到 L3(component level proactive alerts)的跨越存在大量的基礎開發工作,部件失效模型、接口特性、系統模型是現階段的開發重點。我們的診修大模型會先從雲端獲得主機廠數據,随後進行測試和維修推薦,最終定位診斷。從結果來看,汽車診修大模型能大幅提升故障檢測效率、一次性修複準确率并降低維修成本。
本次沙龍由 CCF ( 上海 ) 中國計算機學會、清華大學上海校友會汽車專委會、清華大學上海校友會自動化專委會、歐美同學會上海 AI 分會、上海交通電子行業協會、上海華虹計通智能系統股份有限公司和智譜 AI Z 計劃合作舉辦,并得到來自大蒜粒、北大青年 CEO 俱樂部、大連理工創業校友會、大工汽車人俱樂部、钛媒體、中國聯合網絡通信有限公司上海市分公司、Datawhale、segmentfault、今日人工智能、倫敦政經校友俱樂部、複旦 mba 讀書會、S 創 Slush、崔牛會以及橘子聯盟的支持。