核心信息:
• 理想汽車的最新願景:連接物理世界和數字世界,成爲全球領先的人工智能企業;
• 随時随地陪伴你的智能助手——基于自研的基座大模型 Mind GPT,理想同學 App 于 12 月 27 日全量上線,實現從車機進入手機,包含知識問答、看世界兩項功能;
• 理想汽車認爲,L3 爲有監督智能駕駛,不是 L2 的延續,而是 L4 的先導程序;
• " 高速端到端 "、創新的 "AI 推理可視化 " 交互,将于 12 月底随 OTA 7.0 版本車機系統全量推送給所有 AD Max 用戶,理想汽車将成爲國内首家、全球唯二實現高速 + 城市全場景端到端的車企;
• 實現 AGI(通用人工智能)的三個階段:增強我的能力、成爲我的助手、成爲我的矽基家人。
2024 年 12 月 25 日 -27 日,理想汽車連續三天推出 "2024 理想 AI Talk",分享了對人工智能的最新思考,以及包含智能駕駛和理想同學在内的人工智能技術的最新進展,并宣布基于自研基座大模型 Mind GPT 的理想同學從車機進入手機,App 已于 12 月 27 日全量上線。此外,理想汽車宣布 OTA 7.0 版本車機系統将于 12 月底全量推送 AD Max 用戶,新增 AI 推理可視化、高速端到端等功能,并實現 Mind GPT-3o、Mind Diffusion V2.0 的能力升級。
理想同學和智能駕駛是理想汽車的兩大核心 AI 産品。理想汽車董事長兼 CEO 李想表示:" 我們在做的理想同學和自動駕駛,通常被視作獨立的領域。我們的大語言模型 Mind GPT 是認知智能,連接數字世界;而自動駕駛被稱爲空間智能,關乎物理世界。我們同時在這兩個領域探索,并堅信認知智能與空間智能的結合——我們稱之爲 VLA(Vision Language Action Model,視覺語言行動模型)——是一個更值得相信和追求的機遇。"
李想表示,理想汽車的願景已升級爲 " 連接物理世界和數字世界,成爲全球領先的人工智能企業 ",汽車是連接這兩個世界的最佳橋梁。
" 從企業角度來看,理想汽車是一家人工智能企業,我們要做的不是汽車的智能化,而是人工智能的汽車化,并将推動人工智能普惠到每一個家庭。從行業視角來看,汽車将從工業時代的交通工具,進化成爲人工智能時代的空間機器人。在對整個世界的理解上,我們通過人工智能将物理世界與數字世界進行融合,讓有限的空間實現無限的延伸。" 李想表示。
理想同學 App,随時随地陪伴你的智能助手
理想同學 App 是一款人工智能應用,目前具備兩大功能:" 知識問答 " 提供多領域的問答能力,包括汽車、出行、财經、科技等領域,并能處理多種文本任務,如撰寫文章、翻譯和創作文案等;" 看世界 " 依靠視覺感知能力,幫助用戶識别菜單、畫作、動植物、汽車等上千種通用物品。
從車機進入手機,理想同學從智艙智能助理轉變爲通用智能助手。從用戶需求的角度出發,這是一件順理成章的事情。很多理想汽車用戶的孩子首次接觸的人工智能産品就是理想同學,它通過對話幫助孩子們解決各種問題,比如畫畫或寫作業等。理想汽車希望讓 100 多萬的車主及其家庭成員,不僅在汽車,還可以在手機、電腦,甚至眼鏡等穿戴設備上,體驗到一緻的人工智能産品。其次,從長遠角度來看,理想汽車認爲,在掌握基座模型的前提下,真正的大模型産品會覆蓋所有的設備,能讓用戶自主使用所有的服務。
目前,大模型技術尚處于發展早期,很多團隊仍停留在聊天機器人的初始階段,所有參與者都有探索未知邊界的機會。理想汽車憑借 100 多萬的家庭基礎和在自動駕駛領域的技術積累,能夠在追随優秀競争對手的同時,實現更有效的投入。
L3 有監督智能駕駛,不是 L2 輔助駕駛的延續,而是 L4 自動駕駛的先導
在自動駕駛的不同階段,L3 爲有監督智能駕駛,不是 L2 輔助駕駛的延續,而是 L4 高度自動駕駛的先導程序。
輔助駕駛隻實現了特定功能,自動駕駛則關乎整體能力。傳統的 L2 輔助駕駛依賴上一代自動駕駛方案,通過預設條件來執行不同場景下的智駕功能,無法窮盡所有的 corner case(極端情況)。理想汽車借鑒人類駕駛技能提升的過程,用人工智能的方式做自動駕駛,推出了端到端 +VLM 的雙系統解決方案,利用 Scaling Law(規模效應)不斷叠代和提升自駕能力,以适應所有可能的駕駛環境。
自 7 月底推出端到端智能駕駛的内測版以來,理想汽車以每周更新兩個模型版本的頻率,緻力于在今年将綜合 MPI(城市 + 高速平均接管裏程)提升至 100 公裏。展望未來兩年,還将逐步提升 MPI 至 500 公裏甚至 1000 公裏以上。爲了達到 MPI 500 公裏的目标,預估需要 2000 萬 Clips(視頻片段),意味着積累 50 億公裏甚至超百億公裏的數據量。
随着端到端 +VLM 雙系統的不斷叠代,理想汽車希望在 2025 年實現 L3 有監督智能駕駛,并爲用戶提供一個全場景、一體化端到端的産品。理想汽車認爲,達到 L3 的前提是實現 " 車位到車位 " 的智能駕駛,這将自動駕駛服務從幹道提前到小區車位,解決最先 100 米和最後 100 米的挑戰。11 月底,理想汽車已全球首家全量推送 " 車位到車位 " 功能,有效應對了小區道路、環島、掉頭和複雜施工的場景。
此外,理想汽車将在 12 月底通過 OTA 7.0 版本車機系統向所有 AD Max 用戶全面推送 " 高速端到端 " 和行業首創的 "AI 推理可視化 " 功能。其中," 高速端到端 " 将實現高速特殊場景 NOA 不降級、不斷點、更連續,使理想汽車成爲國内唯一一家、全球第二家将端到端技術應用到高速(及環路)NOA 場景的車企。"AI 推理可視化 " 通過展示 10 種可能的策略軌迹并實時選出最佳方案,同時以熱力圖形式直觀展現端到端系統在不同區域的關注度,将幫助駕駛員更直觀地理解 AI 的決策邏輯。
安全,是體驗的基石。雖然理想汽車在國内率先取消了角毫米波雷達,轉而采用以純視覺爲主的技術路線,但仍然保留了激光雷達,并将其視作 " 安全帶 ",與視覺技術配合,以期達到消除所有重大傷亡事故的目标。通過持續的 OTA 升級,理想汽車爲用戶提供了行業領先的安全能力,包括全自動緊急轉向 AES(自動緊急轉向)、全速域無上限激活 AEB(自動緊急制動)、及城市路口多方向人車混行場景 AEB 等。至今,安全技術已成功預防超 415 萬起潛在事故,超 1000 起烈性事故,一定程度上保障了駕駛安全。在 OTA 7.0 更新中,理想汽車還将向 AD Max 用戶升級應對大霧天氣的高速智駕策略,實現業内場景覆蓋最全 ELK(緊急車道保持輔助)。
得益于今年理想汽車在智駕領域的快速進步,截至 12 月中旬,AD Max 銷量占比已從 2 月份的約 20% 增長至 50% 以上,30 萬以上車型 AD Max 銷量占比已超 75%。
在技術、産品、環境政策,以及消費者對人工智能信任度到位的前提下,理想汽車有望在三年後推出首款爲 L4 級自動駕駛定義的汽車。在此之前,企業也必須滿足 3 個條件:500 萬輛以上規模的車隊、掌握 VLA 基礎模型的能力、有足夠多的錢去招募最頂級的人才以及足夠的算力。
應用 AI 技術,推動快速成長
目前,理想汽車超 100 億的年研發投入已有接近一半聚焦于人工智能,并建立了四支 AI 團隊,分别解決不同問題。
在智能駕駛領域,憑借充足的訓練裏程和先進的訓練算法,加之利用世界模型創建的模拟環境,理想汽車推出了行業首創的端到端 +VLM 雙系統方案。該方案自 7 月底啓動早鳥計劃以來,以每周兩次的頻率叠代更新,在 10 月底正式全量推送,11 月底新增 " 車位到車位 " 功能,并将在 12 月底推出 " 高速端到端 " 功能。随着數據規模的擴大和數據質量的提升,理想汽車已經成功驗證了 Scaling Law 在提高自動駕駛性能方面的作用。截至 12 月 25 日,理想汽車智駕總裏程已達 29 億公裏,訓練算力提升至 8.1EFLOPS。
在理想同學方面,其搭載了自研的行業首個車載認知大模型 Mind GPT。截至目前,該模型已積累 10 萬億 Token 的預訓練數據,覆蓋自動駕駛、對話等場景中特有的多模态數據。自 2023 年 12 月發布以來,Mind GPT 已叠代 30 多次,将伴随 OTA 7.0 進入到第三階段,即 Mind GPT-3o,進一步發展任務助手、認知成長和情感陪伴能力。與前兩代側重語言模型不同,Mind GPT-3o 将通過構建融合感知和認知的多模态端到端大模型能力,大幅降低人機交互延遲。
在智能商業方面,理想汽車通過大模型技術與商業領域數據和知識的深度結合,構建了一批具備零售、營銷、客服、金融、财經分析等能力的 AI 助手。例如,在零售領域,AI 通過學習頂尖零售專家的溝通技巧,爲更多零售夥伴培訓、賦能;在客戶服務方面,AI 模型掌握了豐富的車輛使用知識,通過智能的多輪對話有效解決用戶咨詢,提升服務效率、釋放呼叫中心的坐席壓力等。
在智能工業方面,理想汽車通過全棧自研的智能制造系統、視覺算法、設備、質量預測模型等,依托于 Li-MOS 生産管理系統、連山雲端質量預警平台、MESS 系統等自研的智能化平台構建起智能制造超級大腦,橫向上實現從研發端到交付端的數據閉環,縱向實現多層供應鏈到整車廠的數據協同,以數據驅動生産、快速叠代生産技術,從而持續提高制造效率和産品質量。
理想汽車 AGI 實現的戰略地圖
爲了實現 AGI,理想汽車發布三階段的戰略路線圖。
第一階段稱爲 " 增強我的能力 "。在這一階段,理想同學能爲用戶提供輔助功能,自動駕駛領域實現 L3 有監督智能駕駛。此時,AI 技術已經能顯著提升人類的工作效率和便捷性,但 AI 還無法獨立,需要人類來兜底。
第二階段叫做 " 成爲我的助手 "。AI 将推進至 L4 級别的自動駕駛與 Agent 階段的理想同學。例如,用戶可以簡單地指示一輛 L4 級别的汽車去接孩子,無需親自在場,車輛就能自行前往學校,通過面部識别技術讓孩子安全上車。在這個階段,理想同學代表的認知智能,與自動駕駛代表的空間智能,将會結合成一個模型,理想汽車稱之爲 VLA。AI 會出現大規模的應用,是真正的 iPhone4 時刻。
第三階段升級爲 " 成爲我的矽基家人 "。人類不再需要向 AI 發出任何指令。AI 能夠延續并運用人類的記憶,自主做出決策,并主動執行多項任務,成爲家庭的重要成員。矽基家人是 AGI 的最終産品。
從智能電動車企業升維轉型爲人工智能企業,未來,理想汽車将始終把用戶價值放在第一位,秉持 " 超越用戶的需求,創造讓我們自豪的産品和服務 " 的企業價值觀,爲更多用戶創造移動的家,創造幸福的家。