
商湯絕影 CEO,商湯科技聯合創始人、首席科學家王曉剛
随着算法的進化,端到端自動駕駛技術路線正朝着更高效、智能和自适應的方向發展。
2 月 22 日,2025GDC 全球開發者先鋒大會期間,商湯絕影 CEO,商湯科技聯合創始人、首席科學家王曉剛發布了 " 與世界模型協同交互的端到端自動駕駛路線 R-UniAD",即通過構建世界模型生成在線交互的仿真環境,以此進行端到端模型的強化學習訓練。
據王曉剛介紹,R-UniAD 與 DeepSeek 技術創新思路同歸一源:從模仿學習向強化學習升級演進,從而實現端到端自動駕駛超越人類的駕駛表現。
簡言之,DeepSeek 技術是一個基于深度學習的圖像搜索和識别技術,其主要應用于圖像識别、目标檢測等任務。在智能駕駛領域,它可以爲智能駕駛系統提供一些重要的借鑒和參考意義。
比如在實時物體檢測和識别方面,DeepSeek 技術可以通過深度學習模型對圖像進行處理,實時識别道路上的物體,如行人、車輛、交通标志等,夠幫助自動駕駛系統實時感知周圍環境,從而做出相應的決策。
由于自動駕駛涉及到大量的環境感知與決策場景,依賴于大量的标注數據進行訓練,因此模拟環境中的數據生成和增強變得至關重要。R-UniAD 就是通過高質量數據進行冷啓動,用模仿學習的方式訓練出一個端到端基礎模型,再通過強化學習方法進行訓練。
這種 " 多階段強化學習 " 端到端自動駕駛技術路線,具體可分爲三個階段:
1、依靠冷啓動數據通過模仿學習進行雲端的端到端自動駕駛大模型訓練;
2、基于強化學習,讓雲端的端到端大模型與世界模型協同交互,持續提升端到端模型的性能;
3、雲端大模型通過高效蒸餾的方式,實現高性能端到端自動駕駛小模型的車端部署。
通過這項技術,智能駕駛系統可以不斷從海量的駕駛數據中學習和優化自己的模型,通過 " 仿真 + 現實 " 的訓練方式加速自動駕駛系統的學習過程,來更好地應對複雜的道路場景。
早在 2022 年底,商湯絕影提出了行業首個感知決策一體化自動駕駛通用模型 UniAD,2024 年北京車展期間,商湯絕影還展示了 UniAD 的實車上路成果,商湯絕影一直在不遺餘力地推動這項技術的商業化進程。
據钛媒體 App 得知,商湯絕影的量産端到端智駕方案預計将在年底交付," 開悟 " 世界模型也正式用于數據生産,而在今年 4 月的上海車展,商湯絕影将會展示 " 與世界模型協同交互的端到端自動駕駛方案 " 的實車部署。
(本文首發于钛媒體 App)