圖片來源:視覺中國
從傳統 AI 時期開始,國産技術被寄予厚望的一個長闆就是應用,大模型時代也是如此。從 " 玩具 " 到 " 工具 ",是今年下半年以來國産大模型的一個最顯著趨勢。
在這樣的背景下,關于大模型在汽車領域的應用,也開始熱度飙升。
在乘用車部分,特斯拉發布的 FSD V12 版本已實現端到端的 AI 自動駕駛方案;阿裏巴巴宣布 AliOS 智能汽車操作系統已接入通義千問大模型測試;東風日産、紅旗、長城等多家車企宣布接入百度的 " 文心一言 " ……
在商用車部分,基于華爲雲盤古大模型,一汽解放與華爲聯手已開展了多個場景的驗證測試;福佑卡車與騰訊達成戰略合作,共同研發數字貨運大模型 ......
大模型的如火如荼,讓行業内頗有 " 不搞大模型的車企不是好車企 " 的感覺,但大模型能爲汽車行業帶來多大的想象空間,依然是目前需要讨論的問題,像圖森未來CTO 王乃岩就曾嗆聲 " 自動駕駛大模型是僞命題 "。
不搞大模型的車企不是好車企?
目前,車企在大模型上車部分進行的探索,主要通過兩種方式:一部分自建大模型,比如盧偉冰透露今年 4 月份小米正式組建了 AI 實驗室大模型團隊;理想汽車自研大模型 MindGPT;廣汽集團推出了廣汽 AI 大模型平台;吉利汽車也表示首個全棧自研的全場景 AI 大模型搭載在吉利銀河 L6 上。
另一部分則是走聯合路線,比如小鵬聯合阿裏的大模型建立自動駕駛智算中心,斑馬智行接入阿裏大模型;福佑卡車與騰訊共同研發數字貨運大模型等。
大模型争相 " 上車 ",一方面是對于大模型來說,汽車是一個垂直領域,應用場景相對較小,對參數的量級要求也沒有通用型大模型那麽大。因此,普遍認爲汽車最有可能成爲率先實現大模型落地的 B 端場景。
但更關鍵的問題是,大模型到底能給汽車能帶來什麽樣的改變和價值?總結來說,主要分爲三部分:智艙、智駕和業務優化。
當前主流車企發力點都是交互領域,也就是智艙部分。目前車内主要使用的交互形式是 " 命令式交互 ",就像語音遙控器,用戶通過語音給車機發出一道指令,大模型加持下的智艙将具備出行場景對話式交互、邏輯推理、策略規劃和知識問答等多項能力,讓車内助手在未來有能力像真人一樣跟用戶交流,可以理解并滿足用戶在車内場景的深層次需求。
福佑卡車技術合夥人陳冠嶺在與钛媒體 App 溝通時,從商用車的角度分享了交互形式改變的價值,他表示,福佑的大量用戶是司機,司機在開車時跟福佑服務的交集主要是在司機的 APP,但是 APP 的點擊式操作并不太符合司機的實用性,而大模型本身是自然語言人機交互的,這更符合貨車司機開車使用時的需求。
而在智駕部分的改變,最直接的是 " 工具鏈 " 的優化。以數據标注爲例,衆所周知海量的數據是無人駕駛的基礎,行業通常采用大量的數據去訓練自動駕駛算法,但人工标注成本高、效率低,而自動标注就是 AI 大模型賦能智能駕駛最直接的應用,能大幅降低數據标注的成本。曠視科技智駕業務總裁劉偉曾對钛媒體 App 透露,過去可能有 12% 的數據是人工标注,但預計接下來就會大幅下降。
在業務優化部分,其實就是讓大模型能夠盡快進入業務流程,降本增效。比如陳冠嶺對钛媒體 App 介紹說,與騰訊的合作的端到端的 OCR 智能識别大模型能力就是針對物流證件識别、各類回單識别等場景實現了智能識别與自動處理,可以降低運營成本,提升服務效率。
對于具體的效果,他進一步介紹說,經過前期實踐驗證,針對多樣式回單識别場景,經過少量樣本訓練,該大模型對圖片字段識别準确率超過 99%。圖片信息綜合識别匹配準确率超過 95%,召回率比傳統模型提高近 20%。
機遇大于挑戰還是挑戰大于機遇?
大模型拉開了智能汽車領域較量的序幕,但從 " 首發 " 到 " 大規模 " 之間,也還有不短的距離。
首先,過于高昂的成本,在某種程度上會阻礙大模型大規模上車。畢竟,誰的訓練成本低,誰的轉化速度才能快。
衆所周知,算力基礎設施和算力服務對大模型訓練不可或缺,其性能、質量和穩定性決定了模型訓練成果。但以英偉達的 H100 爲例,其訓練效率衆所皆知,但價格也是極其高昂,二手價格已經被炒到了 4-5 萬美金。
紅杉資本還曾做過一筆測算:全球的科技公司每年預計将花費 2000 億美金,用于大模型基礎設施建設;相比之下,大模型每年最多隻能産生 750 億美金的收入。
其次,大模型的準确性仍然讓不少業内人士擔憂,畢竟汽車駕駛的前提是安全與嚴謹,大模型給出 " 差不多 " 的答案肯定是不行的。
8 月 26 日,馬斯克在矽谷帕洛阿爾托(Palo Alto)的街道上直播測試特斯拉全自動駕駛系統 FSD 12 時,進行到第 20 分鍾左右時,車輛穿過一個交通繁忙的紅綠燈時,FSD 12 出現了可能緻命的誤判:将左轉車道的綠燈當成了自己車道的綠燈,啓動車輛打算穿過路口。好在馬斯克立刻介入,刹住了車。在此之後,被問及解決方案時,馬斯克的回應是 " 繼續向神經網絡投喂大量帶有左轉交通燈的駕駛視頻。"
這也在某種程度上揭開了大模型的弊端:算法運作方式不可知,無法精确定位問題,隻能依靠喂養更多數據。
類似的問題在商用車上也難免存在。對此,陳冠嶺向钛媒體 App 解釋說," 貨運是一個比較嚴肅的行業,其對大模型的準确性要求很高。福佑之所以會把 OCR 智能識别的應用放在了智能客服之前,正是之前在探索智能客服、智能分析時候,看到大模型有時候會編造一些結果。"
除此之外,陳冠嶺還分享了大模型帶來的其它顧慮,在他看來,大模型的應用其實是數字化轉型的一個表現,所有數字化轉型碰到問題,比如對業務流程的改造、人的接受程度等,其實大模型也會遇到。
比如數據隐私的問題,像數據如何傳到雲上,特别是一些核心的數據,還需要更多的監管政策;另外一個問題是數據質量的問題。做大模型的訓練,對數據的質量要求比較高,企業如果想應用大模型,數據質量有沒有達到要求也是關鍵。
不可否認,大模型将來會爲汽車行業帶來巨大的改變,也正在成爲車企之間競争的焦點。與此同時,其在算力、算法及數據方面的新挑戰也會給發展帶來變數,極越 CEO 夏一平曾在與钛媒體 App 溝通時說過," 自動駕駛值得用大模型的方式重寫一遍,但是,這個事情可能是未來 3~5 年之内要做的事情,絕對不是明天就要做的事情。"
大模型在未來究竟是機遇大于挑戰,還是挑戰大于機遇,邊走邊看。
(本文首發钛媒體 App,作者|韓敬娴,編輯|張敏)