前兩天,極越搞了個 AI DAY 發布會。
開頭兩句話就把我給吸住了。
極越 CEO 夏一平說 " 極越 01 的上市拉開了智能汽車的序幕,極越 01 成爲整個行業的智能化标杆,沒有之一。 "
不兒,現在大家都這麽猛的嗎?
以前都是小鵬說自己智駕标杆,現在華爲靠着一手全國無圖智駕,也成了标杆。這極越作爲一家入場并不算早的新勢力,咋也成汽車智能化的标杆?
越往後聽越發現,你别說這極越的 AI DAY 還真有點東西。
極越背靠百度,把文心一言大模型給搞車裏了。作爲國産語言大模型的小标杆,文心一言先是被三星 S24 作爲國内 AI 助手的候選人。最近聽說又被蘋果瞄上了,果子準備在下一代 iPhone 16 加入文心一言。
而極越作爲一輛車,把文心一言搞進去又是做啥用的?
首先是讓語音助手更聰明,以前隻能開個窗關個空調,現在是行走的百科全書,堵車的聊天神器。
跟文心一言談笑風生或是在線答疑,主打就是一個陪伴。
而且按極越的統計,極越車主日均調用文心一言服務可以達到 7.1 次,說明車主用上基本就離不開了。
好好好,中年男人不回家,坐在車裏合着不是玩王者榮耀,而是跟極越車機講相聲?
當然,除了要聰明,車機語音助手最關鍵的功能,是讓智能座艙變得實用。
先來說智能座艙這個點,極越提到了一個 " 全域全端側 " 的交互概念。
說起來也簡單。
像咱們平常用語音交互的時候,主要頭疼也就這麽幾個事,一是沒信号,二是有卡頓,三是聽不懂,四是沒隐私,那麽這個 " 全域全端側 " ,其實就是爲了解決這些問題。
先說沒信号,目前汽車的語音助手其實都要依靠 " 雲 " 技術來實現。
說白了就是需要聯網,沒網就用不了了。有的地下車庫信号不好,有的山區根本沒網,語音助手就交互不了一點。
所以,極越把整套語音交互相關的模塊,都塞在了車載芯片的 NPU 裏,相當于車自己就有個腦子,就沒網其實也能聊。
其次,極越把語音助手的邏輯運算和深度學習模型都放在 NPU 裏,不僅是聯網的問題,還可以減少中間流程,減少卡頓,最終可以使交互速度提升到 700 ms 以内。
隐私就更好保護了,畢竟離線語音,你的聊天記錄不會發送到車企總部,就不怕你和 AI 助手的聊騷被車企員工标注了( 狗頭 )。
然後還有一個識别率的問題,有時候還真不能怪 AI " 人工智障 " ,其實在嘈雜環境下, AI 收到的音頻和咱們考六級聽力測試沒啥區别,換人來聽也未必準确,說實話遇到普通話不好的,我是真的耳背。
所以,極越把本來用在智駕上的多模态策略用到座艙上了。說白了,不僅聽你語音,還對你口型,這樣一套 " 多傳感器融合 " 方案,據說可以達到 90% 的正确率。
你别說,背靠老大哥的 AI 技術,座艙這塊搞得真可以。那智駕這塊你靠誰?
哎!還真讓它找着靠山了!靠誰呢,先買個關子,咱們接着看。
和大多數車企走純視覺路線不同,極越是純視覺 + 一點有圖的 " 非主流路線 " 。。。
先說純視覺,在上一次 OTA 之後,極越就用上了 OCC 占用網絡技術,這個技術簡單說就是将多個攝像頭觀測到的二維圖形進行算法處理,形成三維建模,最後整出一個類似《 我的世界 》的 " 體素 " 世界。
而且,用戶可以通過車機實時查看,更好地感知汽車機器人的世界。
它們把這個 OCC + BEV + Transformer 稱爲 B.O.T 三向箔,不過,這套東西倒不是極越首創,在本質上它和特斯拉是同一個邏輯,但是在國内這麽做的,極越還真是第一個。
想當年,特斯拉之所以不做多傳感器融合,主要還是激光雷達的價格太貴,現在國産化的激光雷達早不是曾經這個價位了,極越就不能拿它當理由了吧?
所以,極越的解釋是,純視覺具備更快的叠代速度和更高的技術上限。
有一說一,激光雷達确實可以精确地判斷物體體積,但純視覺可以通過色彩等信息,對物體進行識别,不過這要更強大的算法才能實現,按百度王亮的說法, " 激光雷達初速度高,純視覺加速度更快 " 。
這就不得不說,百度的 AI 在智駕訓練上的優勢。比如說,通過文心一言可以快速找到相關屬性的智駕訓練素材,好比一個考試題庫,随時挑重點難題對 AI 進行特别培訓。
據說,在智駕訓練用上文心大模型之後,成本會大幅降低,效率會大幅提升。
所以,從上市到現在,極越 5 個月 5 次 OTA ,每個月都搞了個新版本,好好好,月月開新車是吧。。。
而且在下個大版本更新後,極越 PPA 也可以 " 全國都能開 " 了。但準确的說是 " 有百度地圖的地方,極越 PPA 都能開 " ,畢竟它還是有圖的嘛。
所以主流車企都在無圖化,爲啥極越偏要做有圖呢?
其實,咱們得糾正一個觀點,目前大家談的有圖和無圖,其實沒有那麽明确的非黑即白,而是處于一個灰色中間态。
首先無圖不是真沒地圖做參考,導航用的 SD 地圖還是要看的,不然都不知道往哪裏開了。
而且大多數車企會選擇 " 有圖用圖,無圖再說 " 的方案,這倒不是說無圖不行,而是需要大量的算法作爲基礎,依然是一個門檻很高的操作,一般車企還真做不好,有現成的圖用着,那就先用着。
而有圖最大的問題是費錢,比如做完一個城市的高精地圖,可能得上億的成本,而且這還不是最關鍵的,還有修路、市容市貌修正等一些原因,高精地圖還要不停維護更新,基本是個無底洞。
巧了,我極越智駕的靠山來了,百度地圖。
百度作爲地圖行業的老大哥,也有它的理解,它的答案就是做一套 LD 地圖,在成本和效用上做了權衡,說有圖那确實是有圖,但其實也是做了妥協,精度沒有高精地圖那麽高,成本則會低得多。
有一個好處是,因爲不用大規模制圖,即便是地圖更新的問題,也可以通過視覺實時建圖,降低成本。
所以說,極越這套純視覺 + 有圖的方案,決不是誰一拍腦袋做出的決策,而是背靠百度的存量資源,極越智能座艙有文心一言大模型做靠山,極越智駕有百度地圖和 L4 級别的蘿蔔快跑做靠山。
所以這麽看下來,極越老闆做标杆這句話還真不是吹牛口嗨,有點東西。看來我是時候向差評君申請,搞一輛極越來給大夥測測了。
最後,送上一個彩蛋!還記得前文提到的 " 體素 " 世界嗎,極越這次 OTA V1.4.0 版本後更新了一個 OCC 彩蛋,實在是太有意思了,直接上視頻,讓大家也感受一下。