文 | 光錐智能,作者 | 劉俊宏,編輯 | 王一粟
悶熱的場館裏,興奮的議論聲,所有人生怕錯過這場 AI 讓機器人進化的盛宴。
人山人海的會展現場 光錐智能拍攝
8 月 21 日,2024 世界機器人大會(WRC)在北京開幕。在這場由 169 家企業攜 600 餘款産品的展會中,具身智能以幾乎單獨 " 承包 " 一個場館的陣仗,27 家公司的人形機器人和機器狗吸納了最多的觀衆。
在衆多機器人的演示中,光錐智能發現各家企業執行複雜任務的能力明顯變強,實用性也得到了很大的提升。
相比去年機器人更多演示跳舞、對話、走兩步的簡單任務能力,今年有偉景智能機器人摘水果、優必選機器人檢修汽車、星辰智能機器人寫毛筆字、加速進化的人形機器人足球比賽。宇數科技在表演了連續側身翻跳躍的機器狗外,還帶來了定價 9.9 萬元的人形機器人—— G1。在衆多廠商機器人的能力演示和價格的發布中,人形機器人距離走向現實的時刻越來越近。
宇樹科技 G1 機器人動作演示
" 大模型的發展,極大地促進了人形機器人的進步。"
科大訊飛副總裁、研究院院長劉聰對光錐智能稱,不管是 " 大腦 " 感知和理解的能力,還是 " 小腦 " 的運動控制能力都大幅提升。
進一步,逐際動力聯合創始人兼 COO 張力認爲,AI 的進化讓機器人實現了跨越式的提升," 通用人工智能讓軟件、算法能夠幫助機器人去實現很多以前根本完成不了的事 ",
随着 AI 大模型的突破,今天的人形機器人開始向着自動駕駛的方向發展。在借鑒了端到端大模型讓汽車一邊理解世界,一邊快速叠代的進化中,機器人也展現出了能夠理解複雜指令和學習更流暢的動作。同時,在大模型訓練需求下,人形機器人也來到了數據驅動智能叠代的階段。而各家機器人廠商也在試圖從家用、工業、倉儲物流、零售等一系列場景中占得一席之地。希望以單一場景爲中心取得數據和叠代的閉環後,打通不同領域,最終走向通用。
盡管在過去 AI 發展的十年中,機器人曾經曆多次希望和幻滅。但通過本次機器人的明确進化方向,星塵智能創始人來傑興奮地稱," 下一個十年,最值得做的就是人形機器人 "。
機器人正在掀起一場資本、技術和産業的共同狂歡。
資本相信人形機器人
" 這兩年看到最多的投資,除了大模型就是機器人 ",劉聰對光錐智能稱。
雖然人形機器人行業尚處能力演示的階段,但投資者和創業者們都知道,不能錯過這場風口。
在回顧近一年來的投資趨勢後,我們發現人形機器人作爲熱度最高的機器人終極形态,技術和難度都最高的同時,也在資本市場中占領了高地。
創業者層面,IT 桔子數據顯示,2023 年 1 月至今國内共成立了 29 家人形機器人公司,其中有 22 家已經獲得至少 1 輪融資。其中,由前華爲天才少年 " 稚晖君 " 創立的智元機器人,在成立 17 個月就完成了七輪融資,投前估值已達 70 億元。
站在資本的角度,根據《中國電子報》的不完全統計,2024 年上半年全球人形機器人領域融資事件超過 22 起,融資金額超過 70 億元。對于人形機器人的投資熱情,不少投資機構的布局堪稱 " 掃貨 "。
藍馳創投合夥人曹巍表示,在機器人領域已經投資了超過 10 家早期項目。經緯創投更是手握宇樹科技、智元機器人、銀河通用、星塵智能,四家人形機器人公司的 " 明星天團 "。
" 行業和資本都對機器人的未來很樂觀,畢竟這是個萬億的市場 "。在大會現場,優必選全球營銷總監李卓對光錐智能稱。
于是,人形機器人在軟件、硬件、資本推動、前沿應用效果的共同作用下,成了 AI 時代最熱門的賽道。
以宇樹科技在 2023 年初才開始探索人形機器人的經驗爲例。之前不做人形機器人的理由,王興興認爲," 全球人形機器人的控制技術,大家都做的不是特别理想。性能上不去,達不到實用或者幹活的階段,所以過去很多年都沒做人形機器人 "。
如今,随着機器人軟硬件技術升級,人形機器人正逐漸從實驗室走到實際的運用場景中。今年 7 月,馬斯克稱特斯拉工廠已有兩台 Optimus 機器人在進行電池搬運工作。在本次機器人大會現場,我們也看到了優必選的人形機器能執行簡單的汽車質檢任務。
優必選機器人演示質檢場景
誠然,以人類熟練工的角度來衡量,機器人 " 員工 " 的效率還是太低。但若是與規模疊加,人形機器人 24 小時連軸工作的特性,還是吸引了汽車、物流、科研院所、AI 科技等不同行業的嘗試意願,共同催促着人形機器人的交付進程。
" 在 2022 年底,我們還沒做人形機器人,但已經有一些客戶找我們想買人形機器人了 ",王興興認爲宇樹科技的人形機器人進展都是順勢而爲的結果。
不過,獵豹移動董事長兼 CEO、獵戶星空董事長傅盛認爲機器人行業還有很多方面需要打磨,尤其是 " 兩條腿走路 " 的人形機器人要面臨物理學的限制," 雙足機器人的技術過于複雜,它必須依賴于機械結構。機械結構的叠代不會像自動駕駛那麽快,每年能進步的幅度不多。"
但總之,行業内的玩家們在人形機器人的預計成熟時間上,達成了基本的一緻意見。李卓對光錐智能表示稱," 預計行業還有 3-5 年才能徹底成熟 "。
在頭部創業者們看來,此時此刻的人形機器人恰如 2019 年,特斯拉剛推出 FSD 芯片、百度 Apollo 剛拿到多張測試牌照的自動駕駛,一切都充滿了希望。
一切,都是因爲人形機器人在本輪 AI 大模型的影響下,實現了根本性的改變。
AI 進化,機器人更像人
" 一個是大語言模型,另一個是端到端算法。"
光輪智能創始人兼 CEO 謝晨如此總結着本輪機器人進化的最大原因。
在大會現場,無論是人形機器人、機器狗,甚至差異化設計的餐飲機器人都表現出了 " 更合理 " 的動作表現。以一年周期爲對比,今年大會上的機器人操作明顯流暢了許多。
較爲明顯的例子,可以從機器人做冰淇淋這一簡單任務中看出。在去年的世界機器人大會上,機械臂的運動基本上是單調地執行 " 轉圈 "。而今年遨博智能的冰激淋機器人動作明顯更加流暢,機械臂僅轉了一圈,就将冰淇淋接了出來。
2023 年(上)和 2024 年(下)冰淇淋機器人的動作表現對比
不同的動作流暢度,意味着機器人任務執行的底層邏輯發生了改變。
" 原先機器人操作設計是模塊化的,底層是學習加規則混合的方案。" 星海圖聯合創始人、清華大學交叉信息學院助理教授、MARS Lab 主任趙行解釋稱," 這種模式有點像之前自動駕駛的物體檢測 - 決策 - 規劃 - 控制的過程。例如做一個抓取策略,之前我們要對物體進行檢測、狀态和姿态估計。但現實情況的物體大多沒什麽姿态可言,就像一張紙鋪在桌子上,很難定義姿态和關鍵點。"
這與自動駕駛的發展過程如出一轍。此前的機器人動作規劃與自動駕駛發展到 " 端到端 " 前,遇到得是同樣的問題——在特定場景的開發模式下,隻能靠規則寫有限的動作,無法适應真實世界的無限場景。
機器人隻能操作有限形狀和種類的物體,就像是自動駕駛隻能在封閉路段使用一樣 " 雞肋 "。而有了 " 端到端 " 的機器學習之後,如同汽車能夠自己學習如何掉頭一樣,機器人也能學習如何抓取不同形狀、顔色、柔軟程度不同的物體。
優必選機器人聽指令抓東西
參考自動駕駛結合大模型的趨勢,機器人在結合了多模态大模型後,也開始能理解現實世界。在現場,銀河通用機器人展示的便是藥店值班的場景。機器人在拿取貨架上的藥品之餘,看到有東西掉到地上還能自己撿起來。
銀河通用機器人演示藥店值班場景
AI 大模型對于機器人能力提升的重要性,劉聰認爲主要體現在三個方面:
首先,大模型顯著提升了機器人解決複雜任務的能力,根據理解,把複雜任務拆解成一系列可執行的任務。
接下來,在多模态大模型的能力下,機器人可以依托視覺、觸覺等在更複雜地場景裏做事。
最後,體現在運動能力上,機器人可以根據 AI 合成的數據做模拟訓練。如果沒有大模型,機器人實現的功能會相對受限。
由此也看出,數據是除了大模型技術外,制約機器人下一步進化最關鍵的要素。
爲了獲取足夠用于機器人訓練的數據,不少廠商通過真實數據和仿真數據結合的方式解決。在真實數據的獲取中,廠商一般通過真人動作和機器人遙操作的方式,将任務過程中的數據 " 喂 " 給大模型。而仿真數據則是通過搭建一個盡量真實的場景,設定盡可能多的建模和現實參數,讓虛拟化的機器人進行訓練。
不過,上述的兩種方式還是存在着各自的短闆,當前機器人行業還遠未達到數據飛輪的啓動時刻。一方面真實數據的成本極高,機器人當前還達不到自動駕駛般的普及度。在真實數據足夠多之前,廠商需要花長時間和配備數據标準團隊來一點點積累。而對于仿真數據而言,最大的問題還是現實仿真不夠真實。機器人在模拟世界能成功,但導入到現實世界就會有一定的失敗率。
" 現階段,對機器人行業最大的一個限制,還是 AI 不太夠。AI 模型、AI 的訓練數據集、AI 的場景的落地部署,都完全遠遠不夠。" 王興興稱。
而随着 AI 的發展,趙行預判," 随着更高效的算法和算法的泛化能力提升,未來機器人學習一個技能的數據量将會從現在的幾千、幾萬,下降到一千甚至幾百幾十的數量級。"
參考自動駕駛行業由量産帶來的數據飛輪,爲了進一步解決數據問題,不少機器人廠商正在探索從量産中 " 拿 " 數據了。
搶銷量,人形機器人站在量産前夜
價格,是人形機器人走向量産的一大制約因素。
據光錐智能在世界機器人大會上向各家了解,智元機器人合夥人兼營銷服副總裁姜青松稱,一台 1.7m 高的人形機器人行業内售價大概爲 60-70 萬。
相比前幾年數百萬起的波士頓動力,這些價格已經是少數行業能接受的 " 嘗鮮價 ",但離大規模普及還非常遙遠。
王興興稱," 現在還沒有真正到商業閉環。一台機器人達不到比人還低的成本,商業價值依舊不是正向的。"
這是因爲,從研發成本角度,由于人形機器人的不成熟,公司的研發過程會在技術布局、硬件選用、場景設計等環節中設置充分的冗餘空間。這導緻産品在前期研發成本的分攤下," 背 " 上了大量除必要硬件之外的 " 隐性成本 "。
而在銷售環節結束之後,機器人公司還要繼續爲應用效果負責。" 廠商要爲工業應用試點客戶,配置專門的駐場團隊來進行後續研發和維護 ",在大會現場,一位參展商這樣告訴光錐智能。
雖然當前的客戶需求和産品都非常不标準化,但是光錐智能在大會現場發現,不少廠商已經嘗試在不同的需求下,制定了相應的産品策略,試圖讓機器人的銷售更加順暢。
基本上,光錐智能了解到多家廠商的通用人形機器人售價集中在 50-60 萬元的區間,并搭配廉價的量産版本作爲産品線補充。例如,四足機器人銷量最高的宇樹科技,其通用人形機器人 H1 售價就定在了 50-60 萬,最新的 G1 人形智能體也發布了量産版本,售價僅 9.9 萬人民币起。
另一邊,衆擎機器人的人形機器人銷售更加極緻,爲了降低成本,在拿掉了機器人的 " 頭和雙臂 " 後,衆擎 DG01 幹脆把 " 大雙足機器人 " 的價格幹到了 3.85 萬。
這或許意味着,人形機器人的第一輪價格戰快要來了。
衆擎機器人定價 3.85 萬 光錐智能拍攝
但更大規模的降價,還得依靠量産。
日前,智元機器人預計今年的出貨量爲 200 台,已經是行業頭部水平。而上一個階段中,商用清潔機器人的單家出貨量也僅在一年千台左右。
什麽時候能突破一年萬台,甚至十幾萬台的銷量,才是機器人真正的 "iPhone 時刻 "。
爲了達到量産目标,頭部人形機器人廠商已經把第一個場景瞄向了工廠。
在全球範圍,除了特斯拉正在使用的自家機器人 Optimus 外,OpenAI 投資的 Figure 已經與寶馬合作,計劃在美國南卡羅來納州落地 Figure 01 機器人。而美國機器人制造商 Apptronik 則與奔馳合作,Apollo 機器人已經在奔馳的流水線上搬箱子了。
在國内,當前落地最快的還是人形機器人唯一一家上市公司優必選。今年以來,優必選的人形機器人已經進入蔚來汽車、東風柳汽、吉利汽車、一汽等多家車企 " 打工 "。随着優必選在經典制造業場景的落地,人形機器人在質檢、搬貨、分揀、擰螺絲、裝配等環節,初步驗證了行業應用的可行性。
" 目前機器人行業尚在早期,但随着大模型的加持,技術和産品的從 0 到 1,有望在三年内一起突破。" 謝晨總結道。