文 | 王方玉
編輯 | 蘇建勳
當下,具身智能無疑是最熱門的賽道之一。
高工産研(GGII)數據顯示,今年 1 到 10 月,全球人形機器人領域融資金額就突破了 110 億元人民币,遠超 2023 年全年。在一筆筆火爆融資背後,創業者們正集體向通用智能機器人的夢想發起沖刺。
大模型是人形機器人熱潮的關鍵助推因素。大模型能力的出現,使機器人從功能機變成智能機,能夠學習和适應環境,也爲通用智能機器人注入了新的曙光。
今年以來,多家國産人形機器人公司發布首款人形機器人産品,并積極探索下遊應用場景。而汽車工廠成爲了人形機器人落地的首選——優必選機器人在蔚來、極氪工廠進場,傅裏葉機器人在上汽通用工廠上崗……有投資人笑稱:" 最近各家機器人都在向汽車廠裏面送,汽車廠都快不夠用了。"
與上述人形機器人廠商不同,靈寶 CASBOT 将首個落地的工廠選擇在了聯想集團的智能制造工廠,主要負責更爲精密操作的筆記本的裝配工作。
靈寶 CASBOT 是北京中科慧靈機器人技術有限公司旗下的人形機器人品牌,緻力于研發面向場景落地的通用人形機器人和具身智能産品。11 月 13 日,靈寶 CASBOT 發布了首款全尺寸雙足人形機器人 CASBOT01 ——一款多場景落地的通用類腦智能機器人。
發布會後,靈寶 CASBOT 聯合創始人兼 COO 張淼、CTO 馬世奎與 36 氪等多家媒體進行了交流。融資熱、進廠熱的背後,人形機器人産業發展到了哪一階段?距離真正的通用機器人還有多遠?靈寶 CASBOT 給出了自己的判斷和思考。
以下爲 36 氪與靈寶 CASBOT 的交流實錄(經摘編)
人形機器人的智能水平目前介入 L3 和 L4 之間
媒體:人形機器人當前的智力水平、操作能力,還有成本目前發展現狀如何,處于什麽發展階段?
馬世奎:對于人形機器人的智力水平,現在也慢慢有一些标準産生,大部分還是參考特斯特自動駕駛 L1 到 L5 的劃分方式。按照這個标準,現在的人形機器人還沒達到 L4 水平(即完全自主或少量監控的狀态),基本上處于 L3 到 L4 之間的過渡狀态。
大模型的人機交互語言理解能力很強,在視覺這塊兒也是比較成熟的;在運動控制這塊兒,我們看到小腦的一些底層能力從不同的基因的廠家那裏表現出來了,這個能力是相對比較成熟的,但基本上還停留在展示的階段;不過目前來看,操作方面也有部分工藝比較成熟,可以直接商業化,比如抓放、插拔。
成本會随着規模化發展,有進一步下探空間,價格方面,從業内走向來看成本下降的非常之快。
媒體:從數量的一個角度上,如何量化的定義一下人形機器人的小規模量産和大規模量産?
張淼:小規模和大規模是一個相對的概念,可能各家都會有自己的一個定義。我們覺得就當下情況看,100 套以内算是小規模的水平,100 套以上就算是比較大的規模了。
媒體:人形機器人領域,它在未來一到三年之内會有哪些比較明顯的這個發展趨勢?
張淼:首先我們看到了從政策層面上,2023 年下半年至今,國家層面出台了很多這種支持人形機器人産業發展的政策。很多省份現在也開始在跟随着國家的腳步,陸續頒布和出台人形機器人産業相關的政策,會有更多産業政策支持人形機器人的發展。
第二個,有了前期的政策支持之後,會有更多零部件和上遊的材料企業跟随主機廠的發展有進一步的提升,帶動供應鏈進一步成熟。
第三是商業化應用,預計會有很多的具身智能和人形機器人廠家,去跟各個領域、各個應用場景進行合作或者聯合研發,推動具身機器人在各個領域的應用。
最後,具身機器人如果未來要走向 C 端場景,那麽安全性和倫理層面上的一些問題會逐漸開始被大家拉到台面上來進行讨論,這也可能會是一個趨勢。
媒體:靈寶 CASBOT 人形機器人主要面向 B 端,您怎麽看待人形機器人進入 C 端家庭市場的行業整體進度?
張淼:2024 年之前,人形機器人或者說具身智能,基本上處于一個平台搭建的階段,大家其實都在完成 0 到 1 的研發。有了基礎平台之後,距離産品和商業化其實還是有比較大的距離,尤其是在和各個應用場景結合的時候,還需要在場景基礎上進行性能完善,我覺得這個周期持續的時間會長一些。
C 端家庭服務場景,我們基于過往的經驗判斷,它對于成本還是比較敏感的。雙足形态的機器人的成本,相較于 C 端客戶的預期,還是有着相當大的 gap。
靈寶 CASBOT 的戰略規劃是通過真實場景不斷打磨自身産品能力,B 端和 C 端在研發側同步儲備,商業化層面根據公司内外部的情況選擇更合适的時機走向 C 端的消費級市場。
馬世奎:馬斯克的對于人形機器人的判斷可以作爲參考。他預計 2025 年人形機器人會在特斯拉工廠打工,做一些人的替代,2026 年會開放給第三方做服務,逐步地最後才會到落地 C 端家庭場景。所以家庭場景還是要困難一些。
人形機器人,在應用場景中學習
媒體:目前很多制造業車間裏應用的還是機械臂,機械臂和人形機器人在工廠應用中有什麽差異?
馬世奎:有兩個差異,一個是底盤,人形機器人的底盤是可以動的,更加靈活,适用多種場景,傳統機械臂是固定的,活動比較局限。另一個是智能化,人形機器人通用性比較強,可以快速學習各類操作和技能。
以筆記本裝配環節爲例,筆記本的料箱有固定的形狀,但是料箱的放置會有不同位置,不同筆記本的孔位也不一樣,傳統機械臂學習起來很困難,而人形機器人有優勢。傳統臂的優勢在于簡單、重複高效、成本還低,這類型的工作還是由傳統機械臂來做,傳統機械臂做不了的,未來可以由人形機器人代替,兩者是很好的互補,可以協作完成一些任務。
媒體: 靈寶 CASBOT 的核心零部件有多少是自研的,對于集成和自研有着怎樣的考量?
馬世奎:自研的好處在于自主可控,可以做出差異化,但相對的前期投入成本高,産品上市進度慢,也可能有一些不确定的風險。
我們人形機器人的軟件全部自研,硬件方面不是 100% 自研,部分芯片和傳感器是外采的。我們并不追求全自研,而是從場景需求出發進行倒推,決定是否自研。
舉例來說,我們的靈巧手就是自研的,因爲我們發現目前市面上的通用的靈巧手産品無法滿足工廠裝配場景對精細化的要求。
媒體:公司落地場景選擇了聯想筆記本工廠的裝配環節,這一環節裏人形機器人需要做哪些操作,難度如何,和汽車工廠場景相比有哪些不同?
馬世奎:靈寶 CASBOT 選擇制造業場景,先從筆記本的裝配開始,一是因爲聯想是我們的股東,容易切入;更重要的是,我們在精密微裝配、柔性作業等方面積累了很多,能夠讓(人形機器人做裝配)這件事首先成爲現實。
對于汽車廠來說,(人形機器人)更多的是搬個大件,對于負載的要求會高一些。筆記本裝配的動作包含了抓取、旋擰、插拔、使用工具等複雜操作,在精細程度上面要求會很高,柔性的要求也存在,泛化的要求也就提上來了。相應的,筆記本裝配對于手的能力、相應的 AI 能力的配套要求會高一些。
對于人形機器人,我們認爲有雙臂和靈巧手,協作方式是通過大腦去賦能的,可以算是類人形。所以我們在裝配場景的機器人其實是非雙足的,隻有人的上半身。
媒體:人形機器人進工廠無論是打螺絲還是搬運,好像原來的工業機器人可以實現更高的效率,現在人形機器人再去做這些流程化的東西,是不是反其道而行之?
馬世奎:從人形機器人的未來來看,它主要有兩個優勢,第一是通用性,就是一台人形機器人可以幹很多種工作;第二個就是成本,成本要降到一定水平,否則打不過專用機器人。
那爲什麽現在人形機器人進工廠?因爲要達到通用性,必須要積累足夠量的數據。數據積累一方面依靠仿真,另一方面也要落到具體的場景裏去積累,而且工廠這個半結構化的場景裏,不用像在 C 端場景一樣擔憂倫理問題。
另外人形機器人進裝配工廠也不會跟傳統機械臂直接去競争,選擇的是機械臂做不了的事情,比如筆記本裝配的很多工序,需要雙手協作才能完成;另外靈巧手以前都是二指、三指,而人形機器人需要高自由度的仿真手,這樣一些精細的、力感的、柔順的控制才能實現。
張淼:傳統的工業機器人速度非常快、效率和精度也非常高,但是過于定制化,好多都是非常大型的機械裝置,它有着固定的工序,不會和人直接交互。
目前國内很多工廠的生産線都在往柔性制造的方向發展,需要根據客戶需求去做定制化的生産,那麽傳統的工業機器人就不能在這樣的生産線上使用了。而具身機器人更加适應柔性制造的趨勢。
靈寶 CASBOT 在聯想的裝配場景裏去做探索,雖然當前的發展還不能說完全滿足生産線上的需求,但它都有一個逐步實現和進步的過程,我們現在正處在過程當中。
媒體:說到裝配,未來像是富士康之類的勞動密集型 3C 制造企業是不是可以大規模應用機器人來替代人做手機組裝?
馬世奎:人形機器人進手機産線其實比筆記本會更難一些,因爲手機體積更小,更精密。富士康一直在探索這件事,也成立了一個機器人事業部,我覺得大趨勢是不可擋的。