出品|虎嗅智庫
作者|冀玉潔
無疑,在前不久的 2024 世界機器人大會現場,具身智能人形機器人是最大亮點,大會上 27 款人形機器人整機亮相。他們能跑能跳能翻跟頭,對詩、倒茶、疊衣服,十八般武藝樣樣精通。
從單純炫技到進廠打工
對于具身智能人形機器人來說,需要關注的是上半身的靈巧操作能力,和下半身的穩定移動能力。
先來看上半身操作能力。
松延動力的機器人 HObbs 仿真臉,可以實時仿真人臉表情,做出張嘴、皺眉、表達出憤怒、微笑、厭惡等多種表情;智元遠征 A2-W 機器人展示出動态任務編排、複雜作業執行及雙臂協同作業等作業能力;星塵智能 AI 機器人助理 Astribot S1 二指抓夾能熟練地功夫茶,疊衣服,完成一系列高難度、長序列、可泛化任務;
圖:松延動力仿生機器人 HObbs
圖:智元機器人 A2-W
圖:星塵智能 AI 機器人助理 Astribot S1
新松 Centaur 真空機械手兩隻手臂不受彼此影響獨立進行取放片工作,完成不同尺寸規格的晶圓搬運;帕西尼第二代多維觸覺人形機器人 TORA-ONE,四指靈巧手可以比心、寫書法、彈琴、下象棋。智平方 Alpha Bot 1S 不僅可以握拳,還能制作咖啡,學習操作各種日常電器,實現多場景、多任務的靈活切換。
圖:新松 Centaur 真空機械手
圖:正在比心的帕西尼 TORA-ONE
圖:智平方 Alpha Bot 1S
機器人下半身移動能力和穩定性也有很大進展。
逐際動力 CL-1 在展會現場接受極限沖擊測試,面對持續踢踹,依然能夠保持全身動态平衡,展現出強大抗幹擾能力和穩定性;宇樹科技的機械狗,四足靈巧的上下爬坡,引得衆人連連驚歎。
圖:被持續踢踹的逐際動力 CL-1
圖:宇樹科技機械狗
加速進化更是在現場辦起了足球比賽,其人形機器人 Booster T1 憑借手抛球、踢球、葉問蹲等高難度動作,以及與觀衆互動的俯卧撐比賽,引人注目;優必選在現場模拟出汽車産線,其人形機器人 Walker S 系列能自主将零部件箱從倉庫地闆搬運至傳送帶,并實時記錄數據,實現與智慧工廠倉庫系統無縫對接。
圖:加速進化人形機器人 Booster T1
圖:優必選 Walker S 系列
單從展會看,人形機器人正在從炫技走向服務,具身智能似乎馬上要迎來 iPhone 時刻。可事實上,進入現實世界,人形機器人還有很多技術和産品問題尚待解決。
靈巧手是 " 構型 "C 位
當下,發展通用智能型人形機器人,正在逐漸成爲行業内的共識。人形機器人最大的優勢在于具備通用的移動操作能力。其中下肢負責穩定移動,上肢負責靈巧操作。而相比下肢 " 移動 " 能力,要解決具體場景中的問題,更需要的是上肢的 " 靈巧操作 " 能力。
自 20 世紀 50 年代自動控制技術的興起至今," 上肢 " 機械臂和工業機器人已有較長發展曆程,但是能力僅限于進行機械、重複且較爲簡單的動作,如今人們對機器人上肢的要求已不僅僅是能自主運動,更重要的是實現精準操作,成功完成指定操作任務。
因此,上肢末端的靈巧手的精準操作能力更是成爲當下業内關注要點。
靈巧手可以粗略分爲電動夾爪及多指靈巧手。
相比技術難度低、魯棒性高的電動夾爪,多指靈巧手的開發也在逐漸成爲共識。多指靈巧手作爲高性能、高靈活性末端執行器,可供客戶在特殊及複雜場景中使用,同時對提高機器人的柔性和易用性有着更爲重要的作用。
至于手指數量,并無定論。多數靈巧手是五指的,但也有四指的。對此,帕西尼 CEO 許晉誠認爲 " 四指或五指,要以目的爲導向,四個手指可能在很多情況下已經足夠使用,因爲人類其實在現實生活中很少用小指。"
帕西尼的觸覺靈巧手就是四指,主動自由度達 13 個,可以實現抓、握、捏、按手指開合等各種人手複雜動作。
四指或五指并不僅僅是數量多少,更關乎技術難度選擇和成本高低。
北京具身智能機器人創新中心大模型負責人鞠笑竹表示," 當下,靈巧手多是模拟人手關節,一個關節對應一個電機,也對應一個自由度。手指越多,關節越多,電機就越多,自由度就越高。而在一隻手的有限尺寸内,電機越多,結構越複雜,對其可靠性和靈敏度的挑戰就越大,當然成本也更高。"
可以說當下,如何在有限的空間内集成多個自由度,對于靈巧手硬件來說,是一個巨大的技術挑戰。
除開在硬件層面的難題外,要實現靈巧操作,手部也必須與環境進行交互。當關注到物體的形狀、大小、位置等幾何特性時,就離不開人形機器人核心感知部件 - 傳感器,對操作環境和對象進行實時多維感知。然而當下,除業内視覺傳感器應用較爲普遍,觸覺傳感器也有落地外,目前行業仍缺乏視、觸、聽、力一體多維傳感器。
要具備足夠的通用性,在幾何特性外,還應該關注物體的語義特性,例如物體是什麽,用途是怎樣的。隻有這樣,人形機器人才能在未知環境中進行有效交互,實現真正靈巧操作。
相比上肢靈巧手靈巧操作能力,下肢移動能力從技術進展上似乎更快。這大概得益于軟硬件結合與人工智能技術尤其是強化學習的發展。
在展會現場接受極限沖擊測試的逐際動力 CL-1,展現出極強的動态平衡能力。而在其早前的演示視頻中,CL-1 還可以在山野裏徒步,下碎石坡、爬草坡、走溝渠。創始人張巍曾表示," 腿部也就是下肢這部分不需要新的物理發現,但是一個需要不斷嘗試的工程叠代的過程。" 這大概能解釋爲什麽人形機器人下肢能力的進度更快。
人形機器人下肢分爲輪式、四足、雙足。其中,四足機器人,側重于解決 " 通用移動能力 ",也就是實現對各種地形的泛化适應。兩足機器人則是爲實現直立行走,以便前兩肢(即雙臂)進行操作。
雙足,相比四足的穩定性和平衡性難度都要加倍。這也是爲什麽,我們能夠看到四足靈巧狗,上下爬樓梯超級絲滑,而大多數雙足人形機器人走起路來依然顫顫。
不過可以确定的是,從輪式到四足到雙足,技術難度和成本都是遞增的。從成本來看,輪足方案幾乎是雙足的零頭。不同選擇代表着不同技術難度及不同成本,也影響着人形機器人公司們的商業化進程。
總體來看,人形機器人本質上是代替人去運動,或移動或操作。有的機器人着重做移動,有的着重做操作。所以,我們會看到大多數着重發展靈巧手的公司,下半身多爲輪式,而雙足機器人,則上半身末端配抓夾者居多。
先工業,後商業,最後進入家庭
聊完産品構型問題,再來聊聊大家更關心的落地場景問題。當下,沒有成熟、剛需的場景是人形通用機器人面臨的最大問題之一。
據虎嗅智庫調研,工業制造、科研創新、商業服務、家庭服務是四個目前更有可能落地應用人形機器人的領域。
進一步來看,四個領域中的那些環境相對封閉,能力需求較爲單一,人工成本更高,或者危險系數較高的場景會更快落地,比如汽車工業産線中的搬運、質檢,超市換、補貨等場景。
關于不同場景的落地順序,更普遍的觀點是先工業,後商業,然後進入家庭。
逐一來看,從付費能力和意願上分析,工業場景的确是更有可能最先落地。一方面因爲工廠的自動化水平更高,并且廠商在部分場景有明确需求,更具付費能力。
比如優必選就在會上首次聚焦汽車、3C 等制造業重點領域推出 " 人形機器人工業場景解決方案 "。其 Walker S 系列人形機器人可以面向多任務工業場景,完成智能搬運、智能分揀、智能質檢、螺絲擰緊、零件安裝、過程材料操作等多種任務。
在談到爲何聚焦工業場景時,優必選人形機器人技術專家秦文龍博士表示,相比于服務場景和家庭場景,工業場景相對結構化,廠區環境和任務内容都是确定的。除開結構化外,工業産線對于自動化、智能化的升級需求也更迫切,亟需新形态的高端智能制造設備來彌補現有工業機器人、協作機器人、複合機器人等智能設備任務執行範圍之外的空白區。
在工業之外,這一波具身智能機器人公司在尋找商業化路徑的時候,也有不少率先從家庭場景切入。
因爲對于新入局的具身智能機器人來說,相比跟傳統專用機器人卷精度和速度,更可行的是在通用性上去找一些替代價值高的場景,比如養老、帶小孩等家庭看護場景。這些場景,更強調跟人的交互、對人的服務,而不是精度。
另外,因爲家庭場景,市場規模巨大,天花闆也更高,但技術落地也更難。
鞠笑竹表示," 一開始大家可能都會先考慮家庭場景先落地。但實際上做下來之後,發現每個家庭,每個人的需求都是千奇百怪的,過于随機和非結構化,對人形機器人的泛化性和智能要求很高,落地就不會很快。"
除了家庭非結構的環境特征之外,機器人本身的技術成熟度、安全性、及家庭成員對人形機器人的接受度等都是人形機器人要落地家庭,待解決的問題。
而在一些商業服務場景中,比如營銷服務、前台接待等,專用傳統機器人已經發力已久。似乎當下,相比于人形不人形,大家比拼更多的則是對該場景下企業需求的理解。這一點上,顯然早已入局的商用機器人玩家們更有優勢。
此外,對于科研教育場景,目前也有多家人形機器人企業入局,競争激烈,但該場景天花闆比較低,量産規模也達不到市場期待,所以更像是大家的短期無奈之舉。
關于在各場景的具體落地時間,在虎嗅智庫的調研中,大多數廠商的共識是 1-3 年,人形機器人将迎來在工業場景的落地,3-5 年落地于商業服務場景,5-10 年在家庭場景落地。
虎嗅智庫認爲,這一判斷可能依然過于樂觀。因爲新技術在商業化上的進度普遍是偏慢的,要商業化,前提是必須要找到有非常明确的産品需求場景。盡管優必選等企業,在汽車制造等一些場景已經進入進廠實訓階段,但考慮到解決通用性和成本問題,相關場景的市場需求尚待進一步驗證。
或許在嘗試保持技術研發高度的同時,逐步把技術拆解出來,降維去找到一些能夠落地的場景,探索産品化的方向,解決通用性問題,似乎是商業化的一條可行之路,但這并不容易。
況且如果要成功商業化,産品也至少要做到 80 分,并且能夠與競争對手拉開質的差距。但當下,大家的産品不管是從外觀還是到功能,差異化都不太明顯。
總體來看,目前,人形機器人雖然熱度很高,但技術路線,商業場景等都仍未明确,離量産還有距離,商業化也有很長的路要走。當下談具身智能迎來 iPhone 時刻,還爲時尚早。
關于具身智能的更多話題,9 月 20 日,在北京,虎嗅總部,大鲸 AI 閉門會将圍繞具身智能場景需求,與 100+ 标杆企業的 CEO/CIO/ 頂級專家們,一起解讀具身智能落地的方方面面,歡迎你一起來聊聊。