1950 年,英國數學家艾倫 · 圖靈提出,當一個測試者與一個計算機程序進行對話,如果測試者無法區分程序的回答是由人類還是計算機生成的,那麽該計算機程序被認爲具備與人類智能相當的能力。
這便是 AI 領域赫赫有名的圖靈測試。在通用足式機器人領域,也有類似的測試:如果機器人能夠在任意情況下抓取任意的杯子,那麽該機器人便具備了真正的運動智能。
要通過這個測試非常困難,其中,機器人必須具備極強的感知能力,與環境進行實時交互,不斷調整運動控制,才有可能完成任務,整個 " 感知到控制 " 的閉環是完全實時、動态、無法預先設定的。
通用足式機器人公司逐際動力創始人張巍直言,機器人要通過類似測試," 比自動駕駛還難 "。原因在于,自動駕駛僅解決移動(mobility)的問題,即從 A 點到 B 點,隻需要位置關系的感知;足式機器人在此基礎上,還增加了接觸關系感知,比如地形感知、觸覺感知。機器人必須要通過這兩種感知做實時交互,實現移動,然後執行操作(manipulation),才能被稱之爲運動智能。
現階段四足機器人的窘境在于,多數機器人處于「弱感知」階段,隻有微弱的感知或者用了少量數據,甚至是沒有感知,行動能力十分受限,效率不高且通過複雜場景的魯棒性較低。
張巍表示,機器人的核心是運動,包括 " 腿 " 的移動和 " 手 " 的操作。而運動智能化的核心來源于感知,這類感知指的是基于複雜場景的實時感知。機器人基于實時感知進行決策、控制,完成整個運動的閉環。
技術「躍變」:從被動輸入數據到主動感知交互
移動機器人按照移動結構可大緻分爲兩類:以底盤爲重心的輪式,與動物和人類相似的足式(四足、雙足)。
輪式機器人主要在結構化道路上進行運動,典型的如酒店配送機器人。這類機器人技術已經非常成熟,各大細分賽道已經出現了許多明星公司。但輪式機器人的不足之處在于,地形的适應能力較差,很難克服樓梯、凹凸不平的路面、野外等非結構化的場景;并且,輪式機器人有一個比較重的底盤,來支撐機身保持穩定,但這個底盤除了承重和搭載傳感器以外,能夠執行的任務比較有限。
張巍告訴雷峰網,如果機器人要像 " 人 " 一樣提供各種服務,腿的結構至關重要,因爲 " 有腿的機器人末端自由度更高 "。而且機器人必須具備實時調整重心的能力,保持平衡,提高負載自重比,才具備複雜場景運動的基本能力,這是輪式機器人沒辦法做到的。
基于此,張巍認爲,未來的機器人會往兩個方向發展。一個是「專用機器人」,即單一或者簡單場景下,機器人能夠根據人設定的流程代替人高效地執行任務,比如工廠的 AGV/AMR、配送機器人等等。另一個則是「通(多)用機器人」,即機器人要滿足複雜地形、場景,執行多種任務。
現階段,「專用機器人」已經殺成一片紅海,不論是送餐、酒店,還是工廠,都已經出現了許多機器人公司,從拼技術到卷價格,最終到渠道和服務,已經漸漸跑通商業閉環。而足式機器人才剛剛起步,即便四足、雙足機器人已不是新鮮事物,但市面上還沒有一款真正具備智能的足式機器人産品。
這一現象的本質原因,在于當前的足式機器人缺少「感知」。
" 機器人本質上是理解用戶指令,然後根據機器人收集的環境信息,讓電機轉起來,實現運動控制。" 張巍表示,要實現精準高效的控制,這與環境感知密不可分。
舉個例子,足式機器人要上下樓梯,需要知道樓梯與自身的相對位置(實時)、什麽地形、踩哪兒、用多少力 ... 在這些感知信息的基礎上,自主規劃路線、姿态等等,整個過程都是動态的,而非預先設定的運動控制。
機器人實際上是通過感知來理解環境,再通過關節來産生作用力,實現控制運動,所有的運動都會有環境反饋。這裏面既有位置關系的感知,也有接觸式感知,将二者完美融合起來的難度非常之大。并且,機器人與環境交互需求越大,根據實時感知環境來重新規劃動作(而不是按照事先預設流程)就越難,本身的控制和穩定性問題會更難。
簡單而言,足式機器人必然要與環境産生感知交互,對應的任務不是提前設置好的動作流程,直接進行 replay,而是根據現場情況進行動态感知,并實時規劃動作。
張巍表示,機器人要 " 類人 ",一定要跟環境交互,否則就沒有智能而隻是一個機器,很難産生真正的價值,實現商業閉環。但是,從環境感知到運動控制,這又是一件非常難的事情。
當前四足機器人的兩個瓶頸:效率、穩定性
相當一段時間裏,足式機器人都默默無聞。直到來自 MIT 的 Patrick Wensing 和 Benjamin Katz 分别開源了兩套影響深遠的方案之後,越來越多的玩家躬身入局,越來越多的機器狗從實驗室走向公衆視野,這個行業才漸漸被看到,接着有了資本助力,産品開始落地到具體場景。
雖然現在不少機器狗可以行走、爬樓梯甚至跳舞、翻跟鬥,但從做一個 demo 展示到實際量産甚至落地到具體、複雜的業務場景,仍然會遇到兩個問題:效率低,以及穩定性弱。
比如,機器狗在通過非結構化地面時,速度不高,而且缺乏穩定性,容易 " 趴窩 "。
張巍認爲,這一問題的本質,甚至是足式機器人還沒有很好的商業化落地的原因之一就在于,這些機器人缺少 Perceptive Locomotion(基于感知的運動控制)。沒有感知,意味着機器人的運動失去了 " 眼睛 ",隻能靠盲走,就像閉上眼睛的人直立行走,一定會走得歪歪斜斜,因爲缺少感知來實時調整路線。
當前,機器人的控制主要有兩種方法,一種是基于模型(Model)的控制,一種是基于學習(Learning)的控制。這兩種方法都是爲了解決同一個「最優控制」的問題,控制機器人的本體以最好的姿态高效、高質量地完成動作,卻也有不同之處。
"Model 是用解析模型做推演、設計控制;Learning 是減少使用 Model 的顯性表達,用仿真器來預測控制的效果。實際上,Learning 本質上也是基于模型的,仿真器都是基于模型設計,但是更側重于強化學習,需要機器人反複叠代、試錯來改進其控制器。"
打個比方,在高空飛行的飛機,從 A 點到 B 點,可以用一個固定的模型來解決;但如果機器在低空環境中飛行,會遇到建築物、動植物、飛行物等複雜場景,機器人需要自己辨别障礙物是什麽、怎麽避開、怎麽實現控制等,就需要 Learning。
換句話說,複雜場景的感知交互,一定要用到 Learning。機器人需要把各種傳感器(攝像頭、IMU、雷達)的數據融合起來,先構建一個高精度地形圖,然後定位、規劃行走,行走過程中不斷進行感知,實時調整運動控制。
現階段,機器人行業專注于基于感知的運動控制的有 Boston Dynamics、Anybotics、逐際動力 LimX Dynamics 等。Boston Dynamics 是業内最領先的足式機器人公司,而逐際動力也正在進行追趕,并走了一條差異化路線。
張巍告訴雷峰網,逐際動力既有 Model-based 的控制,也有 Learning-based 的控制,這兩種方法有各自适合的任務,通過模型數據混合的方式來做叠代。
在足式機器人的功能方面,逐際動力的路線是,首先完成腿部的基本功能,例如高效穩定地上下樓梯、穿越複雜地形;然後攻克全身運動的問題,即運動 + 操作;最後将産品打磨足夠穩定之後,針對細分場景進行作業。
目前,逐際動力已經可以實現帶感知的運動控制,雖然成熟度上相對于 Boston Dynamics 還有待提高,但能力已經接近。在陡峭的、真實的镂空的工業場景下,逐際動力的機器人已經可以實現穩定的上下樓梯,以及克服草地石闆路、斜坡等各類場景。
逐際動力:先打造全地形移動底盤,做 " 地面的大疆 "
張巍本科畢業于中國科技大學自動化系, 2005 年開始在美國普渡大學攻讀博士學位,研究基于模型的混雜動态系統的控制(Hybrid Dynamical System)。
博士後期間,張巍加入了加州伯克利分校的 Hybrid System 實驗室,導師爲美國工程院院士 Claire Tomlin 和 Shanker Sastry ,該實驗室的著名人物還包括李澤湘、馬毅等。
2011 年 9 月,張巍加入俄亥俄州立大學,在電氣與計算機工程系先後擔任助理教授和長聘教授,繼續從事混雜動态系統控制的研究和教學。值得一提的是,MIT 開源方案核心人物之一的 Patrick Wensing,彼時也還在俄亥俄州立大學學習機器人與控制理論。直到 2014 年,Patrick Wensing 才前往 MIT 仿生機器人實驗室,負責足式機器人的控制算法。
張巍認爲,機器人的足在踩踏地面時,是一個離散事件,并且速度和系統狀态會發生跳變,本質上就是 Hybrid Dynamical System。如何系統地控制這類運動,是張巍一直在研究的課題。
2019 年 5 月,張巍回國加入南方科技大學,擔任機械與能源工程系教授,創辦了機器人控制與學習實驗室(CLEAR LAB),并指導學生開始以強化學習的方式訓練足式機器人,并于三年後下場創業,成立了逐際動力。
張巍告訴雷峰網,逐際動力是通用足式機器人公司,先要解決機器人的核心痛點:全地形移動能力,即像人一樣移動,人能去的地方,機器人都能去。
鑒于當前四足機器人欠缺複雜場景移動能力、效率低能耗高的等問題,逐際動力對機器人進行了「系統升級」,包含兩方面,一是以感知爲核心的運動控制,二是将足式和輪式的優點結合,形成輪足式。
" 逐際動力要解決的是複雜場景下,四足機器人從 A 點穩定快速地到 B 點。至于機器人的使用場景,是巡檢、配送,還是裝了機械臂做更複雜的工作,将結合客戶本身的業務去做落地。"
就像大疆的無人機,在天空上飛來飛去,客戶可以用來拍照、撒農藥,也可以用來巡檢、表演,而逐際動力打造的是 " 地面的大疆 " ——全地形移動底盤,并推出了首款四輪足産品 W1。
W1 基于逐際動力「運動智能 Motion Intelligence」研發,将腿式和輪式結構相結合,具備實時地形感知與全地形移動能力,在效率上比單純的足式機器人更高效,适用場景也更加豐富、複雜,可以實現上下樓梯、斜坡、伏地穿越、過草地石闆路等功能。
張巍表示,四足機器人已經有足夠的技術積累,基礎研究與商業化的交集業已出現。現階段能落地并産生價值的,首先是封閉場景,例如危險、複雜的工業環境,代替人的工作,這類環境比較可控,機器人能很快适應;開放場景存在的不可控因素太多,比如人爲幹擾、突發事件等,不太容易落地。
因此,逐際動力計劃首先将 W1 在固定路線上落地,如工業巡檢、物流配送、特種作業等場景,并持續打磨産品;在固定路線跑通後,再逐步嘗試開放場景,循序漸進,最終打通四足機器人的廣泛應用。
機器人,大時代
從世界第一台機器人誕生至今,機器人的發展已接近百年曆史。每一次技術革命都将給機器人的發展帶來強大的助推力:能源、信息、大數據、芯片、人工智能 ... 都推動了機器人持續進化,從簡單的模仿到惟妙惟肖,從實驗室走向生産生活,從不能行動到穩定行走,從輪式到四足再到雙足。
如今,機器人已經以各種形态融入人們的生産生活,比如掃地機器人、工業機器人。雖然現階段的機器人還比較 " 笨 ",距離通過 " 圖靈測試 " 還有很長一段距離。不過,技術本身是「湧現」出的,誰也無法預測這個「奇點」。
但無可争議的是,正如人的進化史一樣,機器人也在慢慢進化,且終将迎來一個新的時代。
雷峰網長期關注機器人行業報道,即将推出《中國足式機器人簡史》。讀者若有一手信息、觀點、故事、項目,歡迎添加作者微信 nanshu0126 交流。