近日,騰訊自主研發的多模态四足機器人 " 機器狗 Max" 再度得到升級,使其動作、行爲都更加接近真實動物。騰訊方面表示,通過将前沿的預訓練 AI 模型和強化學習技術應用到機器人控制領域,讓這次機器狗 Max 的靈活性和自主決策能力得到大幅提升。
經緯創投合夥人王華東曾表示:" 四足機器人憑借優越的靈活性、友好的人機交互能力,及同等地形下更低的成本,在企業應用及普通消費者場景均有良好的前景。" 因此,一些初創公司和科技互聯網企業都瞄準了這個賽道。
騰訊如何讓機器狗更聰明
2021 年,騰訊正式發布首個軟硬件全自研多模态四足機器人機器狗 Max,2022 年,第二代四足機器人 "Max" 發布,這次的三代跟之前相比,關節自由度有了明顯提升。
騰訊 Robotics X 機器人實驗室通過引入預訓練模型和強化學習技術,可以讓機器狗分階段進行學習,有效的将不同階段的技能、知識積累并存儲下來,讓機器人在解決新的複雜任務時,不必重新學習,而是可以複用已經學會的姿态、環境感知、策略規劃多個層面的知識,并 " 舉一反三 "。
這一系列的學習分爲三個階段:
第一階段通過遊戲技術中常使用動作捕捉系統,研究員收集真狗的運動姿态數據,包括走、跑、跳、站立等動作,并利用這些數據,在仿真器中構建了一個模仿學習任務,再将這些數據中的信息抽象并壓縮到深度神經網絡模型中。這些模型能夠非常準确地涵蓋收集的動物運動姿态信息,且具有一定的可解釋性。
騰訊 Robotics X 機器人實驗室和騰訊遊戲合作,用遊戲技術提升了仿真引擎的準确和高效,同時遊戲制作和研發過程中積累了多元的動捕素材。這些技術以及數據對基于物理仿真的智能體訓練以及真實世界機器人策略部署起到了一定的輔助作用。
在模仿學習的過程中,神經網絡模型僅接收機器狗本體感知信息作爲輸入,例如機器狗身上電機狀态等。再下一步,模型引入周邊環境的感知數據,例如可以通過其他傳感器 " 看到 " 腳下的障礙物。
第二階段,通過額外的網絡參數來将第一階段掌握的機器狗靈動姿态與外界感知聯系在一起,使得機器狗能夠通過已經學會的靈動姿态來應對外界環境。當機器狗适應了多種複雜的環境後,這些将靈動姿态與外界感知聯系在一起的知識也會被固化下來,存在神經網絡結構中。
第三階段,利用上述兩個預訓練階段獲取的神經網絡,機器狗才有前提和機會來聚焦解決最上層的策略學習問題,最終具備端到端解決複雜的任務的能力。第三階段附加的網絡會獲取與複雜任務有關的信息,例如在遊戲中,獲取對手的信息、旗子的信息。此外,通過綜合分析所有信息,負責策略學習的神經網絡會學習出針對任務的高階策略,例如往哪個方向跑動,預判對手的行爲來決定是否繼續追逐等等。
上述每一階段學習到的知識都可以擴充和調整,不需要重新學習,因此可以不斷積累,持續學習。
機器狗向何處去
20 世紀 90 年代後,美國和日本公司開始進行商業化足式機器人的嘗試,如波士頓動力、本田、豐田、索尼等企業。美國波士頓動力學公司于 2005 年研發了動力平衡四足機器人 Big Dog,作爲阿富汗戰場增兵計劃的一部分。
進入 21 世紀,國内也開始鑽研四足機器人,2015 年到 2020 年,宇樹科技、雲深處科技、蔚藍科技公司等相繼成立,在各種科技展會甚至春晚都能見到機器狗的身影。随着軟硬件技術的逐步成熟以及成本下降,四足機器人靈活性及性價比持續提升,普及度有所提高。
敦鴻資産合夥人俞文超表示:" 機器人是 AI、算力、IoT、底層硬件等各種技術的集大成者,這一未來萬億級賽道的星辰大海才剛開啓。四足機器人作爲 ‘新物種’,除了 2B 應用外,有望成爲最早在 C 端普及的機器人之一。"
我們熟悉的消費級四足機器人,更多地強調陪伴功能,如果能普及,未來将會看到大量 " 遛機器狗 " 的賽博場景。這種四足機器人的價格普遍在萬元以上,目前仍是昂貴的電子玩具,受衆往往是極客和高淨值人群。
事實上,資本看好的是四足機器人背後服務、工程、安防、制造、養老等巨大的市場。以陪護方向爲例,導盲機器狗可能成爲未來面向 C 端的主要産品。據統計,我國約有 1730 萬盲人,機器狗相較于傳統導盲犬有更強的交互能力,能夠與盲人群體更好地溝通。提前布局市場,才能在商業化浪潮來臨之前站穩腳跟。
而商用的四足機器人同樣面臨成本制約,但勝在應用場景較爲豐富。相較于輪履式機器人,四足機器人更爲靈活敏捷,行動速度、越障能力更爲出色;相較于人形機器人,其平衡能力更好,設計、生産、維護更爲簡單,多重優勢使其成爲了世界多個科技公司研發的熱點。
除了部分場景,四足機器人的實際落地還面臨一些困難。比如過于複雜的工業級别的應用,四足機器人尚無法應付;續航時間較短、充電時間過長,也是一大短闆。雲深處科技方面以電力巡檢爲例,認爲傳統機器人巡檢方案的應用場景仍然有一定限制,例如不能實現全域檢查,複雜環境仍需人工幹預等。正如賽智伯樂合夥人袁智勇所言:" 做一個能動的四足機器人是簡單的,但是應用到環境惡劣的工業和行業場景中,需要極高的技術壁壘和行業積澱。"
2021 年,國内四足機器人也湧入了科技互聯網圈的競争者。8 月,小米發布了首款仿生四足機器人 "CyberDog";同年 9 月,小鵬則發布了全球首款可騎乘智能機器馬。但是并沒有解決太多痛點,更多的是在該賽道提前布局 " 占坑 "。
波士頓咨詢公司預計,2030 年,全球機器人市場規模将達到 1600 億至 2600 億美元。而騰訊機器狗的最新叠代,已經将前沿的預訓練 AI 模型和強化學習技術應用到機器人控制領域,爲機械機器人向智能機器人加速轉變添了一把火。
談到四足機器人未來的發展,宇樹科技創始合夥人陳立認爲,大模型的快速叠代,對四足機器人的發展也有促進作用。" 原來在四足機器人身上的語音交互比較簡單,基本上是單句命令式的語音操控,沒法做語言語音背後的一些識别和算法的優化。現在出了 ChatGPT 這樣的産品,意味着我們可以通過大模型的賦能,跟四足機器人實時溝通,令其能更好更快地理解人類意圖。這樣的話,現在有大模型賦能之後(四足機器人)會更智能易用。"