前幾天央視元宵晚會,撒貝甯扶着宇樹機器人顫顫巍巍地登場。不過,以機器人的進化速度,很快這種站都站不穩、走路都不利索的機器人運動狀态就要成爲過去了。

機器人前瞻 2 月 14 日報道,昨天,上海交通大學和上海人工智能實驗室的研究人員發布了一個名爲 "HoST"(Humanoid Stand-up Control)的強化學習框架,可以讓人形機器人從零開始學會在各種真實場景、任何地形中用不同姿勢快速站立。
HoST 框架将多評判強化學習、平滑正則化和隐式速度約束相結合,讓機器人學習自适應站立動作,可以在多種虛拟地形上訓練并将技能直接應用于現實世界中的機器人,并且通過内置速度限制實現流暢的運動控制,有效減少了機器人在站立過程中出現的震蕩情況和劇烈動作,保護硬件。
據項目研究成員 TaouHuang 介紹,HoST 體現出了以下特點:
多樣化的姿勢:團隊采用的控制策略可以讓機器人在不同的室外和室内環境中産生平穩的站立運動。

強魯棒性:控制策略對外部幹擾(如力、有效載荷、柔軟的絆倒物體和随機扭矩丢失)表現出了極強的魯棒性。

緊急狀态下的站立技能:具有跌倒恢複、動态平衡和站立穩定性等能力。

團隊在宇樹 G1 人形機器人身上驗證了這一強化學習框架,例如,機器人可以全身躺在地上後快速站起來。
在戶外環境中,不管是躺在台階上、靠着樹坐着,還是全身平躺在鋪滿石子的路上、草坪上,機器人都能一激靈就能扭動膝蓋快速站起來。


在沙發、地闆、斜坡、軟墊等多種不同的室内環境中,從坐着、靠着再切換到躺着等各種姿勢,機器人站起來動作依舊非常幹脆利落。



機器人在動态平衡能力上也表現出色,從斜坡上站起後還可以一邊保持平衡一邊移動。

團隊還測試了機器人在負重狀态下、幹擾狀态下的站立情況。即便背負 6 千克的大背包、被測試人員用其他物體進行幹擾,機器人站起來也是毫不費力。


HoST 框架的提出,有效解決了以往方法中忽略硬件限制、依賴預設軌迹的問題。通過利用從零開始的強化學習,HoST 能夠學習在各種地形上的姿态自适應站立動作,确保從仿真到現實的有效遷移。團隊還提到,該成果爲将站立控制集成到現有人形系統中奠定了基礎,在現實世界中的适用性還将得到進一步拓展。