9.9 萬元起,還能夠大規模量産的國産人形機器人,表現得實在是太 6 了:
而且還走上了開源路線,就在剛剛,宇樹機器人開源的強化學習代碼又更新了!
更新之後不再是隻能訓練——不僅能夠仿真運行,還能部署到實體機器,整個過程所有代碼全部開放。
一開始,宇樹開源的是英偉達 Issac Gym 平台上的訓練代碼,這次新增了對MuJoCo 模拟仿真的支持。
而且還能遷移到實體機器人上運行,目前支持宇樹的 H1、H1-2 和 G1 三款機器人。
這下從訓練到模拟再到真機運行,整個 RL 套件的開源體系終于完整了。
看到這個消息,有網友激動地表示,訓練機器人靈魂的方法終于公開了!
全過程代碼公開,還有詳細教程
宇樹給這個項目取名叫RL GYM,可能和一開始專門提供基于 Issac Gym 的訓練代碼有關。
現在 RL GYM 又支持了 MuJoCo,可以在預訓練的基礎上進行仿真模拟了。
訓練階段的 Issac Gym 需要 CUDA,也就是需要 N 卡,仿真階段的 MuJoCo 則支持各種 GPU,甚至 CPU 和 TPU 也能運行。
從環境的安裝配置,到訓練和模拟,以及最後的真機遷移,不僅有代碼,還有非常詳細的手把手教程。
以最新款的 G1 爲例,在 Issac Gym 裏訓練完之後的效果是這樣的:
放到 MuJoCo 裏模拟,就有了開頭看到在這段 DEMO:
最後遷移到 G1 真機,就能看到訓練的效果了(并且真機遷移的部分還有中文教程):
H1 和 H1-2 也與此類似,另外通過 RL GYM 還可以在 Issac Gym 裏訓練機器狗 Go2:
還有更多開源項目
在宇樹的整個開源體系當中,RL GYM 隻是其中一環,在宇樹所有的 GitHub 倉庫中星标數排第三。
排第一的是針對開源機器人系統 R ( obot ) OS 推出的模拟包,包含了宇樹系列機器人的質量、慣量、力矩等參數。
星标數第二的則是使用蘋果 Vision Pro 對 G1 進行遙操作控制的倉庫,可以用于數據采集。
采集到的數據是 JSON 形式,而訓練通過 LeRobot 實現,因此宇樹還提供了将 JSON 格式數據轉爲 LeRobot 所需格式的教程。
其中包含遙操作控制的代碼教程,以及硬件配置圖、物料清單和安裝說明:
除了 GitHub 上發布的這些工具,宇樹還在 HuggingFace 上公開了訓練數據集,與數據采集工具同期發布。
數據集包含五種操作,使用配備有三指靈巧手的宇樹 G1 人形機器人收集,每張圖分辨率爲 640x480,每個手臂和靈巧手的狀态和動作維度爲 7。
比如,利用這套數據集可以讓機器人學習擰瓶蓋倒水:
将三色積木疊放到一起:
此外還包括将攝像頭放入相應包裝盒、收集物品并存儲、雙臂抓取紅色木塊并将其放入一個黑色長方形容器中這些操作。
最後,宇樹開源的也不隻是和機器人相關的項目。
上個月宇樹發布了售價 419 美元的激光雷達, 在産品上線的同時就将其采用的 Point-LIO 算法進行了開源。
項目倉庫:
https://github.com/unitreerobotics/unitree_rl_gym
參考鏈接:
https://x.com/unitreerobotics/status/1868664455024029773
https://x.com/UnitreeRobotics/status/1856986819038253396
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>