這年頭,人形機器人都有清華的學士帽戴!
這位走出清華二校門的機器人,簡直要把門口參加暑期研習營的小孩們饞哭了。
不僅擁有清華紫學士帽,在剛剛結束的 WAIC" 具身通用人工智能 " 論壇上,這個名叫小星的人形機器人,還和圖靈獎得主、中國科學院院士姚期智合影貼貼。
是誰羨慕了?我不說。
小星這 " 人 ",出自清華大學交叉信息研究院(IIIS)陳建宇團隊,整機結構、電機、減速器、驅動器、步态算法等機器人軟硬件将通通自研。
陳建宇,31 歲的清華叉院助理教授,28 歲時,就已經以叉院博導的身份走在從教之路上。
博士畢業于UC 伯克利,本科就讀于清華大學精密儀器系,研究領域包括機器人學、強化學習、自動駕駛等。
人形機器人小星
一起來認識一下,這位青年博導 " 教 " 出來的人形機器人——
體重 28kg,身高 1.2m,加上雙手後,全身上下具有 34 個自由度。
在行走方面,小星在不同類型的地面上都可以穩步前進,比如落滿枯葉的林間小道:
或者是公園花壇旁的水泥上坡路:
腳下的地皮換成草坪,也不妨礙它踏步前進:
總之就走得還挺穩的,速度也還不錯。
與此同時,它還能利用雙手提供一些服務功能,遞個燒烤、端杯咖啡什麽的:
在液壓驅動和電機驅動二者之間,小星采用了成本優勢更高的後者。
爲了研發高性能、低成本的人形機器人,團隊堅持最新一代的準直驅力控方案,用高扭矩密度電機搭配低減速比減速器,用電流環直接力控搭配動态雙足行走算法。
這種方案對電機扭矩要求極高,因此團隊也一直在探究新的電機設計方案。
目前所研制的電機扭矩密度已達到了 30Nm/kg,是 TQ 電機(目前工業界最強)的兩倍以上。
如此一來,無論是行走還是擺臂動作,小星都能保持在一個比較靈活的狀态。
不過,陳建宇也坦然表示,目前小星機器人硬件上搭載的算法智能性還不夠高,小星的現階段表現,還沒有發揮硬件可以支持的極限。
因此,團隊的另一項主要工作就是推進前沿的機器人智能算法,目前走的是動力學模型 + 優化控制和物理仿真 + 強化學習這兩條機器人領域最前沿的路徑。
相比于傳統的機器人算法,二者都更爲通用,并且可以更多地利用動力學來提高性能。
這兩大方法也是陳建宇博士期間的主攻研究方向。
2017 年,陳建宇提出了一系列實時軌迹優化算法并成功應用于無人車上。
從 2018 年起,陳建宇的研究重點轉向了更爲前瞻的方法——深度強化學習算法。在這一階段,他做出了領域内較早的幾個基于自學習方法的複雜道路環境自動駕駛工作。
" 從數學上來說,無人車也是一類機器人,我們研究的算法對于無人車和機器人來說都是通用的。" 陳建宇表示,在無人車時期關于強化學習的經驗,不少都可以遷移到人形機器人的研究上," 當然,無人車和人形機器人的關注點不全相同,比如無人車在底層控制方面相對簡單,而對上層的決策規劃和交互等關注較多 "。
通過強化學習結合人體運動數據,小星在高精度物理仿真中學會了高度拟人的步态行走:
還能挖掘出硬件的極限性能,達到 4m/s 的奔跑速度:
除了靈活的雙腿,小星的雙手也很靈巧。
通過大規模并行仿真強化學習訓練,小星學會操控其二十多個自由度的雙臂靈巧手來完成各類任務。
此外,爲了協調小星手腳之間的協同工作,團隊還提出了一種分布式技能學習算法。
" 我想,人形機器人是所有機器人學家的夢想!" 從本科起,陳建宇就開始關注雙足步态算法,他的本科畢業設計,做的就是雙足機器人落腳點規劃。
2020 年畢業回國,在探索過無人車、機械臂、機器狗後,于 2021 年底開始構思籌劃研發自己的人形機器人。
籌備了半年,想通了技術路徑,也就是去年春夏之交,陳建宇開啓了自己的新目标:
打造人形通用機器人,以及搭載在上面的 " 通用智能 "。
具身通用人工智能
目前人形機器人存在的技術難題是什麽?陳建宇總結了最受關注的三個方面:
首先,由于人形機器人具備高度集成性和複雜性,硬件本體構建具有較高挑戰性;
其次是運動小腦的構建,如何控制雙腿行走和操控雙臂完成各種任務,還未被很好解決;
最後是人形機器人的" 大腦 ",如何将目前隻有語言功能的大模型拓展到物理世界,并讓其進行行爲決策,是實現具身通用智能體至關重要的一環。
——這就引出近期最火的技術話題之一,具身智能。
5 月的 ITF World 2023 半導體大會上,黃仁勳在演講中明确表态,下一波 AI 浪潮就是具身智能(Embodied Intelligence)。
所謂具身智能,就是能夠理解、推理并與物理世界互動的智能系統,可以理解爲有身體,并支持物理交互的 AI 智能體。
而具身智能的終極目标,就是具身通用人工智能。以 ChatGPT 爲代表的通用人工智能雖然帶來了極大的轟動,但其隻有語言與文本處理的能力。未來我們一定需要更加有用的具身的通用人工智能。
7 月 WAIC 的,邀請了包括姚期智先生、Sergey Levine、Anca Dragan、Koushil Sreenath、Jiajun Wu 等國内外知名大咖學者一起探讨具身 AGI 的未來,内容涵蓋決策控制、感知認知、本體構建、算力支持、大模型理論等。
小星也在論壇上進行了現場首秀,獲得了大量關注。
國際上,一些團隊已在這個方向上有了初步的成果:
今年年初,谷歌推出 5620 億參數的多模态具身視覺語言模型 PaLM-E,可以執行各種複雜的機器人指令而無需重新訓練。
哪怕受到幹擾,也能完成 " 幫忙從抽屜裏拿薯片 " 的指令。
李飛飛團隊也新近發布了具身智能最新成果,大模型接入機器人,把複雜指令轉化成具體行動規劃,無需額外數據和訓練。
人類可以很随意地用自然語言給機器人下達指令,如 " 打開上面的抽屜,小心花瓶!"
陳建宇團隊也在推進這方面的研究工作。
并且做出了世界上第一篇大模型結合人形機器人的學術工作。
他們用大模型來指導小星的上層任務規劃,用強化學習來獲取小星的底層控制器。
與此同時,還提出了一套新的框架來解決上層規劃和下層執行之間的對齊問題,以确保下層控制能很好地執行上層規劃的任務。
" 我們發現,一些簡單的操作場景,接入 13B 的開源模型就比較夠用了。" 陳建宇分享了實驗過程中的發現,"作爲定位家庭服務的機器人,對數理邏輯、推演等功能的要求并不太高。"
緊接着,量子位又把 " 大模型幻覺在具身智能身上的解決思路 " 這個問題抛給了陳建宇。
比起網絡世界裏的胡說八道,現實世界人形機器人受到帶有幻覺的指令,似乎是一件更爲嚴肅、需要正視的事情。
思考片刻後,陳建宇給出了他的答案,那就是可能需要兩手解決方案,一方面是大模型産品本身對幻覺的控制,另一方面,在底層的控制也要加強。
之前我在研究無人車對安全性的要求時,會設計一些方案提升無人車的行爲安全,具身智能也可以采取相同的思路,在機器人收到 " 不安全 " 的指令時,及時識别,更改到安全區域範圍。
所以,添加一個完全基于物理規律,類似于安全護盾的底層保護層,或許是不錯的辦法~
— 聯系作者 —