反正比我手還巧
之前有人吐槽," 本來 AI 應該給人端茶倒水,沒想到 AI 都去畫畫唱歌 ",還好 2024 開年驚喜不斷,人工智障機器人終于來了點新活,在端茶倒水方面有了巨大突破。
一月初,斯坦福大學團隊帶着炒菜做飯、收拾衣服、逗貓的全能家政機器人閃亮登場,谷歌 DeepMind 旗下機器人團隊也發布重磅更新。
斯坦福大學 IRIS 實驗室團隊發布的 " 家務全能 " 機器人 Mobile ALOHA,隻要 50 次訓練就能掌握一項任務,成功率達 90% 以上,例如給手機充電、打繩結、用耳機。
在研究者的操作下,它還能完成更複雜的任務。在一段時長 3 分鍾的視頻中,機器人做了三道粵菜:蝦仁滑蛋、幹貝燒雞、蚝油生菜。
老實說吧,我做的沒它好|Stanford IRIS Lab, Youtube
打雞蛋、煎蝦仁、翻動雞肉、加調味料、切菜、切蒜末 …… 一看就是行家裏手。
Stanford IRIS Lab, Youtube
澆花、洗衣服、泡咖啡、刮胡子,人能做的事它都能摻上一腳。
就在不久前,我們對機器人的印象還停留在人工智障的階段,最強也不過就是波士頓動力的 " 打工狗 "。怎麽機器人一下子變得這麽靈巧了?機器人上崗幹家務的未來還會遠嗎?
Giphy
眼裏有活,全部開源
ALOHA 開發團隊在論文中介紹,機器人雙手操作的模仿學習此前沒有得到廣泛應用,主要有兩方面原因:一是缺少易于獲取、即插即用的全身遠程操作設備,二是此前機器人在學習雙手操作完成複雜任務方面表現不佳。
ALOHA 構造示意圖 | 圖片來自論文
爲了解決這些問題,研究團隊使用了市面上容易獲取的部件,設計出這台盡可能複刻人類動作的機器人。他們在設計中還重點考慮了以下 4 個因素:
機動性:行進速度與人類相近,達到 1.42 米每秒;穩定性:适應居家環境,在使用櫥櫃、搬動鍋具的時候不翻倒;全身遠程操作:機器臂和底座的每個自由度都能同時遠程操控;不受限:搭載電源和計算機系統。
爲了讓機器人學會複雜的動作、學會應對訓練中沒有的突發狀況,研究團隊将模仿學習算法與靜态數據進行協同訓練(co-train),達到了不錯的效果。
比如在機器人正要打開杯子的時候把杯子拿走,或者在它換電池的時候在旁邊放上雜物,在受到幹擾的情況下,機器人也能繼續完成任務。
給你 feed 小青蛙|tonyzhaozh.github.io/aloha/
在搬椅子任務中,研究者隻訓練它搬動三把椅子,然後在測試時布置了五把椅子,機器人也能把它們全部擺好。這樣眼裏有活的機器人誰不心動!
ALOHA 全部使用市面上的通用硬件設備搭建,成本隻要 3.2 萬美元(約合人民币 23 萬元)。作爲對比,波士頓動力的機器狗 Spot 發布時售價高達 7.45 萬美元。目前市面上功能相似的操作機器人 PR2 和 TIAGo 售價高達 20 萬美元。
通過增減硬件設備,你還可以進行個性化定制,最低隻要 2 萬美元(人民币 14 萬元)就能搭建完成。
研究團隊已經将代碼開源,感興趣的朋友們可以開始 DIY 挑戰了:https://mobile-aloha.github.io/
更好、更快、更安全
或許是爲了和斯坦福比高下,就在 ALOHA 發布的第二天,谷歌 DeepMind 團隊一口氣發布三個計算模型,借助人工智能的力量,讓機器人反應更快、表現更好、更安全可靠。
此前在 ChatGPT 面世後不久,谷歌就宣布将大語言模型(LLM)和視覺語言模型(LVM)應用于機器人開發,用模型将大量訓練錄像翻譯成機器語言,供系統學習。這次發布的 AutoRT 系統大幅提升了機器人應對陌生場景的能力,可同時操縱多達 20 台機器人,并能在人類輔助下同時運行 52 台機器人。
多機器人協同|https://auto-rt.github.io/static/videos/autort_time_lapse.mp4
SARA-RT 系統則大幅提升了數據處理速度。它使用向上訓練(up-training,暫譯)技術,解決了數據輸入增加後運算負擔呈平方數增長的問題。此前,如果訓練模型輸入增加到 2 倍,例如增加一個傳感器或調高分辨率,系統需要投入 4 倍的運算資源處理數據。應用 SARA-RT 後,數據處理負擔線性增長,處理效率大幅提升。
RT-Trajectory 模型能對訓練錄像自動标注視覺線索,提升訓練效率,幫助機器人從人類操作錄像甚至簡筆畫示意圖中學習。
除此之外,谷歌 DeepMind 特别強調保護使用者的安全。DeepMind 機器人在關節受力超過一定阈值時就會停止動作,并且所有使用中的機器人都處在掌控物理停機開關的人類監督員的視線之内。
這一設計的靈感來自科幻作家艾薩克 · 阿西莫夫(Isaac Asimov)提出的 " 機器人三定律 ",其中第一條就是 " 機器人不得傷害人類 "。此外,這些設計也能避免傷害寵物或弄壞家用電器。
在剛剛過去的 2023 年,我們見證了 ChatGPT 做表做圖取代打工人,Midjourney 拿下設計大獎讓小畫家下崗。2024,機器人領域的快速發展又将帶來什麽?它會包辦家務和其他瑣碎的勞動,給人類帶來更多的閑暇時間,還是占領更多的崗位,讓體力勞動者陷入失業危機?讓我們拭目以待。