一個雙臂機器人站在竈台邊,用二指夾起碗邊," 啪 ",把蝦仁往油鍋裏一倒。機器人左手持鍋柄,右手操鍋鏟,翻炒起來。滋滋作響一陣後,機器人把蝦仁裝進一旁的盤子。這道煎蝦仁就算做完了。
有别于過往機器人的複雜訓練,這一機器人通過 50 次 " 遙操作 " 訓練,就學會了全自主煎蝦仁的技能。有科技博主解讀,該機器人學習能力極強," 通過模仿學習,直接克隆人類行爲,這能讓它學會任意技能。"
這是斯坦福大學華人團隊研發的 " 家務機器人 "Mobile Aloha。除了煎蝦仁以外,它還能夠疊被、洗衣、澆花、使用吸塵器、上下電梯與人類擊掌等等。當地時間 1 月 4 日上午,該團隊成員将演示視頻上傳後,很快在中外互聯網獲得了極大關注,有關話題獲得數百萬浏覽量。" 老人可以被機器人照顧了 "" 把人從家務中解放出來 "" 機器人才是解決智能家居的最後一公裏 ",網友們紛紛熱議。
據公開資料,該項目由兩名斯坦福博士生主導負責,斯坦福大學助理教授 Chelsea Finn 任指導老師。
" 上傳項目資料是在美西時間早晨,中國在睡覺。過了十幾小時後,發現微信朋友圈也有人在轉。"1 月 10 日,新京報記者聯系到該項目科研團隊的中國成員符梓鵬,他是斯坦福大學計算機科學博士在讀生,主要研究 AI 及機器人領域。他介紹,Mobile Aloha 是他與另外兩名團隊成員自主研發的一套操控系統,用以實現機器人全自動做家務。
符梓鵬解釋,團隊首次嘗試将 " 遙操作 "、AI 算法 " 模仿學習 " 與 " 協同訓練 " 管道結合,使機器人的學習效率和效果被大大增強,并且能夠學會更多人類動作——首先,人類可以通過 " 遙操作 " 指揮機器人,即在一定距離外操作機器人的動作。比方說,人類做出倒蝦、炒蝦的動作,機器人跟着做。這樣的 " 跟做 " 是一種訓練,會産生相應的數據。而後,這些數據被 AI 算法利用、分析,供機器人模仿。随着 " 遙操作 " 訓練的次數增加,機器人會學會特定的人類動作,繼而能夠自主操作。
其團隊實驗數據表明,同一個人類動作經 50 次以上的 " 遙操作 " 訓練,機器人自主操作的成功率在 90% 以上。
" 過去,人類可能需要寫幾萬行代碼來告訴機器人,走到哪裏要停下,看到了什麽,把什麽東西遞過來——有了‘遙操作’提供足夠數據,再讓 AI 算法加以分析利用,經過‘協同訓練’,就可以得到一個能夠自主操作的機器人。即使不是計算機專業的普通人,也能夠進行‘遙操作’,訓練機器人。" 符梓鵬說。
據其團隊發布的資料顯示,這款機器人的制作成本約在 3.2 萬美元;且其軟件、硬件信息都已開源,有關數據被公布在團隊成員的 Github 平台中。這意味着,依據免費的公開數據,任何個人和機構都可組裝并研究自己的同款機器人。
機器人在自主乘坐電梯。 受訪者供圖
機器人的時代是否就要到來了?就有關話題,我們與符梓鵬展開以下對話:
" 眼下,機器人成功學習的都是簡單的、短的動作 "
新京報:什麽時候開始這項研究的?有評論說,相比市面上的其他雙臂機器人,Mobile Aloha 的成本便宜很多,你們是怎麽做到的?
符梓鵬:2023 年暑假,我們就開始購買各種硬件。10 月初,所有硬件到位後,我們開始組裝機器人,并研究改進算法。
因爲我們是自己買硬件組裝,買的底盤和機械臂都比較實惠,也沒有納入設計、組裝的成本,所以總成本并不高。
新京報:目前,機器人成功學會的人類動作有哪些?
符梓鵬:經過 50 次 " 遙操作 " 訓練後,機器人目前可以自主煎蝦、把鍋放到碗櫃裏、使用垂直電梯。成功率在 90% 以上。
我們上傳的視頻中,機器人做的另外一些動作,比如敲雞蛋、完整地做一頓晚餐,并不是它自主完成的,而是我們 " 遙操作 " 進行的。因爲這類動作比較複雜,訓練成本也太大,目前機器人還沒學會自主進行。
眼下,機器人成功學習的都是簡單的、短的動作。
新京報:有沒有可能通過更多次的 " 遙操作 " 訓練,把 90% 的成功率進一步提升?
符梓鵬:有可能,但會有邊際遞減效應。比方說,通過 " 遙操作 " 帶着機器人煎蝦,頭 20 次、30 次訓練,能把機器人的自主操作成功率提高到 70%;再訓練 20 次,也就是總共訓練 50 次,能把成功率提高到 90%;再訓練下去,訓練到一千次、一萬次,也就是煎一千次、一萬次蝦,可能就隻能把成功率提高到 95% 到 98%。
所以說,進一步提高成功率這件事,需要商業界來做。我們團隊日常就兩三個人做事,經費和時間都有限,很難在這方面突破。
新京報:這項研究的主要難點與突破有哪些?
符梓鵬:首先是硬件方面的難點。現在,大部分有 " 遙操作 " 系統的機器人,要麽隻能做簡單的抓取、放下的動作;要麽動作精細但不能移動,比如醫療機器人;要麽能移動,但可進行的操作有限,比方說掃地機器人。我們想要打造一台多功能的機器人,可以涉及家務、辦公室等場景的應用。但同時,又要控制成本。
另外是軟件方面有突破,此次我們把 " 遙操作 " 産生收集的數據和 AI 算法結合,利用 " 協同訓練 " 管道,進一步提高了機器人的學習效率,這是此前沒有人嘗試過的。
符梓鵬在 " 遙操作 " 機器人。受訪者供圖
" 對于這個項目,我們目前沒有任何商業化的打算 "
新京報:爲什麽選擇開源這個項目?
符梓鵬:我們希望更好地推廣這個項目,讓更多人參與進來,共同研究。對于這個項目,我們目前沒有任何商業化的打算。
新京報:你認爲這款機器人目前可以投入生産、面向普通消費者嗎?
符梓鵬:對于研究者可以,但是對于普通消費者還不行。研究者可以購買它用以自己的有關研究,但消費者如果要使用它進行家務勞動的話,首先需要對它進行大量的 " 遙操作 " 訓練。比如說,你要它學會煎蝦,你就得帶着它煎五十次以上。這樣的訓練成本太大了。
要讓這款機器人進入普通人的家庭生活,得先簡化數據采集的過程。這在目前來說是一個技術瓶頸。
新京報:Mobile Aloha 的未來研究與改良方向是什麽?
符梓鵬:首先是機器人的泛化能力。比方說,我教會它洗一個碗,它能不能夠以此類推,直接學會洗盤子。以目前的研究水平來看,想一步到位地達成這個目标,這是比較難的。我們設想的方法是,我們教它洗碗,也教它洗杯子、洗鍋具,洗盡可能多的不同的器皿。在這種情況下,它學會清洗一種從未見過的器皿的可能性會高很多。
也就是說,機器人做過的任務越多,它的泛化能力就越強。
另外,目前 " 遙操作 " 機器人,得有個人站在機器人後面。未來,我們希望實現通過視頻等遠程方式來 " 遙操作 " 機器人,這樣訓練起機器人來,會更方便。
通過 " 遙操作 ",機器人正在學習爲人類剃須。 受訪者供圖
" 擁有一個全能型機器人,或許還需要很長的時間 "
新京報:除了家務機器人以外,學界還在研究哪些應用領域的機器人?
符梓鵬:我所了解到的,還有醫療機器人、物流分揀機器人和生産線機器人等等。不同領域對于應用機器人的接受程度不一樣。比方說物流分揀機器人,它對安全性、精确性的要求沒有那麽高。但比方說醫療界,其實很難接受由全自動機器人完整地進行手術,它隻能作爲輔助,幫助外科醫生節省一定的手術時間。
新京報:機器人在未來能夠自主地幫人類做所有家務嗎?
符梓鵬:短期内很難。對于家務機器人來說,任務的變量太多了——不同款式的冰箱、不一樣高度的桌面、不同材質的地毯,都需要機器人進行不同程度上的學習。所以說,要做一個能幫人類幹一切家務、全自主的家務機器人是很難的。
反之,目前發展得比較成熟的自主機器人是自動駕駛機器人。有研究表明,自動駕駛機器人的水平基本高于人類普通駕駛員。因爲交通實際是很固定的一個場景,機器人的任務隻有一個——從 A 到 B,不要發生碰撞。不管在什麽地方開車,這個底層邏輯是一緻的。機器人學習起來,就會相對容易。
新京報:你覺得在未來,機器人和人類的關系會是什麽樣的?
符梓鵬:其實現階段的機器人非常蠢,它們能幹的事情遠遠不如一個人類小孩來得多。它隻能在某些領域,比方說開車,提高人類的效率。但你要說在方方面面,擁有一個通用的、全能型機器人,處理大部分事物的能力都比人類強的話,目前很難想象,或許還需要很長的時間來實現。
新京報記者 馮雨昕
編輯 陳曉舒
校對 王心