今年國内最受關注的産業展會,除了七月初的 WAIC(世界人工智能大會),就屬八月下旬的世界機器人大會。
馬斯克帶起的人形機器人風口,加上大模型爆火後推動的具身智能熱潮,讓機器人賽道再次成爲創業、投資的熱門領域。有數據統計,2023 年至今國内僅人形機器人融資就達到 80 億元,再加上四足、工業用、醫藥、商用等機器人細分領域,機器人賽道的熱鬧程度相比 AI 也毫不遜色。
不過熱鬧歸熱鬧,機器人初創團隊,尤其是背景還不錯的,拿到初始的第一第二筆錢并不困難。但要成長到更大規模,僅有技術概念或者産品原型遠遠不夠,要有自己更突出的優勢特點,以及把這些特點運用到現實場景,有能創造出更大商用價值的能力和潛力。
那麽,在行業埋頭狂奔了一年後,國内人形機器人和具身智能今天走到了哪一步?逛完今年的世界機器人大會,我們看到了這個問題的一部分答案。
參展人形機器人翻倍,機器人和真人一起逛展
人形機器人的爆火,首先體現在參展的機器人數量上。
2023 年極客公園參加世界機器人大會的時候,曾對現場展示的人形機器人做出盤點,當時現場展出了約十幾款人形機器人。
而今年,世界機器人大會現場展出的人形機器人的數量直接翻倍,達到接近三十款。
不止是數量,機器人的能力,也明顯比去年有提升。
在去年的機器人大會中,雖然不少家機器人廠商,已經宣布了機器人具有雙足運動的能力,但在嘈雜的現場環境中,隻有一兩家機器人企業現場實機展示雙足運動。
而快進到今年,行走展示則成爲了一個标配。
背後懸挂一根繩在固定展台上的行走展示是最基礎的。
幾家機器人公司,如去年就進行過行走展示的星動紀元,已經開始了繞場行走的測試。在其他展會中,你可能會看到機器狗和小車在人旁邊并肩而行,而隻有在世界機器人大會上,才能看到雙足機器人和人并肩而行的魔幻場景。
再進一步,加速進化公司的小型人形機器人,已經開始讓小朋友操作,進行踢足球的比賽了。
一向以運動能力著稱的宇樹的人形機器人,已經可以跳舞了。
而人形機器人運動能力的另一端,則是上肢運動能力。
簡單的抓取箱子放置,已經顯得不再稀奇。人形機器人公司,仍然可以在三點上進一步 " 卷 " 起來。
其一,是與 AI 大語言模型的結合。機器人可以識别人類的語義,更 " 聰明 " 地抓取物品。不過,限于場景的嘈雜,此次大會中展出的不多。
主要的人形機器人廠商本身,也并不自己訓練 AI 語言大模型,而是選擇和其他公司合作接入大模型。例如,科大訊飛在世界機器人大會上,就展出了其多模态 AI 套件。套件利用對于人嘴部的視覺識别和聲音的拾取,可以更準确地在展會的嘈雜聲音中,更精準地收音,已經與智元機器人達成了合作。
其二,就是動作的流暢性。此次,星塵智能的展示就令人驚喜。
星塵智能的機器人 Astribot S1,此次在現場展出了寫毛筆字、敲揚琴、打詠春拳等展示。不少觀衆用 " 絲滑 " 來形容星塵智能的機器人的動作。
星塵智能聯合創始人來傑表示,這主要在于星塵智能的機器人,采集和訓練的數據本身,多一重 " 力 " 的維度。
傳統對機器人的訓練,通常機器人分解任務後,會設計出一條行動軌迹,然後機器人以相對均勻的力度按照軌迹操作,因此動作顯得相對僵硬。而星塵智能則在采集訓練數據時,就創新性地增加了力的維度,讓機器人的動作能更 " 有張有馳 "。
而配合觸覺傳感器,在手部動作的精細性上,也會有所提升。" 比如運用軌迹控制,切胡蘿蔔和切黃瓜,需要計算不同的軌迹。而人其實更多時候是用力反饋來判斷操作,伸出手去,碰到黃瓜後開始用力。" 來傑表示。
其三,則是抓取的成功率。
雖然在公衆眼中,此次大會的不少機器人,看起來都能抓取物品,但在抓取任務,實際上存在不同的難度。在 2024 年進行了多輪融資的銀河通用,就在展會上重點展示了其抓取能力——尤其是抓取擁有透明材料的水瓶的能力。
銀河通用公司表示,銀河通用在抓取的成功率上十分領先,原因之一是源自對于合成數據的訓練。
在人形機器人的動作精細度上,最後呈現的成果,許多時候仍然要落在訓練數據上。這點是與其他 AI 領域不完全相同的地方——機器人想要擁有具身智能,仍然需要大量數據進行訓練,而這樣的數據本身,還是很稀缺,也很貴。
最早能在年末看到人形機器人進入生活
與去年參加世界機器人大會,主要參展的人形機器人都是才做出來不久的産品不同,今年,頭部的機器人廠商,對于産品的口徑,已經統一地變成了接近量産。
量産是不是就意味着我們快要在生活中見到人形機器人了呢?
不盡然。
根據極客公園的觀察,普通公衆或将在生活中見到人形機器人,但這些機器人可能更多地仍然是展示功能居多,而非真正大規模地替代人類工作。
備受關注的稚晖君創立的智元機器人,在世界機器人大會期間,就宣布 2024 年,智元機器人預計發貨量達到 300 台左右,其中雙足人形機器人預計 10 月起量産,年内發貨 200 台。
智元機器人代表了一類人形機器人的産品思路。主攻工業場景,這些先進的人形機器人,将首先被應用在試點工廠中,與具體的工業場景進行磨合。
智元機器人已經是該類場景中的頭部企業,不過量産,仍然大概隻意味着百台量級的機器人在工廠裏分散試點。
在智元機器人的發布會上,智元機器人還展示了另一個場景,是機器人替代人類,進行汽車銷售——搭載了大模型的機器人,終于有了一點智慧的感覺。在智元的展示中,可以主動介紹汽車的功能,甚至在對話後發現客戶口渴還可以主動倒水。
這算是人形機器人公司找到的一類場景:放置在公共場景,在特定場合進行展示、介紹、答疑。
雖然目前來看,技術和場景還有很多提升和挖掘的空間,包括在直播中,一部分觀衆的直觀感受是會 " 有點尴尬 "。但這一場景,倒是更有可能更快地出現在我們身邊。
在智元的生态合作夥伴展台上,極客公園與智元的生态鏈企業數字華夏進行了交流,了解到在與智元合作的基礎上,數字華夏公司已經拿到了不少訂單,專門生産這種與人輕交互的人形機器人。
另一個在落地場景上,表現較爲突出的,是銀河通用公司。
由于抓取等能力上的突出應用能力,銀河通用預計将在第四季度,與美團公司進行合作,開啓智慧藥店和智能零售的機器人店試點。用戶可以直接通過與輪式行動的機器人對話,依靠機器人抓取,購買貨架上的物品。
2024 年上半年,亞馬遜關閉了不少依靠視覺識别的無人零售店,被爆料其中一個原因就是因爲視覺識别在很多場景下,仍然無法做到完全的智能,需要背後進行人工幹預。
而依靠機器人的無人零售,或許将意味着一個新的無人零售的商業模式的開啓。機器人直接從貨架上抓取貨物遞給用戶,能夠避免店鋪裏出現複雜的狀态,而将難度轉換成機器人的抓取問題。
而除此之外,機器人本身的通用性,意味着相比于隻是結賬的無人化之外,機器人未來可能實現直接上貨、擺貨架、打掃衛生等多項操作,産生真正的無人零售。
對于更多的人形機器人公司,尤其是雙足機器人公司而言,目前最重要的客戶,仍然是科研客戶。
逐際動力和加速進化,都是此次世界機器人大會中,展出的雙足能力較爲優秀的公司。在交流中,它們都提到,科研用戶仍然是目前雙足的人形機器人重要的客戶。
" 科研的需求還是比較大的。傳統的運動控制、CV 的科研人員都在轉型 AI,就需要新的構型去承載。比如原本做四足運動控制的科研人員,現在經常也在轉過來做雙足的運動控制,他們就需要一個好的本體來承載這些算法需求。包括感知、人機交互等等,都需要一個機器人來承載研究。" 現場工作人員介紹道。
而家居場景,則是一個許多公司都會提到的未來願景。
人形機器人最終的星辰大海,在于進入家庭,幫助做家務、照顧孩子、養老。
相對進展較快的 UniX AI 表示,其輪式雙臂人形機器人 Wanda 将在 9 月進入小規模量産,年内預計将生産 100 台左右。初期的 Wanda 可以完成洗衣服、做漢堡、疊衣服、餐後清潔碗盤等任務。
筆者逛展時,發現一個很有趣的現象:在今天的機器人大會上,幾乎每一個在展的機器人面前,都一定有一個工作人員,工作中的最重要的内容,就是防止好奇的人群,靠近機器人——即使是在機器人沒有動起來的時候。
人形機器人想要落地,安全性是一個必須解決的問題——機器人尚不能做到全身遍布觸覺傳感器,在做動作的時候觸碰到人類就有可能發生危險;反之對于精密的人形機器人來說,不是按程序設定行動的人類,一樣是一種危險。
機器人會長一張人臉嗎?
對于機器人專業的人而言,機器人像人,反而常常是不重要的。
機器人的原型機,常常連頭都沒有。目前各家人形機器人廠商的成型産品,最多也就是爲機器人賦予一張簡陋的 emoji,來簡單體現一下機器人的狀态。
不過,此次在機器人大會上,極客公園還是發現了幾家公司,在專門做機器人的臉部動作。
其中,除了每次參展都能引起不少人圍觀的 Ex Robots 的外觀惟妙惟肖的機器人 " 蘇轼 ",此次機器人大會上,還有更專注于面部本身的 Noetix 公司參展。
Neotix 公司的人臉,本身有 29 個自由度,臉部不止眼睛和嘴巴能夠運動,還能做出更精細的表情,比如皺眉。不過,爲了容納足夠多的電機在腦部,Neotix 的機器人略顯頭大。
對于普通參展觀衆而言,機器人的人臉,顯然具有天然的重要性。
主攻輕交互的數字華夏,爲機器人裝上了人臉,而它的人形機器人展示前,互動的人數顯然更多。人們不厭其煩地測試機器人會不會被吓到眨眼,能不能盯着一個人看,也總有人想趁着無人看管摸摸機器人的臉。
Neotix 公司的創始人表示,參展後,也發現了許許多多不同的長尾需求——很多商家很願意展示一個有趣的人臉在自己的展台來吸引客戶。
今天人形機器人産業還在從 0 到 1 做出一個有效産品的階段,人臉顯然不會是機器人公司優先級最高的任務,但如果未來幾年,人形進入商用,甚至走入家用,不論是前面提到的機器人導購,還是天天和老人小孩面對面的陪伴機器人,臉部可能是手、足之後,機器人廠商需要攻克的下一個課題。
結語
在一年人形機器人 / 具身智能的投資狂飙過後,在今年的世界機器人大會上,人形機器人在機器人大會上的展出翻倍,而人形機器人的能力,也明顯較去年普遍有了提升。
而在展台前積極交流的專業人士們,關注的重點,也已經機器人中用哪一款電機這樣的具體問題,逐漸向人形機器人到底能夠應用在哪些場景裏,何時能夠進行商業化了。
看起來,最早在今年年末,一批公司就将開啓這樣的場景落地的探索了。
而人形機器人真正進入普通人的生活,或者大規模在工廠内應用,行業裏普遍認爲,仍需最短三到五年,甚至十年。
不過,每年在機器人大會的現場,筆者都能看到一場新的人機關系的探索正在發生。
小朋友圍着機器狗,像摸真的狗狗一樣,試圖和它們交流。
再專業的機器人領域從業者,有的時候路過一張逼真的機器人臉,也時常忍不住想伸手摸摸觸感如何。
筆者在序廳路過一個圍得水洩不通的拍照區,擠進去一看,原來是有人在模仿進行機器人表演。而周圍的人,似乎無法分辨,互相詢問,是真的嗎?
人形機器人距離真正進入我們生活,仍然有一些距離。
但在世界機器人大會上,我們已經可以看到未來的一瞥:機器人變得越來越像人類,而人類也在被機器不斷賦能。人機融合的時代,可能并不遙遠了。