作者 | 黎詩韻
編輯 | 靖宇
人形機器人不是新事物,但它的熱潮在兩年前再次被喚起,随着特斯拉發布人形機器人 Optimus、以及 ChatGPT 的出現,整個行業爆發出巨大的想象力。技術上,它意味着人形機器人可以擁有真正智能的大腦,進化成有自主感知決策執行能力的智能體。而商業上,更智能的人形機器人可能會形成全新的生産力供給,爲工業、家庭等場景帶來萬億美元規模的産值。 特斯拉的 Optimus 最大的目标是服務特斯拉的汽車産線,這也是衆多人形機器人公司在發力的方向。今年 3 月,人形機器人公司 Apptronik 與奔馳工廠合作;8 月,OpenAI 扶持的人形機器人公司 Figure 繼續加深與寶馬工廠合作。
而和前幾次技術革命不同,中國企業在這一進程上并不落後。
在正在舉行的 2024 世界機器人大會上,優必選發布了全球首個面向多任務工業場景的通用人形機器人解決方案,把人形機器人在工廠的實訓成果直接搬到了現場,讓觀衆現場觀摩人形機器人在工廠執行質檢、分揀和搬運的任務。
大會現場,優必選還與奧迪一汽和北京具身智能機器人創新中心簽署合作協議,三方會共同研發人形機器人智能化解決方案,将人形機器人引入汽車産線的智能搬運、質量檢查和過程材料操作等工位,推動人形機器人在汽車工廠的大規模應用。
北京具身智能機器人創新中心總經理熊友軍、奧迪一汽工程技術部部長利貝克 · 托比亞斯、優必選首席品牌官譚旻分别代表三方簽署合作協議
奧迪一汽也成爲繼吉利汽車、東風柳汽、一汽 - 大衆青島分公司、一汽紅旗之後,又一家和優必選達成合作的車企。目前,優必選是全球範圍内合作車企數量最多的人形機器人企業,而除了車企之外,與優必選達成合作的企業還包括了全球最大的精密電子制造商富士康,以及全球第四大的綜合物流服務提供商順豐。
在這套解決方案下,優必選先爲人形機器人在工廠應用規劃了搬運、質檢、分揀、螺絲擰緊、零件安裝、過程材料操作 6 大任務。目前,工業版人形機器人 Walker S 系列已經進入多家車廠實訓,車企付一定費用,人形機器人會通過大約 12-24 個月的實訓不斷驗證産品性能。
這意味着,中國人形機器人行業在走入市場驗證(POC,Proof of Concept)階段,雖然距離想象中人形機器人在工業場景的真正通用、以及商業化落地,還有一定距離。但優必選的選擇似乎表明,在人形機器人相關技術還未成熟的今天,通過對客戶需求和使用場景的了解和掌握,現有技術依然可以滿足工業場景最細小的需求、形成最小的 TPF(技術産品匹配)。
雖然距離想象中人形機器人在工業場景的真正通用、以及商業化落地,還有一定距離。但優必選的選擇似乎表明,在人形機器人相關技術還未成熟的今天,通過對客戶需求和使用場景的了解和掌握,現有技術依然可以滿足工業場景最細小的需求、形成最小的 TPF(技術産品匹配)。談及人形機器人星辰大海的未來,有人認爲在實驗室裏研發一個通用具身大模型是關鍵。但優必選認爲,盡可能地把人形機器人安排到真實應用場景裏,先把一個垂直細分場景做好,再拓展到其它更多領域,這也許是打造一個通用人形機器人的最終答案。
01 車企需要人形機器人
如果說大模型是技術取得了突破之後、企業急着去找應用場景,那人形機器人則是在技術不斷叠代的同時,市場的需求就已經很強烈。這也要求人形機器人企業需要真實地了解市場的真實需求,利用已有技術布局來針對真實需求進行功能研發。
事實上,優必選提出這個工業解決方案的起點,并不是它想落地人形機器人技術、于是找車企合作。恰恰相反,正是汽車企業有了強烈的需求,于是找到優必選看、問是否能爲其工業場景提供人形機器人。
這背後反映了汽車行業對人形機器人強烈、真實的市場需求。
汽車制造分爲沖壓、焊接、塗裝和總裝四大工藝,其中前三個環節幾乎 90% 以上都由傳統自動化設備,如機械臂、協作臂或 AGV(自動導引車)等完成。但在總裝環節,由于工藝相對非結構化、複雜,其自動化率隻有 20% 左右、終究離不開人工,車企招工難、成本高。
比如非結構性的搬運場景,工人整天要搬十幾斤重的箱子,不僅枯燥、而且對身體有損傷,崗位很難招人。又比如非結構性的塗料場景,工作環境有高輻射、高粉塵、甚至有害化學物品,招人同樣困難。
「大家可能想象不到,一些領先的新能源汽車生産商即便有數十萬甚至上百萬的工人,但是依然長期處于不滿工的狀态。車廠工人的流動性實際上非常高。」優必選副總裁、研究院執行院長焦繼超表示。
在這些場景中,能像「人」一樣幹活的人形機器人是急需的。傳統的機械臂、簡單機器人往往隻能完成給定的、被規劃好的任務。而人形機器人或具身智能的定義是,其可以自主決策、規劃、執行,像人一樣行動——而其技術成熟度越高,通用性、泛化性就越強,越能在不同場景、任務中切換,最終降低服務成本。
今年以來,焦繼超帶着研發團隊走訪了接近 20 家車企,并與車企研究院和産線的負責人進行了深度、持續的溝通。通過這些調研,他與團隊梳理出了大家的一些共同需求,以及車企對于人形機器人的能力要求。
最終,優必選得出了車企對于人形機器人的幾個基本能力要求,包括要有足夠的自主能力、靈巧操作能力、穩定可靠性等。基于這些要求以及目前已有的技術邊界,優必選最終選中了幾項任務來開啓人形機器人在車廠中的實訓,包括第一階段的搬運、質檢、分揀,之後,他們還計劃将實訓任務拓展到螺絲擰緊、零件安裝、過程材料操作等。
優必選人形機器人演示搬運動作|圖片來源:優必選
盡管人形機器人領域的基礎具身大模型(一般指 VLA 視覺語言動作模型,和基礎語言大模型不同,它輸出的是動作)尚未有根本的技術突破,但在焦繼超看來,這并不十分重要。「在工業裏面我不是一定要跑個底座大模型,你可以理解爲訓個小模型就可以實現了。」他說。
給人形機器人做訓練,實際上就是讓它在跟真實世界的交互中,提升它自主感知決策執行的能力。
目前,主流的訓練路徑分爲兩種,一是大模型加小模型,即大模型作爲「大腦」負責多模态感知、理解、規劃,而小模型作爲「小腦」執行,包括步态和靈巧操作等,這一方式已超過部分通用大模型的表現。另一種方式是端到端,即通過海量的數據訓練,讓人形機器人看到數據就能輸出執行,但這種訓練方式更難捉摸。
人形機器人的訓練路徑 | 圖片來源:優必選
優必選表示,目前在工業場景領域,主要還是采用大模型加小模型的技術路線,因爲其訓練效率更好。不過它也在做端到端的嘗試,未來面向更通用的場景,端到端的路線也許會是更好的選擇。
以搬運場景爲例,大模型先感知環境,判斷料箱的大小和重量、搬運點的位置等,接着進行路徑規劃,下命令給電機,要求調整相應的力度進行抓取,重的貨物用大力、輕的貨物用小力,最終實現搬運。
在這樣的訓練框架下,優必選讓人形機器人在搬運、分揀、質檢等任務上初步驗證了可行性。過去,這種之前隻能由人類完成的工作,現在都可以由人形機器人完成。
通過智能化的能力,人形機器人執行這些任務時還具有一定的通用性、泛化性。以擰螺絲爲例,人形機器人在 A 公司學會了擰螺絲,而切換到 B 公司、螺絲的型号和尺寸發生變化,機器人适配的成本很低、可以做到迅速部署。
在焦繼超看來,目前這個階段的任務在于,通過人形機器人在多個真實應用場景中的數據反饋,不斷進行産品的驗證、優化,爲之後實現人形機器人在工業場景的大規模商用打下基礎,「到時候我們把人形機器人交給客戶,它們可以直接拿它當工人用。」他說。
02 人形機器人不是一上來就通用,而是場景由點及面地通用
在工業場景的應用落地上,優必選确實覺得自己有一種「急迫感」。這倒主要不是出于商業化的考慮,作爲一家成立了 12 年的人形機器人公司,優必選這些年已經探索出了一條成熟的自我供血路徑——一條腿研發人形機器人,另一條腿則将相關技術「沿途下蛋」,它最重要的收入來源是 AI 教育、物流、康養等智能機器人服務。
在人形機器人這條腿上,現階段更重要的意義在于通過在真實場景的落地實訓,一是實現技術突破,保持技術領先性,二是争取在細分場景實現應用突破。
原因在于,目前制約人形機器人發展的核心要素是數據。大模型擁有海量的互聯網數據,自動駕駛擁有海量的行車數據,但人形機器人的訓練數據則少之又少、采集困難、成本也高。
現在盡管目前一些公司提出,可以通過虛拟的仿真數據訓練,但這條路也并未形成共識。比如焦繼超認爲,單純的仿真數據隻是換了信息表達的方式、并不能準确描述物理世界。最終,還是要依靠真實物理世界的數據、并在此基礎上形成仿真數據,真實數據的占比至少需要 80%。
考慮到場景的采集是海量的、而采集的成本又是極高的,最合适的方式就是選一個細分場景,既能從技術上收集數據做訓練、又能同時商業化。那麽目前能跑通的這些細分工業場景,就是不錯的起步選擇。
「誰掌握了場景,誰就掌握了數據。誰掌握了數據,誰就掌握了做出真正通用人形機器人的關鍵要素。」焦繼超表示。在他看來,和大語言模型不同,機器人的大模型大概率不是一上來就通用,而是由點及面、慢慢實現通用。
談及率先能夠與多家車廠達成合作的原因,焦繼超總結爲三點:
一是技術積累。作爲有 12 年曆史的人形機器人公司,優必選在人形機器人全棧式技術,包括硬件、軟件等方面都有更多積累。「實訓一旦開始就是一兩年時間,如果車企對人形機器人公司的技術沒有足夠的認識和認可,大概率會認爲這家公司做不成他們想要的方案,最終不會達成合作。」焦繼超表示。
二是對客戶真實需求的認識。如果說很多初創公司仍需技術「秀肌肉」,優必選已經經曆過了該階段,更關注客戶需求。畢竟在一個現實的工廠環境中,人形機器人最重要的能力是能不能幹活。
三是穩定可靠性。早在 2021 年推出人形機器人 Walker X 時,優必選就将它用于大型展館等場景,例如,在迪拜世博會中國館,Walker X 和熊貓機器人優悠就穩定服務了六個月。在中國科學技術館,Walker 也服務了超過兩年。這種穩定服務的能力,對于車廠來說尤爲重要。
從小到大、從垂直到通用,優必選将人形機器人的應用場景擴張分爲三步:
一、今年底,從新能源汽車廠切入,在搬運和分揀等任務進行測試,持續穩定性和可靠性,并實現小批量交付;
二、明年起,從車廠逐步擴展到更多的場景,并推動人形機器人完成中等難度任務,提升産品性能,逐步實現規模商業化;
三、從 2028 年起,進一步拓展更複雜的任務場景,成爲多任務通用性工業人形機器人。
人社部、工信部、教育部聯合發布的《制造業人工發展規劃指南》中給出的預測數據顯示,到 2025 年,中國制造業工業缺口将接近 3000 萬人,這也會是人形機器人的一個巨大的潛在市場。優必選就表示,目前已收到來自車廠的 500 台人形機器人意向訂單。他們認爲,随着人形機器人等技術的引入,工業場景會形成「721」的格局:70% 是傳統機械臂、20% 是人形機器人、10% 是人工。這 500 台走入工廠的「鋼鐵實習生」,正是人形機器人成爲那「20%」的第一步。
那時,制造業的用工短缺将不再是問題、成本也會進一步降低,我國先進制造的競争優勢也将繼續保持。而當工業場景實現突破之後,人形機器人将向家庭場景進發,這是所有公司的最終目标。
一位人形機器人創業者感慨道,從來沒有碰到過這樣一個時刻,國家的需求、市場的需求、技術的可行性,這三件事完美地聚焦在了當下這個時間窗口,因此預示了一個龐大市場的到來。這也許正是優必選等人形機器人公司,如此積極地投入、力圖搶占先機的原因。