本文作者:蔣紫涵
來源:硬 AI
近日,特斯拉 Optimus 的現場演示以及宇樹 Unitree H1 的春晚首秀,都展示了人形機器人的進步,但整體技術仍未達到工業或消費領域大規模應用的要求,主要受限于通用和自主 AI 能力不足。
2 月 20 日,高盛分析師 Jacqueline Du、Yuichiro Isayama 等人發布研報稱,人形機器人技術的拐點可能會出現在三個方面:解決多個通用任務、高成功率和持續穩健性、快速推理。
高盛還指出,近年來,人形機器人制造商數量快速增長,這一行業可能已經接近進入量産階段,此外,英偉達推出的物理 AI 研發生态系統也是推動人形機器人技術發展的另一個關鍵因素。
在 2024 年 3 月的 GTC 大會上,英偉達推出了邊緣計算 SoC Jetson Thor、GR00T 模型,以及 Isaac 平台。Jetson Thor 是人形機器人所需的高性能硬件,能夠讓機器人自主運行預訓練的邊緣 AI 模型;Isaac 是一個集成了多種工具的研發平台,生成了英偉達内部的通用模型 GR00T。
但是,高盛也指出,目前人形機器人的發展仍然存在一些障礙,比如缺乏訓練所需的原始數據。
與大語言模型(LLMs)類似,機器人 AI 模型也需要大量數據來支持模型訓練和優化;但與 LLMs 的視頻、圖像、文本數據不同,機器人 AI 模型所需的重要物理數據(如力、扭矩、運動數據)仍然稀缺。
因此,彌補原始物理數據的短缺已成爲促進機器人 AI 研發的共識需求,鑒于這一需求,多家企業紛紛做出響應。例如,英偉達推出的 Isaac GR00T Blueprint 和 Cosmos 框架能夠利用合成數據加速模型訓練,彌補這一不足。
拐點一:解決多個通用任務
通用性是人形機器人與傳統工業機器人之間的關鍵區别:傳統工業機器人通常被設計用于完成特定任務,如裝配線上的單一操作;相比之下,人形機器人需要具備處理多種任務的能力,比如在家庭、辦公室或工業環境中執行不同的工作。
因此,高盛認爲人形機器人至少需要在多個(例如 5 到 10 個)通用任務上表現出色,才能開始大規模應用。
這裏的通用任務包括但不限于搬運物品、清掃、提供服務(如引導、語音識别)、數據采集、以及與人類的互動等。這種通用性是人形機器人實現大規模應用的關鍵,因爲它能使機器人适應更加多樣化的工作環境和需求,而不僅僅局限于特定領域。
拐點二:高成功率和持續穩健性
高成功率指的是機器人在執行任務時能夠成功完成目标動作或任務的頻率。
持續穩健性則是指機器人能夠在長時間内保持穩定運行,尤其是在需要長時間工作或高負荷任務的場合。商業化的機器人需要能夠承受長時間工作,且不易出現硬件損壞或軟件崩潰。
高盛表示,人形機器人在長時間操作中的高成功率和穩健性,能夠确保其穩定輸出,這對商業化至關重要。
拐點三:快速推理
快速推理是指人形機器人能夠快速處理輸入信息并作出決策的能力,人形機器人高效的推理和反應能力可以大大提高效率和客戶互動體驗。
在實際應用中,人形機器人常常需要實時處理來自環境、傳感器和用戶的各種信息,并在極短的時間内作出響應。比如,機器人在與用戶互動時,需要快速理解用戶的語音命令,或在複雜環境中,及時調整動作以避免碰撞。
此外,快速推理還可以在機器人執行任務時減少延遲,使得機器人能夠實時适應環境變化,提升效率。
從研發到量産
高盛表示,近年來,越來越多的企業進入了人形機器人領域,特别是在中國。
2024 年,中國有 15 家公司進入人形機器人行業,并推出了 17 個新的機器人原型,而 2023 年僅爲 10 個。華爲、比亞迪、甯德時代等科技、汽車、新能源行業的領先企業也紛紛宣布啓動人形機器人研發項目。
更重要的是,與 2023 年相比,人形機器人技術的領先者(如 Figure、Agility、Unitree、AGIBOT、Leju 等)在 2024 年已經開始了工廠測試或初步商業化。
這些進展表明,人形機器人行業可能已經接近進入量産階段。
此外,對于中國人形機器人廠商而言,DeepSeek-R1 的發布爲趕超海外同行鋪平了道路。
在 DeepSeek 推出之前,中國廠商必須基于 OpenAI、Llama 訓練模型,而 DeepSeek 發布的高質量開源 LLM,使用較低端的 GPU 和較低的成本,可能有助于國内廠商在競争中獲得優勢。