Figure 創始人兼 CEO 布雷特・阿德科克(Brett Adcock)發布了一種新的機器學習模型 Helix,旨在提升人形機器人在家庭環境中的應用能力。這一消息正值 Figure 宣布與 OpenAI 的合作結束僅兩周,顯示出他們在機器人技術領域的堅定決心。

Helix 是一個 " 通用型 " 的視覺 – 語言 – 行動(VLA)模型,能夠通過視覺數據和語言指令來實時控制機器人。它的工作原理與谷歌 DeepMind 的 RT-2 相似,後者通過視頻與大型語言模型的結合訓練機器人。Helix 則更進一步,它展示了強大的物體通用性,能夠識别并拾取成千上萬種在訓練中未見過的家居物品,這一切隻需用戶用自然語言進行指令。
Helix 以極少的資源實現了強大的對象泛化。總共使用約 500 小時的高質量監督數據來訓練 Helix,這僅僅是之前收集的 VLA 數據集的一小部分(