文 | 黎詩韻
編輯 | 靖宇
在目前大熱的人形機器人、具身智能賽道,宇樹科技是最受關注的公司之一。這家公司最大的标簽是硬件實力強——一方面是性能,去年其首款通用人形機器人 H1 能奔跑、原地空翻、踹不到,擁有全球幾乎規格最高的動力性能;一方面是成本控制,今年其第二款人形機器人 G1 價格僅 9.9 萬元,而同行普遍在數十萬、乃至百萬元。
這背後建立在積累多年的四足機器狗技術上。四足機器狗和雙足機器人的底層技術相通,宇樹隻用 3 個員工、不到 6 個月時間,就做出了上述人形機器人産品。談及硬件實力強的原因,宇樹科技創始人王興興對極客公園表示,主要是做了十幾年、在軟硬件上積累了大量的認知和經驗。
2013 年,還在讀研的王興興,自己設計電機、控制算法等,用不到兩萬塊研發出了第一台四足機器狗 XDog,這幾乎是全球首個四足機器狗的技術方案;2016 年,當 XDog 在海外展現出市場需求,王興興離職創立宇樹科技,不久後極客公園旗下的變量資本,注意到了王興興,并于次年領投了其天使輪融資。
目前,宇樹的機器人本體(硬件)被全球各大科研機構、科技公司購買,用作研究。而其四足機器狗目前在全球出貨量第一,包括萬元的消費級機器狗 Go2 及最其新輪足版本 Go2-W,用于工業級場景的 B2、B2-W。年初,宇樹披露了最新一輪近 10 億元的 B2 輪融資,這也讓它成爲目前機器人賽道估值較高的公司之一。
不過,AI 爲機器人這個賽道帶來了新的變量。
在王興興看來,AI、而不是硬件,才是目前人形機器人行業最大的掣肘。兩年前 ChatGPT 的出現,讓人形機器人有機會進化出真正智能的大腦,變成有自主感知、決策、執行能力的智能體。它将在工業、家庭等場景形成通用服務能力,從而作爲全新的生産力供給,帶來萬億規模的市場機會。
在王興興看來,硬件未來或許會處于從屬地位,比如當一個超級強大的機器人 AI 模型出現、哪怕用垃圾堆裏撿的一堆機器人零件也能幹活。不過,他并不打算改變公司的目标和重心,宇樹的目标仍然是「做好産品」,AI 隻是少量投入、且是爲了更好地服務客戶。
宇樹代表了目前人形機器人公司的一種謹慎、務實選擇。在王興興看來,目前人形機器人 AI 的進程還非常早期、甚至不到「GPT-1」水平,表現爲機器人沒有很好的通用性和泛化性,商業價值不大。而技術進化的路線又沒有明确、數據也非常缺乏,因此全球各大公司對人形機器人的投入還遠遠不夠,包括特斯拉、英偉達。
他說,技術的推進将由「全球共創」,并且很快就會有突破——因爲,AI 技術呈現出階躍性突變的特點,進步總是突然發生。而對于宇樹來說,重要的事情是保持學習、跟進新技術,這能讓公司存活下來、甚至繼續領先。
以下是極客公園與王興興的對話,與現場分享進行了融合後整理:
AI 技術不成熟,工業場景的落地還未到時候
極客公園:最近不少人形機器人公司都在提工業場景的落地商業化,包括前不久 OpenAI合作的 Figure 02 也宣布進入寶馬工廠。你怎麽看今年人形機器人行業的變化?工業場景的落地是否在加速?
王興興:我個人感覺其實沒有太明顯的變化,隻是說會有進步,以及會有一些嘗試性落地。但目前大家基本上還是處于試點階段,覺得工業方向有價值,先嘗試下落地部署。
極客公園:有人說今年會是 POC(Proof of Concept,概念驗證)之年,你怎麽看?
王興興:隻能說在一些相對容易落地的小場景、工業的局部環節能做點事情。但大部分還是針對特定環節進行定向訓練,成功率也未必特别高,離通用場景還比較遠。
極客公園:關于應用場景,似乎你們之前說會看重介于工廠和家庭之間的能源場景?
王興興:我們公司還是偏工業一點,目前大量工廠對勞動力的需求是比較大的。但能源行業大部分全是自動化設備,它對人力的需求我感覺沒有那麽多。
極客公園:你們現在在工業領域有哪些落地?
王興興:比如我們過去幾個月有跟蔚來的汽車工廠合作,現場部署了我們的人形機器人做搬運,有激光雷達定位、機器人操作、AI 識别等,整個過程是全自主的。
雖然我們也在推進落地,但可能推進的速度和效率沒有那麽快。我們公司還是比較有耐心的,不是說一定要今年或者說明年在工廠裏部署多少台,其實沒有把自己逼迫那麽緊。因爲我覺得目前技術發展水平還不夠,沒有達到真正商業閉環,比如讓機器人能達到一個工人的價值。
所以我們還是尊重整個市場的反應,等到技術和産品成熟到一定程度了、已經有一些更好的商業推廣的勢頭了,我們再大規模地推廣。
極客公園:大家都在提人形機器人進入汽車總裝場景,你覺得什麽時候能實現?
王興興:汽車總裝很難,因爲汽車總裝最大的一個問題是汽車的零部件太大了,一般小的人形機器根本搬不動。而且車輛又特别複雜,要把機器人伸進去裝,難度太大。目前進入汽車廠商的上遊供應商可能還更容易一些。極客公園:上遊供應商指的是?
王興興:生産一些儀表、線纜或者什麽,這可能簡單一點。總裝廠的難度其實有點大,個别總裝廠裏部分工序還是能做的。
極客公園:在機器人底層AI技術還沒有真正突破時,怎麽看大家鑽到細分場景去做落地的意義?現在針對細分場景打補丁,會不會難以跟上底層 AI 的技術進展?
王興興:其實每個行業肯定要先嘗鮮、先推進一些事情,不可能等所有的技術或所有的條件都滿足了,再去做一些商業化或者落地的事情。如果有能做的,大家可能都會開始嘗試,這是毋庸置疑的趨勢。
極客公園:你之前提到,明年年底前全球至少會有一家人形機器人公司實現工業場景的商業閉環,這個判斷是怎麽做出的?
王興興:原因也比較簡單,目前全球整個的機器人 AI 技術的進步還是非常快的。技術一旦變得更好,那有些簡單工業場景的落地就可以做了,一旦比如一個工廠的一台人形機器人設備,能夠産生正向商業價值,其實很多的工廠都會買,這是不可阻擋的一件事情。
我覺得到明年底和後年,人形機器人真的可以大規模地在工廠裏鋪起來。這個是非常快的,所以當務之急還是要把 AI 做得更好一點。
宇樹機器狗被用于工業場景 | 圖片來源:宇樹科技
人形機器人 AI 不到 GPT-1 水平,原因是數據和技術路線不清晰
極客公園:如果把現在具身智能的智能水平跟大語言模型做對比,你覺得現在是相當于 GPT 幾的階段?
王興興:我覺得還沒到 GPT-1 的水平。具身智能整個的模型進展是有點慢的,還沒有突破一個臨界點。現在就有點像 ChatGPT 出來前一兩年,機器人 AI 還是有點笨拙,隻能做一些非常簡單的工序、而且執行的成功率有點低。極客公園:這是不是悲觀了點?
王興興:沒有,這基本上是事實。我覺得目前至少公開的、大家看到的技術,還沒有到。極客公園:你覺得達到 GPT-1 的标準會是什麽?
王興興:一定的通用性和一定的使用價值。現在很多場景都是固定工位、工序的訓練,能做點事情,但泛化比較差,你訓練了什麽就隻能做什麽。
你可以看到前些天,特斯拉才剛開始招數據采集的人。你說數據都沒有到位,這個模型怎麽出來呢?所以就 GPT-1 都沒有。極客公園:之前看到特斯拉有通過搖操的方式獲取數據?
王興興:已經做了一點點,但是很小的、固定的一部分功能,比如把一個電池從這裏拿到這裏。這當然是可以的,但它跟我們想象中的通用機器人模型完全兩碼事,跟通用的基層模型還差挺遠。極客公園:所以AI技術沒突破主要是數據的問題?
王興興:數據是一方面。現在很多機器人數據都很雜、不太幹淨,甚至也不是給機器人專用的,就不是真正能幹活那種級别的數據。所以隻能做些簡單的事情,成功率不是特别高。極客公園:應該怎麽解決數據問題?特斯拉、谷歌比較強調遙操、英偉達強調仿真,你怎麽看?
王興興:遙操、仿真都有需要的,各有優缺點。
比如虛拟數據能大概讓機器人知道要往前走、或者拿個什麽東西,但是真正要達到非常精密的操作,誤差會比較大。你可以用虛拟數據做機器人的訓練,但最後要讓操作準确度達到 100%,還是需要真實的數據。我覺得如果有實力的公司,像特斯拉,多弄點人搞真實數據會比較好。
不過我個人感覺,機器人的數據量沒有大家想得那麽誇張。現在最大的問題是。現在每家搭的模型都不太一樣,每家的想法也不一樣,沒人知道哪個模型是好的、也沒人知道哪個什麽技術路線是真正最後能跑出來,都比較模糊。
機器人仿真數據 | 圖片來源:宇樹科技
極客公園:行業主要分爲怎樣的技術路線?
王興興:目前市面上比較常見的有兩種。一種是把大語言多模态模型直接給機器人用,然後再加一部分機器人底層的操作運動集等,讓大語言模型去調用一下、完成一些事情,這是目前最常用的一個架構。
有些公司可能希望更端到端一點,像特斯拉目前要搞的就是這個方向。它直接用模仿學習,讓人采集大量的動作數據去訓練機器人。它确實堆數據是有效果的,比如今天幹這個活堆一部分數據,幹一個活堆另外一部分數據,最後這兩個活都能幹,但更大的驗證不太确定。
極客公園:爲什麽技術路線還沒有形成共識?
王興興:主要是模型和最終結果都沒有看起來說,哪個技術路線特别特别好。
光硬件都沒有辦法形成共識,比如一個攝像頭具體應該裝什麽位置、裝幾個,傳感器數據應該怎麽采、要不要觸覺傳感器,有的不想要靈巧手、有的需要很多手指……每個人的想法都不太一樣。這就導緻了其實很難評價哪種正确、哪種錯誤。
其實在 ChatGPT 之前大語言模型也有非常多的架構,隻是後來發現這種架構更有價值,就把其他架構淘汰了。現在人形機器人有點像 ChatGPT 出來的前一兩年,實際上沒有哪家敢保票,說自己的方向是絕對正确的。
極客公園:那你自己更相信哪一種路線?
王興興:我感覺可能跟他們想法都不太一樣。我們其實目前不是特别急,一方面是看能不能做一些新的模型,另一方面這些常用的我們也會用。我們就玩玩吧。
極客公園:大家說智能汽車是機器人的一個子集,現在很多車企在入局人形機器人行業,車企從自動駕駛的端到端來做機器人會更有優勢嗎?
王興興:因爲馬斯克在搞人形機器人,所以車企對這塊肯定是比較關注的。大家希望在機器人上用到像 FSD 一樣端到端的自動導航技術,但很多傳統的自動駕駛還是偏傳統的技術,比如機器狗在一些園區做巡邏的這種技術。
把 FSD 自動駕駛用在人形機器人上面,大家做得不夠好。包括特斯拉,因爲特斯拉大量的人力都放在 FSD 去了,人形機器人相對投入沒那麽多。當然也有一些創業公司在做,但目前還是不多。
極客公園:你認爲機器人AI什麽時候能實現 GPT-1 的水平?
王興興:明年年底差不多,全球至少有一家公司應該可以搞出來。可能比這個時間還更快。極客公園:雖然技術路線還不清晰,但爲什麽相信能這麽快實現?
王興興:比較簡單,AI 技術都是階躍性的。現在有點處于一個平台期的感覺,但技術進步本身非常快,可能今天沒做出來,突然明天就做出來了,它就是突變性的。
比如我們在研發的時候,經常發現非常驚喜的事情:有同事調了(機器狗)很多天都調不好,它完全地上打滾啥都幹不了。但突然一個晚上,你給它訓練一個新的模型放上去,第二天早上效果就非常好。這種情況在 AI 裏面很常見,一開始可能真的是很爛,突然間變得非常智能。
另外,這個行業越來越熱了,有更多的聰明人、更多的錢在關注這個行業,那整個速度就會變快。如果還是按過去那種機器人 AI 研發的進度,可能等個十幾年或二十年都等不到。所以目前,我還是比較樂觀。
全球人形機器人公司對 AI 的投入都很少,處在觀望、共創階段
極客公園:目前你們在AI 上的投入怎麽樣?
王興興:說實在的,我們在國内在機器 AI 裏投入算是比較少的,跟别家比起來。極客公園:但你之前說希望能更相信、更投入 AI?
王興興:對,但是畢竟财力和精力有限嘛。AI 太燒錢了,光 GPU 算力都燒不起。如果投入太大,容易盈虧不平衡。所以我們還是克制一點。
極客公園:從這個角度上來說,有更多資金的大公司會比創業公司更有優勢嗎?
王興興:我覺得還好。核心原因是,在目前技術路線不是特别清晰的情況下,你哪怕有很多錢和資源,也使不上太多勁。在這個階段,你可以看到雖然大公司都挺關注的,但投入其實不多,其實都很保守。
特斯拉的人稍微多一點,至少有幾百人,别的公司大概可能有幾十人。投入遠遠不算大。國内其實大家投入也都挺克制,沒有說哪家瘋狂投入啊。
說實在的,它不是說一家公司有多少錢、有多少人就能一定能把它做出來。因爲在這種前沿的、全球都沒有人做出來的情況下,某種程度上你可以認爲看運氣、或者看某個天才人物,把這個事情推動了。
極客公園:這看起來很反差,外界都覺得人形機器人行業很熱,但實際上大家投入不多。
王興興:這跟大語言模型比起來真的是九牛一毛。
因爲大語言模型的技術路線相對确定了,如果你去看一下 OpenAI 的早期發展經曆,它做的事情其實很雜,包括機器人、AI 模型等等。後來它們是發現 GPT 的方向比較正确,通過投入算力和資源、可以大力出奇迹,才重注這個方向。它們并不是在路線還不太清楚的時候亂投入。
極客公園:那人形機器人相比自動駕駛,哪個更遠?
王興興:FSD 更快,基本上特斯拉在這個技術路線上就跑通了,商業價值目前都完全看得到。所以它們現在投了大量的資金和人力去做 FSD。
我覺得這也是爲什麽它們人形機器人的 AI 進展沒有那麽快,因爲目前的技術路線沒有特别清晰,所以投入跟 FSD 比起來真的是少很多。極客公園:一方面是技術随時會有突破,另一方面大家又不敢投入,那怎麽跟上技術進程?
王興興:這個不太好估計吧,就看具體的技術進展。如果突然覺得技術好了,你就多投點錢。如果技術不太好,那就少投點錢。這其實是很動态的一件事。
極客公園:技術突破主要是靠學術界還是科技公司?
王興興:目前還是全球共創的階段,很難說是某個實驗室、某家大公司。就像 OpenAI 能做出 GPT,也用到了谷歌的 Transformer 技術和其他公司的一些成果。
很難說某家大公司是技術最領先或者産品最領先的,國内國外都有可能,大公司或許機會更大一點,但都不好說。AI 這個領域就是這樣,今天你領先,過了沒幾天别人更領先了、你原本老的東西都不能用了,它的變動性和風險系數還挺高的。
我們公司還是希望全球共創、和大家一起努力,之後再根據整個産業的動向做相應的調整。
極客公園:爲什麽你之前說,這次技術的突破大概率是由别的公司完成?
王興興:這其實是完全不可預計的一件事。不過我覺得美國的概率會更大一點,因爲它們 AI 人才更多一點、算力也更多。
宇樹的人形機器人 G1 具有超越常人的靈活性 | 圖片來源:宇樹科技
目前的大語言模型無法通往 AGI,但具身智能可以
極客公園:你提到相比于大語言模型,具身智能是實現 AGI 的最有效途徑。這種物理世界的 AGI 和虛拟世界的 AGI 是一樣的嗎?
王興興:我覺得是統一的。我認爲真正的 AGI 需要有物理肉體,純虛拟環境的 AI 可能沒辦法誕生 AGI,最後它一定要和身體做整合。
我之前提到過大語言模型有「幻覺」問題,「幻覺」就是虛拟環境導緻的。就像大腦在做夢,你沒辦法判斷這個虛拟環境的真實性,就會迷失。就像把你的大腦被連接到互聯網上,看到各種圖片、視頻,沒準過一段時間你就已經完全沒辦法區分什麽是真的、什麽是假的。所以要實現 AGI,還是要結合具身智能和機器人。
極客公園:像 Sora 這種模拟真實世界的物理模型,能解決這個問題嗎?
王興興:我覺得這是個很好的技術方向。它目前已經能做一部分事情了,比如生成一個跳舞的小人,但離質的飛躍還有點難度。
極客公園:具身大模型跟大語言模型,最終會形成一個怎樣的關系?
王興興:語言模型未必是給具身模型的必選項,它隻是其中一部分。舉個最直觀的例子,比如在工廠裏做事的一個機器人,他完全可以不說話,比如說我給它一個任務,給它看一張照片、或者給它敲一個數字進去,他隻要能幹活就行了。具身模型最核心的是幹活。
極客公園:從具身智能來看,實現 AGI 的标志是什麽?
王興興:我覺得還是機器人能真正達到自我學習、自我幹活,或者至少大部分活都能自己幹。比如你随便找一個場景,家裏、工廠,隻要把人形機器人拉過來,直接跟它說要做什麽事情,它一下就能學會做,至少要達到這種級别。
極客公園:最終就是開箱即用?
王興興:差不多。甚至如果再高級一點,需要機器人能持續性地自我學習。
因爲現在的 AI 都是靠人産生的數據驅動的,但未來是不是可以不要人爲數據、讓它自己生産數據,自我驅動、自我學習和進化。甚至你啥都不用管了,它連芯片都能自己造。
極客公園:當真正的 AGI 時刻來臨,它會帶來怎樣颠覆性的影響?
王興興:我覺得整個社會的變化會非常非常大。普通人可能不需要上班,生産力将由機器人承擔。我覺得這會真正解放人類,讓每個人都可以吃喝玩樂,每個人都很快樂,每個人都有大的房子住,每個人想去哪裏玩去哪玩,每個人都很自由。
而且我覺得這個過程挺快的,5 年内有可能實現,最多不會超過 10 年。AGI 的未來其實并不遙遠。
消費級機器狗 Go2 及最其新輪足版本 Go2-W | 圖片來源:宇樹科技
宇樹的目标還是做好産品,并學習和跟進新技術
極客公園:外界都知道宇樹的硬件做得好,國内外的高校、科研機構都買你們的機器人本體做研究,爲什麽你們能做好這件事?
王興興:對我們公司來說,最大的一個優勢就是,我們在這個行業做了很多年了。我自己差不多從 2010 年就開始做小的人形機器人,2013 年就正式開始做電驅動的四足組機器人,已經有十幾年了。
所以,我和團隊,在機器人硬件和軟件方面積累了大量的認知和經驗。無論是硬件的生産制造、降低成本、提高可靠性,還是銷售渠道,還是技術的研發等等。目前我們整個公司規模在全球來說也是比較大的,這些多方面的因素讓我們相對很多别的機器人公司有更多優勢。
我一直堅信一點,其實世界上的聰明人很多,但你真正要把這個行業做得很好,其實主要還是保持足夠長時間的學習與進步。隻有這樣,才能真正把這個行業做好。
極客公園:堅持研究機器人十幾年,這背後是源自什麽?
王興興:我确實比較喜歡機器人,但其實我從小對所有的科技都比較喜歡,就從幾歲的時候開始,科學、物理、化學、生物這些學科我都很喜歡。
09 年讀本科的時候,機器人變成了我的一個職業傾向。無論是機械結構設計、電器電機控制、包括 AI 算法等等,我都比較喜歡。如果有些人覺得一個方向做久了有點厭,對我來說可能反而還好。比如說今天可能玩玩機械玩膩了,明天換一換玩 AI,再玩膩了就回頭玩玩電路闆。
所以我的興趣點還是非常非常多的,而且随着每次有新的創新出現,對我來說是非常非常滿足的一件事情。
極客公園:你說現在AI 才是整個機器人行業最重要的變量,這會帶來哪些機遇和挑戰?
王興興:我一直認爲機器人行業現階段最大的限制,還是 AI 不太夠——AI 模型、AI 的訓練數據集、AI 的場景的落地部署,都完全遠遠不夠。當然硬件目前也不夠,但是它沒有理論上的門檻,隻是工程上的問題,比如把成本做得更低,性能做得更好、外觀做得更加極緻、功能更加豐富等,時間是可以預估的。
随着 AI 技術越來越成熟,大家對硬件的需求會越來越低,包括硬件的自由度、數量、外觀靈活度等等。甚至我一直感覺,當未來人形機器人的 AI 真正突破之後,你從垃圾堆裏找幾個關節電機,把它像個人那樣搭出來,它就自己能走路甚至能幹點活,這都是非常有可能的事情。
我們的立身之本肯定是機器人本體,不過我們在 AI 方面也做了不少的事情,但比不上純粹的 AI 公司。我們之所以要做 AI,也是爲了讓客戶知道我們機器人的 AI 效果怎麽樣,你需要一個初始的軟件系統。我們的核心還是希望有更多客戶來用我的機器人,他哪怕買了硬件把軟件(AI)全給删了,這也沒問題。
所以我們現在也積極地跟各種大模型公司合作,我們非常願意直接在我們産品上标配它的大模型。可以這麽說,如果哪一天有人把 AI 機器人的模型做出來,我可以保證年底之前直接給他做 10 萬個人形機器人。
極客公園:你怎麽定義公司的目标?如果說OpenAI目标是成爲最頂尖的技術公司,但這似乎不是你們的目标。
王興興:還是希望把産品做得更好一點吧,比如硬件成本、外觀性能、客戶友好性、包括功能等等。我們還是希望大家能接受我們的産品,最終讓産品在工廠、服務業、家用等場景真正産生價值。其實無論客戶對我們的印象是硬件還是軟件,我覺得都無所謂。我們會投入 AI,但我們不會是搞專門搞基礎 AI 的公司。
極客公園:現在有越來越多人形機器人公司出現,有一些也拿到了不錯的融資,你怎麽看待競争?
王興興:我覺得因爲行業确實非常熱,所以很多人進來,這是不可避免的一件事情。但是對于我們公司來,包括對我自己來說,我們一直堅信就是我們要超越的,主要還是我們自己。
因爲我們目前無論是技術層面、包括公司規模,都比市面上大部分公司都還是要好很多。所以如果我們盯着對方,其實也沒有太大幫助。我自己,包括我們公司,主要是希望每天、每個月、每年有更好的産品技術,或者在商業化策略上有更好的進步。保持進步是最主要的一件事情。
極客公園:你自己花多少精力在探索新的東西上?
王興興:時間不太好說,不是特别确定和固定。
極客公園:身處AI大變革的時代,一方面技術還看不真切、但另一方面技術又會随時湧現,這是一種怎樣的心情?
王興興:我覺得還是非常激動人心的,你隻能保持探索的、學習的狀态。比如說有什麽新東西了,要盡早發現苗頭,盡早把握機會。這一點,我們可能比大公司更有優勢,因爲大公司内部的流程體系有一些限制、團隊會面臨更激烈的資源競争等等。
中小公司更能保持足夠的前沿技術的敏感度,你得看到未來,你得足夠靈活。如果你能預估未來 1 年、2 年、甚至是 5 年以後的整個技術路線,包括整個産品格局,整個世界格局是怎樣的,你提前做布局去做,你肯定死不了。你能不能做第一不太清楚,但至少做到前幾名,還是非常有可能的。