當大模型成爲移動互聯網之後的下一個産業周期後,人形機器人也開始成爲承載這一技術的典型産品之一。
公開數據統計,2023 年國内人形機器人領域共有 19 起融資,披露融資總額達 26.7 億元,同比增長 65.5%。2024 年上半年,國内的人形機器人投融資事件已達 13 起,融資總金額超 25 億元。在參與投資的機構,有經緯創投、峰瑞資本、紅杉中國等風險投資機構,也有聯想創投、上汽、小米這樣的産業資本,還有亦莊創投、浙商創投等政府資金入場。
可以說,與上一波的自動駕駛創業潮類似,同樣短期内還看不到商業化可能的人形機器人賽道上,爲了搶到下一個時代的入場券,資本也開始了早期的密集押注。而不同是,相比自動駕駛而言,各地政府和國有資本進入人形機器人産業的程度更深、節奏也更快。
" 政府層面如此深度地參與這樣一個早期行業,确實是在十年前的自動駕駛創業潮中未曾出現過的現象。"
聯想集團副總裁、聯想創投合夥人王光熙對钛媒體 APP 表示,至于其中原因,一方面與整個資本市場的環境變化相關。近幾年,國有資本在新興産生産力相關的一些創新領域,開始扮演越來越重要的角色。
另一方面,人形機器人是一個非常早期的行業,也是一個跨領域的複雜系統工程——從 AI 軟件到硬件,再到應用場景,整個價值鏈的鏈條非常長。這就導緻單一的機構,很難像政府部門那樣,湊齊那麽多的資源來支持産業的發展。
王光熙認爲,在人形機器人這個非常早期的行業中,政府出來做一些事情還是非常有價值的。而作爲本輪人形機器人的資本參與方,聯想創投也投資了諸如星動紀元、逐際動力等人形機器人領域的熱門公司。
" 人形機器人領域的早期投資,很關鍵的一點要看創始人是否具有極強的跨領域研發能力。也就是 AI 時代原生的具身智能科學家,而不是原來做了多年的機器人控制或者視覺算法,現在大模型火了,出來學着做具身智能的人。"
王光熙稱,人形機器人領域的創業團隊,需要有對前沿技術的理解和突破能力,然後将最前沿不同領域的工具融會貫通,這樣才能做好整體的技術架構。
在王光熙看來,現在市場對于人形機器人的預期,短期過于樂觀而長期則過于悲觀。短期内,有些人期待着人形機器人很快就能下場幹活,進入産線甚至家庭生活。但目前這個行業的現狀是,至少需要兩到三年才能夠在部分技術領域有一些長足的進步和突破。
而從長遠來看,有觀點則認爲人形機器人泛化能力的突破看不到希望,從仿真訓練到實際場景的遷徙存在巨大鴻溝。但其實人形機器人從發展到成熟的過程中,存在着大量的中間狀态,在不同的可控環境和可控場景裏面,人形機器人可以幹各種各樣的事情。
以下是钛媒體 APP 與王光熙的獨家對話内容,略經編輯:
自動駕駛在發展早期時,政府的傾向可能是先讓企業在前面跑起來,然後在後續制定相關的政策。但人形機器人這波創業潮中,政府層面相對更靠前進入,包括引導基金參與投資或者各地成立創新中心。你是怎麽看待前後兩次創業潮中,政府相關部門的角色變化?
王光熙:你的觀察是對的。
自動駕駛本質上還是基于百年汽車工業,有一套已經非常成體系的産業生态,有成熟的規則,可以依托于成熟的産業去做增量試驗。因此,政府部門可能也沒有必要在産業發展特别早期的時候,就參與進來。
相對于自動駕駛而言,人形機器人是一個技術難度更高的行業,未來潛在的應用場景也非常廣泛,涉及到工業、物流、服務業,甚至是個人消費,牽涉社會的方方面面。而且,它還是一個跨領域、複雜的系統工程。從 AI 軟件到硬件再到應用場景,整個價值鏈的鏈條非常長。
這就導緻單一的機構,很難像政府部門那樣,湊齊那麽多的資源來支持産業的發展。這個時間點,政府出來做一些事情,還是比較合情合理的,也是非常有價值的。
此外,整個資本市場跟十年前相比也有了一些變化。國有資本在最近幾年,尤其是跟新興産力相關的創新領域,開始扮演越來越重要的角色,引領作用會越來越強,這确實在十年前是沒有的。
在各地政府部門參與人形機器人發展的過程中,你認爲那些城市會有比較大的優勢?
王光熙:根據我們有限的了解,各個地方的方式不太一樣,很難評價哪個方式更好。
以江浙滬地區爲例,它本身的産業體系就很豐富,從 AI 到半導體算力再到規模化制造能力,都有比較全的供應鏈。同時,江浙滬地區的商業化比較發達,大家很會做生意。所以,他們做這件事是奔着能夠商業化的目标去的,主導權更多是在企業。
北京這邊可能不太一樣,整個制造業相對比較少,但是優勢也很明顯,就是 AI 人才密度很高,還有高校和互聯網大廠的資源。北京的政策是屬于提綱挈領型的,通過建立框架性政策指導,構建平台型的産業技術生态。
對于人形機器人這樣一個過于早期的行業,供應鏈的集聚效應,算不算是一個明顯優勢?
王光熙 : 當然是。
機器人目前很多的零部件都不是新的,對于汽車零部件的複用度非常高。新能源汽車在最近十幾年突飛猛進的發展,讓中國在電機、電控、電池的産業集中度非常高。同時,汽車行業的激烈競争,也讓零部小型化、安全性和能量密度快速提升,這些零部件很大比例可以在人形機器人本體上複用。
除了本體之外,現在主流觀點會把人形機器人其他技術分成大腦、小腦兩個部分,這兩個領域的技術發展又是怎樣的?
王光熙:我其實并不喜歡這種分類方法,比如小腦代表的是控制,大腦代表的是感知理解,這樣會把這個事情變得很割裂。從未來的終局來看,人形機器人可能會越來越像是一個高度融合的端到端模型,這種純模型驅動的方式成功概率比較大。
其實就跟人一樣,人的行爲邏輯并不是先坐在那兒,然後想做一件事情,大腦先把它全計劃完,然後把這個計劃輸出給小腦,讓小腦接收到一堆指令,最後出現各種動作。人類行爲的本質,是高度連通的神經網絡,條件反射型的自主動作,有些是直接通過小腦進行運動控制。
所以,在目前人形機器人的基本形态都還沒有完全确定的情況下,分别去研究大腦和小腦的技術,其實也不太現實。
這有點類似于特斯拉的 FSD。FSD 出現之前,大家會認爲要實現自動駕駛需要安裝多少個雷達,多少個傳感器。但 FSD 出現之後,就把之前的感知、推理、決策邏輯,完全推翻了。通過基于神經網絡的端到端模型,FSD 能實現更好的強化學習效果。
但這裏面有一個問題,特斯拉 FSD 的成功,是基于長周期、大量的汽車訓練數據得來的。如果純靠模型驅動,人形機器人各種維度的數據應該怎麽獲得?相比于特斯拉 FSD 所需要的數據量,人形機器人大模型的數據量是不是更大,獲得難度也更大?
王光熙:不一定。
FSD 出來之前,雖然特斯拉有了十多年的數據,但這些數據的對于純模型驅動的 FSD 而言,價值沒有那麽高,此前投入大量精力做的數據标注工作可能都是白做的。你可以理解爲,FSD 不是因爲特斯拉有了此前十年的數據量才能做出來,而可能是因爲基于神經網絡的端到端模型,基于近期更高質量的數據和現有的硬件框架,才有了 FSD。
對于人形機器人的數據,現在學術圈也在探索,怎麽用更高效的方式來獲取數據和融合多種類型的數據。這些數據中,有些可能是機器人在真實場景中的訓練數據,有些可能是從模仿學習得來的數據,有些可能是用高質量的仿真環境訓練出來的數據,不一而足。
但總的來說,想要實現人形機器人的通用化,這些數據的需求體量也沒有想象中的那麽巨大,因爲機器人運動控制的精度和靈敏度也不需要那麽高。
和自動駕駛不一樣,一個成熟的自動駕駛産品需要做到人類司機差不多的事故率,甚至更低。但對于通用人形機器人而言,它不一樣要和人類同等水平或是超越人類水平,它可以有很多中間狀态,基于不同等級的通用水平,可以在不同的場景做更多的事情。
這是不是也意味着商業化可能也沒那麽難?
王光熙:我覺得對于商業化,短期内大家都過于樂觀,但是長期又都過于悲觀。短期内,大家恨不得他明天就啥都能幹。但長期來看,它能幹還能幹好,還便宜,這又很難且區别很大。比如,如果一個幹活能力很強的機器人售價 100 萬,你會買嗎?可能不會,因爲如果多雇傭幾個人,算上增加的成本,可能還是人更便宜。
對于端到端的這種模式,還有一個問題是如果大家都往這個方向走,也都采用類似的傳感器、關節、電機電控,那麽最終決定産品差異的是什麽?
王光熙: 雖然大的框架都差不多,但對于框架的理解差别還是挺大的。比如同樣做強化學習、仿真訓練,做得好與不好,差十倍都有可能。再比如在傳感器方面,比如力控傳感器或者觸覺傳感器,過去的行業積累都很少。所以,從傳感器到底層算法再到多模态數據懸鏈,這個過程中産生的差異會非常大,這也會導緻機器人的泛化能力和适用場景也會差異巨大。
所以,對于人形機器人公司的投資,您最看重的是什麽?
王光熙: 能否有極強的跨領域研發能力,這點是非常重要的。人形機器人行業有着大量需要拓荒的地帶,這個時候創始團隊需要有對前沿技術的突破能力,以及能夠将最前沿不同領域的技術融會貫通,這樣才能做好整體的技術架構。
同時,要看這個人是不是 AI 時代原生的具身智能科學家,而不是原來做了多年的機器人控制或者視覺算法,現在大模型火了,出來學着做具身智能的人。如果隻是一個商業化的團隊,出來就跟你說我明年就能商業化閉環,就能賣多少機器人,那都是在吹牛。目前這個行業的現狀是,至少需要兩到三年才能夠在部分技術領域有一些長足的進步和突破。(本文首發于钛媒體 APP,作者 | 饒翔宇 編輯 | 鍾毅)