圖片來源 @視覺中國
文 | 根新未來,作者 | 陳根
打造出跟人類本身具有相同形象的機器人,一直是人類的夢想。畢竟,在很多人第一印象裏,機器人應當是類似于人形的機器。尤其是 20 世紀中葉,科幻作品中大量出現 " 仿人機器人 " 的形象,形塑了人們對于機器人的想象。這種機器人往往被設計爲擁有四肢、軀幹、頭部,甚至五官,與人類尺寸相當。
當然,由于人形機器人技術上的困難,在實際生活中,我們看到的或者是用到的機器人,大部分并非人形。而 ChatGPT 的爆火,給了人形機器人一次新的機會。當前,人形機器人領域正呈現一片熱鬧非凡的景象,并朝着真正意義上的 " 人形 " 一路奔去。
爲什麽需要人形機器人?
相較于其他形态的機器人,人形機器人具有特殊的意義。
一方面,人形機器人能夠更好地充當人類的勞動力,馬斯克不止一次強調,人類文明所面臨的最大風險之一就是人力短缺,人類更應該将精力放在腦力勞動而不是體力勞動上。然而,要讓機器人更好地充當人類勞動力,就需要讓機器人也适應我們人類的生活。因爲我們的社會是根據人類本身來設計的,而一個像是人類的機器人,就能夠很好滿足這一條件。
比如,我們之所以把機器人做成人形,不用輪胎而用雙腳行走,正是爲了适應移動時的環境。人類希望機器人的活動範圍不被局限于路面上——爲了方便直立行走的人類,我們周遭盡是樓梯和門扉,生活空間中存在着許多可以在步行過程中跨越的高低差。盡管如今全社會都爲了照顧輪椅使用者而努力推廣無障礙設施,但人的行動範圍裏仍免不了存在障礙物。因此,對于機器人來說,僅僅像掃地機那樣避開地闆上的障礙物顯然是不夠的,機器人還要時不時上下樓梯。
人形機器人能夠對應我們的社會而生,才能實現最高效率的勞動力。也就是說,把機器人做成 " 人形 " 的理由之一,就在于機器人執行任務時所處的環境其實是遷就人類的體型建造起來的。衣服、桌椅、杯子、手機、汽車等等,人們眼中的這個世界,全都是爲了方便人類這種 " 人形 " 生物才如此設計的。如果出現了新形态的機器人,人們就必須重新設計一套機器人能夠适應的全新環境。
另一方面,則是需求所緻。在很多領域,機器人作爲服務者,隻有人類的外表才更容易被接受。比如,産後護理、幼兒陪伴、老人看護等——人類與人形機器人更容易産生情感上的交流,這就是 " 恐怖谷 " 效應的第一段曲線上升部分。" 恐怖谷 " 效應由日本現代仿真機器人教父森政弘于 1970 年提出:當仿真機器人的外觀與動作相似,但并非完美拟合時,人類作爲觀察者會産生厭惡反應。
比如,我們對人形機器人或玩偶的好感度,會随其仿真度提高而增加,當仿真度達到一定比例時,當我們看到既不像人類也不像典型機器人的仿真機器人時,情感會突然逆轉,本能覺得不正常并産生厭惡和恐懼等回避反應。隻有當仿真度繼續提高,我們的情感反應才會再度回轉。
舉個例子,當我們聽到走廊裏傳來家人的腳步聲時,往往會立刻知道 " 是誰回來了 "。有時,我們能隔着老遠就認出朋友的身影。人的行走步态看似相近,但其實大相徑庭——身高和體重各不相同,各年齡段的肌肉量也有所差異。我們區分誰是誰,憑借的可不僅僅是臉型、體型等靜态外觀。我們不僅能通過靜态的肢體特征認人,還能通過肢體的運動特征認人。
從這個角度來看,比起用輪胎滑行的機器人,用雙足走路、會發出腳步聲的機器人更容易被人注意到,從而更讓人有安全感。
人形機器人爲什麽難做 " 人 "?
二十一世紀,AI 技術的快速發展曾讓人形機器人獲得了一次質的躍遷,但當 AI 的技術進展放緩之後,人形機器人的發展也逐漸慢下來,甚至可以說舉步維艱。
從技術角度來看,一個人形機器人身上集合了超過 200 種不同的技術:它必須會聽、會看、會移動、做動作、抓取物體、開門、爬樓梯,必要時還要背起人類或幫助人類走動。所以,這意味着在考慮賦予它何種類型的智能之前,要先掌握光學、力學、水力學、電子學、材料學、齒輪傳動和驅動系統。其中,最迫切的問題之一是平衡:人類因爲有内耳,所以總能保持平衡,一旦發生平衡障礙,内耳會進行矯正。人形機器人沒有這種工具,它必須能夠自主控制驅動它的力量。
于是,龐大的研發成本,讓不少機器人公司都陷入了财政危機。Pepper、ASIMO、Atlas 作爲人形機器人行業先驅,或告别市場,或找不到合适的應用場景。
由于缺乏商業價值,本田在 2018 年逐步停止了人形機器人的研發工作,曾經風靡一時的 Asimo 機器人也開始慢慢退役,不再進行演出和展覽。停止研發的原因,主要是缺乏商業性,龐大的研發成本使公司無法賺取足夠的利潤。而對于大部分人來說,人形機器人表演已經失去了新鮮感。
雖然近年來,産研界關于人形機器人的動作明顯增多,但對于人形機器人來說,依然缺少一個重大突破推動人形機器人的發展進入下一個階段。當前的人形機器人不僅價格高昂,而且實際的産品體驗往往欠佳。
一方面,當前的人形機器人在硬件層面所牽涉到的很重要的一個問題,就是靈活性。由于機器人是由機械零部件組裝而成,而這些機械零部件跟人體的骨骼與神經控制系統有很大不同,要想讓人形機器人到達類人這樣的靈活度,或者說至少要讓人形機器人看起來像個人,那麽要達到這樣的效果,在硬件層面還需要很長的一段路要走。
另一方面,是當前的人形機器人隻能對标準化問題的程序進行回複,跟智能幾乎沒有什麽關系,超出标準化的問題,人工智能就不再智能,而變成了 " 智障 "。也就是說,當前的 AI,在很大程度上還隻能做一些數據的統計與分析,包括一些具有規則性的讀聽寫工作,還不具備邏輯性、思考性,而在控制整個硬件軀體方面更是處于起步階段。
因爲人體的神經控制系統是一個非常奇妙系統,是人類幾萬年來訓練下所形成的,顯然,當前的人形機器人不論是在單純的 AI 思考性方面,還是在與機器人硬件的協調控制方面,都還隻是處于起步階段。
人形機器人的新拐點
當然,不論我們是否接受,人與機器人共同生活與協作,都将是未來社會的一種常規模式。這也是爲什麽科技巨頭燒錢都要進入這個行業的原因。
比如,以家電産品 " 出圈 " 的戴森就進入了人形機器人領域,目前,戴森已發布的是一款能拿起漂白劑、夾起盤子的機械臂。而戴森的願景是,在未來 10 年内推出可以做家務的人形機器人。憑借在掃地機器人、吹風機和吸塵器等産品在家庭服務領域積累的經驗和技術,戴森計劃以自己的優勢技術來打造一個家用保姆人形機器人。
再比如汽車大廠比如特斯拉,2022 年,特斯拉帶來了 Tesla Bot 人形機器人 " 擎天柱 " 原型機的全球首秀。在發布環節中,人形機器人從幕後緩緩走上前台,并向台下觀衆揮手緻意,做出多個簡單動作。馬斯克表示,特斯拉機器人最初的定位是替代人們從事重複枯燥、具有危險性的工作,但遠景目标是讓其服務于千家萬戶的日常工作。事實上,機器人 " 擎天柱 " 有明确的生産目标,就是成爲特斯拉工廠的生産力。因此公司在大規模量産的同時也在控制成本。爲了達成這個目标,特斯拉引入了大量的造車經驗,用在該産品的生産上。
此外,還有以優必選科技和波士頓動力等爲代表的純機器人公司。其中,近期,深圳優必選科技就向港交所提交招股說明書、沖刺人形機器人第一股。現在,ChatGPT的橫空出世,人工智能被認爲迎來了繼 AlphaGo 之後再次實現質的突破。随着 AI 賦能愈發強大,人形機器人或許也将迎來應用加速落地的新拐點。
ChatGPT的爆發爲人形機器人解鎖了更多場景,比如 ChatGPT 背後的大模型技術,結合後将進一步提升機器人的智能程度——根據研究人員做的心智測試,結果發現,ChatGPT 已經擁有 9 歲小孩的心智了。從智能的本質來看,人類心智與人工智能隻不過是這個世界的兩套智能,而這兩套智能的本質都是通過有限的輸入信号來歸納、學習并重建外部世界特征的複雜 " 算法 "。
因此,理論上來看,隻要我們持續地對人工智能進行教育,用龐大的數據訓練人工智能,人工智能遲早可以運行名爲 " 自我意識 " 的算法。
人工智能能夠通過心智測試并不意外,今天的 ChatGPT 雖然隻有 9 歲小孩的心智,但在更龐大的數據的訓練下,在未來,人工智能将擁有真正與人類相似的思考和心智。人形機器人的應用領域也将從教育及娛樂進一步拓展到健康養老、消殺、物流等賽道,機器人從自動化到自主化智能的轉變将帶來重大發展機遇。
如果說,作爲自動執行工作的機器裝置,近年來,随着人工智能交互技術的應用,人形機器人的智能化程度有了顯著的提升。那麽現在,全世界矚目的 ChatGPT 則爲人形機器人加了一把火,或許,随着 ChatGPT 的到來,人形機器人也将迎來一個新的發展拐點。(本文首發钛媒體 APP)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App