生成式AI正在改變整個世界，聊天機器人隻是其中的小兒科

人工智能革命的影響将不再僅限于聊天機器人，從研究新型塑料食菌、創新的癌症療法，到自主輔助機器人以及自動駕駛汽車，生成式人工智能技術正以各種方式重塑我們的生活，相比之下，會說話的機器人似乎隻是其中微不足道的一環。

我們往往将當前的人工智能等同于能寫作、能交流、能編程及能拍照的計算機，但實際上，這些功能大多建立在一種名爲 "Transformer" 的底層技術之上。然而，這種基于注意力機制的神經網絡架構的應用範圍遠不止于此。

兩年前，Transformer 爲 OpenAI 推出 ChatGPT 奠定了基礎。如今，衆多公司正積極探索如何以新穎的方式利用這一創新技術。例如，Waymo 正利用它開發自動駕駛出租車，而生物學初創公司 EvolutionaryScale 則用它設計全新的蛋白質分子。

01 從文本翻譯到通用學習者

現代人工智能素來擅長識别信息模式，但以往的局限限制了其更多潛能的發揮。以語言爲例，過去的人工智能系統往往隻能逐個處理單詞，并根據單詞出現的順序進行預測，這大大削弱了它們理解單詞深層含義的能力。

2017 年，谷歌研究人員在一篇開創性的論文中聚焦于語言翻譯。他們發現，如果人工智能系統能夠一次性處理整篇文章，并能夠結合上下文進行閱讀，那麽翻譯質量将大幅提升。

非營利性機構艾倫人工智能研究所的人工智能研究科學家蒂姆 · 德特默斯（Tim Dettmers）解釋道，Transformer 的工作原理在于探索每條輸入信息與接收信息之間的關聯性。

EvolutionaryScale 設計出了功能類似水母發光蛋白的蛋白質，其序列完全由人工智能創造，自然界中前所未見

憑借這種深度的上下文理解能力，基于 Transformer 的人工智能系統不僅能識别模式，還能預測未來，甚至創造新的信息。這種能力不僅限于文字，同樣适用于其他數據。

EvolutionaryScale 首席科學家亞曆山大 · 裏夫斯（Alexander Rives）表示：" 這些模型在某種程度上正在揭示數據的潛在結構。"

EvolutionaryScale 正在利用公開的蛋白質序列數據及相關知識訓練其人工智能。無需人類工程師介入，其人工智能就能發現分子構建塊之間的關系，來創造全新的蛋白質。

EvolutionaryScale 已設計出一種概念驗證分子——一種功能與水母發光蛋白相似的蛋白質，但其序列完全由人工智能創造，自然界尚未發現。

該公司的終極目标是幫助各類企業——從制藥商到合成化學公司——生産出前所未見的物質，如攜帶可以消化塑料的新型酶的細菌或針對個人特定癌症的新療法。

02 從聊天機器人到真變形金剛

卡羅爾 · 豪斯曼（Karol Hausman）緻力于打造通用人工智能系統，該系統能夠爲任意機器人提供動力。他表示：" 我們的目标是構建一個模型，這個模型能夠控制任何機器人執行各類任務。"

豪斯曼創立的 Physical Intelligence 公司雖然成立不足一年，但他們從研究與 ChatGPT 同源的大型語言模型變體出發，這些模型如今已進化到能夠處理圖像，而這正是豪斯曼機器人技術的核心所在。

在最近的演示中，Physical Intelligence 的一對機器人手臂成功完成了機器人領域最具挑戰性的任務之一——疊衣服。由于衣物形态多變，需要極高的靈活性和精确度來處理，機器人專家難以預先編寫動作序列，來指導機器人如何移動肢體以抓取和折疊衣物。

Physical Intelligence 的系統卻能輕松應對這一挑戰，它能夠從烘幹機中取出衣物并整齊地折疊好，這一切都得益于一個無需人類幹預便能自我學習的系統。該系統僅需大量數據作爲輸入，便能完成任務。這次演示以及其他類似演示的出色表現，使得該公司在本月早些時候成功從包括傑夫 · 貝索斯（Jeff Bezos）和 OpenAI 在内的投資者那裏籌集到了 4 億美元的資金。

麻省理工學院的研究人員拍攝了一段機械手臂給名叫 Momo 的狗喂食的視頻，并用這些視頻訓練了另一個人工智能機器人來執行相同的任務

今年 10 月，麻省理工學院的研究人員宣布，他們正在探索一種基于 Transformer 的類似技術，旨在創造出一個能夠從多種來源獲取海量數據、并在各種環境中靈活運作的機器人大腦。例如，他們拍攝了多部普通機械臂将狗糧倒入碗中喂食的視頻，并用這些視頻來訓練另一個人工智能機器人執行相同的任務。

03 機器人，你可以開我的車

與機器人技術領域類似，研究自動駕駛汽車的研究人員和公司也在探索基于 Transformer 的 " 視覺語言模型 " 的應用。這種模型不僅能夠處理和關聯語言信息，還能處理和關聯圖像信息。總部位于加州的 Nuro、倫敦的 Wayve，以及谷歌母公司旗下的 Waymo，都在積極采用這類模型。

這與自動駕駛領域之前采用的方法截然不同。以往的方法往往是結合人類編寫的指令和老式的人工智能技術來處理傳感器數據，從而識别道路上的物體。而新的基于 Transformer 的模型則提供了一條捷徑，使自動駕駛系統能夠輕松獲取以往難以獲得的世界通用知識。

例如，Waymo 的研究人員在最新的一篇論文中，展示了如何利用谷歌自家的商業人工智能系統 Gemini，使他們的自動駕駛系統能夠識别并應對那些它未曾接受訓練的物體，比如過馬路的狗。

Wayve 是衆多利用新人工智能技術幫助自動駕駛汽車應對意外情況的公司之一

04 一個真正的幫手，并非完全取代人類

艾倫人工智能研究所的科學家蒂姆 · 德特默斯指出，盡管這些系統功能強大，但仍存在局限性和不可預測性，因此無法完全取代人類。

以 EvolutionaryScale 的人工智能爲例，它雖然能爲人類在實驗室中提供新的分子合成建議，但實際的合成與測試工作仍需人類來完成。同樣，基于 Transformer 的駕駛模型，也還遠未達到可以完全自動駕駛的可靠程度。

此外，它們的智能水平受限于所接受的訓練數據。像 OpenAI 這樣的大語言模型已經開始受到互聯網上可用有用數據枯竭的限制。對于機器人或自動駕駛汽車來說，要通過這種方式學習，就需要大量關于它們在現實世界中運行時會遇到什麽情況的數據，這也是目前各家公司競相獲取此類數據的原因之一。

這些限制在 Physical Intelligence 的機器人身上體現得尤爲明顯。它們的系統已經學會了疊衣服，但要在不同家庭中應用，還需要針對每個家庭的具體情況重新學習這個過程。這将耗費工程師大量時間，同時訓練模型也要充足的資金支持。

對此，該公司首席執行官豪斯曼表示：" 我想明确一點，雖然我們對自己的成就感到自豪，但我們仍處于起步階段。"