面壁最早是佛教用語,相傳禅宗祖師達摩曾在中嶽嵩山的石壁前靜坐了整整九年,于石洞中留下了《易筋經》與《洗髓經》。
有關面壁的還有一個引人入勝的聯想是《三體》中所謂 " 面壁計劃 ",面壁者試圖完全依靠自己的思維拯救整個人類。
無論面壁智能的名字是受了上面哪種淵源的啓發(或許兩者都有),它都暗含着同一種意思,在經曆了長久、隐秘又艱苦的蟄伏後,面壁的過程最終将帶來巨大的突破,而以一個這樣頗有玄奧氣質的名詞當做一家研究尖端科技公司的名字,也從側面反應了其背後蘊藏的技術理想主義。
11 月 4 日,面壁智能的多模态大模型應用面壁露卡 Luca 正式面向公衆開放服務,這是一個技術理想主義落地的節點。
面壁的新一站到來了。
面壁露卡 Luca
Luca 其實在今年 5 月就已開放公測,8 月時它更新到了 2.0 版本,這三個月的時間,根據面壁官方的描述,Luca 總共叠代了 85 次,也就是說幾乎平均一天一次。
露卡 Luca 的名字也頗爲有趣,它是 The Last Universal Common Ancestor 的縮寫,意思是地球生命最後的共同祖先。現在地球上所有的生物都是從 Luca 演化而來的,科學家們推測,Luca 的形态或許像是細菌,生活在海底岩漿湧動的溫暖濕潤的水中,這樣方便它獲取各種礦物質和營養元素,從而促進随後幾億年的快速進化。
是的,相比于地球乃至宇宙的漫長,Luca 誕生的時間——科學家推測大概距今 3.8 到 3.5 億年前就顯得非常短暫了,而它身上包含着的生化結構,從 DNA 轉換爲 mRNA 再到蛋白質的轉錄和翻譯機制,已經爲一切生物的進化奠定了技術上的基礎。
這恰好和大模型起到的作用相似。越來越多的人把預訓練大語言模型稱呼爲基座模型,足夠強大的基座模型将會加速人工智能從切實的落地場景和應用從中生長出來,從這個角度上說,Luca 的命名和面壁一樣,都充滿着一種浪漫的技術理想主義。
Luca 背後的基座模型名字 CPM 就異常直白了,它的全稱 Chinese Pretrained Model,也就是中國的預訓練模型。這是面壁完全自研的預訓練大模型,它的第一個版本 CPM-1 在 2020 年 12 月發布。
光是從 CPM 這個略顯草率的名字就能看出來,當時恐怕沒有多少人對大模型之于人工智能的重要性有充分足夠的認識。面壁當時所做的事情與其說是一家人工智能公司有目的性的刻意爲之,倒不如說是一支頂級科研團隊在前沿技術探索的過程中整理出的一個階段性成果。
這支科研團隊,正是清華 NLP,全稱清華大學自然語言處理與社會人文計算實驗室。
雙輪驅動
實際上你根本不能用面壁這家公司成立的時間來反推 CPM 大模型的研發進度,畢竟 Luca 發布的時候面壁這個公司才成立十個月,而 CPM-1 發布的時間更是比面壁成立的時間早整整 20 個月。
CPM 大模型的開發是由清華 NLP 主導的,這個實驗室的學術帶頭人孫茂松擔任清華大學計算機系主任 / 書記長達十年,在人工智能領域有着深厚的影響力,他研究的領域——自然語言理解,恰好是大語言模型的理論基礎。
孫茂松的學生,NLP 實驗室的另一位老師劉知遠副教授即是面壁智能的聯合創始人,而面壁年僅 25 歲的 CTO 曾國洋則是劉知遠的學生。在 NLP 實驗室官網的新聞列表裏直接将面壁智能稱呼爲 " 我組孵化公司 ",他們彼此之間聯系的緊密程度可想而知。
另一個值得一提的事情是,劉知遠副教授同時還是清華基礎模型研究中心的副主任,這個中心在今年 6 月剛剛成立,目的正是爲了集中清華的各種資源以推動基礎模型的突破。
因此,CPM 的開發,包括面壁智能的成立,從一開始就得益于清華的力量,你可以把面壁的成立理解成清華産學研結合能力導緻的一種自然轉化。
例子之一是面壁官網上 CPM-2 的發布被歸屬于 " 悟道 " 系列大模型——劉知遠當時帶領的悟道 · 文源團隊是整個悟道項目的一部分,它的成果就是 CPM-2。
另一個例子則是面壁的種子輪融資規模達近千萬之多,衆所周知,清華系背景幾乎是科技領域創業中一個金字招牌,這一點在大模型領域尤甚,而面壁的種子輪股東裏就包括了智譜 AI ——另一家清華系背景大模型公司。
這種彼此關聯、互相瓜葛的關系反應了清華在我國理工院校中十分獨特而超然的地位,特别是人工智能領域,你甚至很難找到另外一家在技術、規模和資源上能夠與之匹敵的大學。
根據我們了解到的情況,目前面壁智能的技術開發,尤其是面向大模型的最前沿領域,始終和清華 NLP 實驗室保持着密切的合作關系,換而言之,同時有兩架馬車在面壁的内部狂奔,而某種程度上,面壁作爲公司的形态可以更好地将 NLP 實驗室的研究成果工程化、商業化,這是一種技術成果轉化和組織形态融合上的飛輪效應。
Agent 賽馬
當然了,如果你認爲面壁隻有 Luca 和 CPM 大模型這樣的服務那就錯了。市面上有不少清華系背景的大模型公司,它們的區别不僅體現在技術實力,還有技術路徑的選擇上。同樣是大模型,每一家都有自己獨有的 " 絕活 "。
面壁的絕活名叫 AI Agent。從年中開始,AI Agent 這個概念變得異常火熱,但實際上目前爲止關于究竟什麽是 AI Agent,業界還沒有形成統一的共識。簡單的解釋是,你可以把 AI Agent 理解成一種智能體,它能夠把複雜的問題邏輯拆解并執行,不再需要用戶同大模型用 prompt 進行連續不斷地多輪交互,它是沒有實體化的個人助理,類似《鋼鐵俠》裏的賈維斯,能夠比所謂人工智能助理 copilot 做的更好、更全面。
OpenAI 對 AI Agent 同樣關心,首席科學家 Ilya Sutskever 不止一次表達了對這個概念的興趣,顯然 OpenAI 内部也在攻關相關的問題。有人認爲,現在的 ChatGPT 之所以把所有的調用工具都集中在頁面上,其實就是針對 AI Agent 方向的嘗試,用戶用自然語言來完成包括代碼、表格和數據在内的抽象處理以及多模态内容的生成,這種變化不能用簡單的 UI 改變或工具集成來理解。
面壁在 AI Agent 領域則是推出了不同的三款産品。根據我們了解到的情況,AgentVerse、XAgent 和 ChatDev 這三款 AI Agent 實際上是面壁和 NLP 實驗室内不同科研小組賽馬的産物。
最新推出的 XAgent,按照面壁智能聯合創始人、CEO 李大海的說法,它被定義爲超強 AI 智能體應用框架,也就說說它能自行拆解複雜任務。面壁宣稱 XAgent 的能力已經全面超越 AutoGPT。
AgentVerse 則顧名思義,類似一個大模型宇宙,李大海則稱之爲智能體通用平台,讓每個 Agent 如同角色扮演一般加入其中并彼此互動。最早斯坦福大學和谷歌進行了這方面的探索,讓一個虛拟小鎮迎來了 25 個智能角色,AgentVerse 是面壁針對這種思路延伸出來的産品,現在已經叠代了多個版本,最新的更新是研究人員試圖讓 Agent 的行爲不再 sequential ,即不再順序執行,而是可以并行執行——這樣一來 Agent 的行爲就會更接近人類。
可以想見,這種平台能爲心理學、社會學的研究帶來極大颠覆,而它目前最切實的應用則還是在遊戲領域,據說已經有國内頭部的遊戲團隊同面壁進行過接觸,試圖把 AgentVerse 應用到相關遊戲産品中。
ChatDev 則可以看作是一個用 Agent 技術自動化開發軟件應用。面壁的這幾個 Agent 産品在 GitHub 上總共收到了超過兩萬三千顆星,足以見得全球開發者對面壁在 Agent 技術上領先程度的認同。
浪漫與現實
三款 AI Agent 産品被面壁概括成三駕馬車,也就是說面壁想要通過在 Agent 這種先進技術上的密集開發來引領整個人工智能技術路線,它的遠景被李大海概括爲 IoA,即 Internet of Agents。據悉這個概念是由劉知遠設想出來的,它采用了類似物聯網 IoT 的構詞法,反應出了面壁對 Agent 的長遠想象:在未來,萬物都是 Agent,每個物品都通過 Agent 技術内置了對自己功能的智能化理解,這些理解通過互聯網聯系起來,最終引發人類生活方式的全面變革。
舉例來說,一個冰箱将會知道自己儲存了什麽東西,多久過期,該如何根據不同的存儲物品設置不一樣的溫度,在許多時候這些工作将會由冰箱自己完成(Agent 自己完成),人類不需要進行幹預(類比到大模型的交互,就是用戶不需要不停發出 prompt 指令)。
這種設想就和面壁的名字一樣,帶有一種濃郁的浪漫的技術理想主義氣質,這種氣質,在清華系大模型公司中格外少見。
比如 Agent 能力究竟能發揮多少,十分有賴于基礎模型的能力。像上面提到的 Agent 不再順序執行的問題,這對 Agent 邏輯拆分、歸納總結和執行能力提出了非常高的要求,這種要求的實現沒有基礎模型的強大能力的支持是不可想象的。再比如,對面壁這樣的成長期創業公司來說,該如何在模型叠代、Agent 研發和應用落地取得精準的平衡,恐怕也是一個需要精準拿捏的問題。
" 如果将 AI 智能時代類比移動互聯網時代,大模型就相當于安卓系統,…… (Agent 技術)處于安卓系統更上層一個比較體系化的技術突破狀态。" 李大海在《中國企業家》雜志的采訪中如此形容 IoA,這背後當然代表着面壁對于 Agent 技術的樂觀判斷。
市場也一定程度上認可這種樂觀。4 月,面壁完成了數千萬天使輪融資,那時它甚至還沒有發布 Luca 的第一代版本。這種樂觀,助推了面壁團隊的擴張步伐。不算 NLP 實驗室的相關人員,目前面壁有着百人的規模,占據了清華科技園大廈中整整一層樓,而在年初,面壁的規模還僅僅隻有十數人,很快,有關 CPM 新版本的叠代更新也會推出,從而進一步完善面壁大模型 -AI Agent 的雙重布局。
看上去,面壁由技術理想主義支撐的人工智能版圖正在逐漸清晰。
據說達摩祖師決定北上弘法時不見舟船,被大江攔住了去路,最後靠着一根蘆葦翩然過江,入嵩山少林寺開始了長達九年的面壁,結束靜修後,達摩寫下了一系列著作,其中《二入四行論》中有一句偈語,诠釋了他面壁的心得。
心如牆壁,可以入道。