就在前天,Manus 在國内媒體間爆火,其号稱 " 全球首個通用 AI 智能體 "。
官方也曬出了幾十個 Demo,供大家玩賞。

網友們驚豔于其效果後當然躍躍欲試,卻發現試用需要邀請碼。我們問了一圈 AI 專家,都說沒用過,也沒聽自己哪個同行用過," 目前都是媒體在用吧?"
到這裏就需要謹慎了,沒有較大規模公開測試、沒有專家實名自發背書過的技術或産品( ChatGPT、NotebookLM、DeepSeek 等都是有的 ),實力終歸是存疑的。
從産品體驗來看,Manus 雖然效果驚豔,但是很多人其實不買賬,因爲寫 PPT、寫 HTML、Python 數據分析、生成 Excel、搜索等功能目前各個通用模型都能做。即便 Manus 說自己比 OpenAI 的 DeepResearch 更厲害,但這和 Cursor 說自己比 Claude 更厲害有什麽區别?兩者的可比性是相對錯位的。
功能上,Manus 是整合了 Computer use、虛拟機、Multi agent 協同的套殼産品。技術實現上是基于 Claude 模型生成能力、開源模型後訓練增強的規劃能力,再結合各種預制的 Agent,按照設定好的工作流構建 todo 清單、新建虛拟機環境、調用工具、結果整合、自我檢查、輸出結果,來解決任務。
所以,Manus 技術上有其複雜性,但沒有太多創新,當然,其功能多樣性導緻工程量極大,業内專家認爲很有可能是基于 MCP 協議的聚合模式。
過去 Agent 更多是在專業領域做深耕,而 Manus 通過工程上極緻整合、酷炫低門檻的 UI 交互套殼産品想讓 Agent 直接出圈了。
總有人說,套殼到極緻就是勝利,就是價值,确實,至少從 Manus 的演示視頻來看,是這樣。
既然有價值,那麽很快就會有人跟上,這不,爲了實現 Manus 的價值,MetaGPT 團隊花費了 3 小時開發了 OpenManus 并開源,無需邀請碼就能使用。

項目地址 https://github.com/mannaandpoem/OpenManus<;/p>
在項目的演示視頻中,輸入提示詞 " 對 Karpathy 的網站( https://karpathy.ai/ )進行全面的 SEO 審核,并提供詳細的優化報告,包括可操作的改進建議。"
接下來,OpenManus 會展開思考,拆分執行步驟
檢查網站,收集基本信息;
分析關鍵 SEO 要素;
檢查 SEO 技術方面的問題;
整理優化建議;
接下來就是一步一步地執行任務了。
可以看到,演示視頻展示的結果遠不如 Manus 那麽細緻和豐富,OpenManus 目前功能還很初級,但團隊還公開了後續的開發路線,照這個路線,基本上全面複刻 Manus 不是問題
更優的規劃系統
實時演示功能
運行回放
強化學習微調模型
全面的性能基準測試
OpenManus 是怎麽來的?
兩個月前的一次邊吃飯邊頭腦風暴的過程中,我們想到,一個極簡的 Agent 框架,應該是可插拔的 Tools 和 System Prompt 的組合,之後我們沿着這個思路,寫了一個完整的 Agent 迷你框架。
前天晚上看到 Manus 時,淩晨就和同事商量,下班後的晚上就可以搞一個,應該 3 小時夠了。
爲什麽要采用可插拔的 Tools 和 System Prompt?
決定一個 ReAct Agent( Reasoning and Action Agent,一種結合了反應和行動規劃能力的智能體 )的效果的關鍵是 Prompt( 提示信息 )和 Action( 行動 ),Prompt 控制了 Agent 整體的行爲邏輯,Tools 給定了 Agent 的行動空間,二者被定義就能完整诠釋一個 ReAct Agent。
可插拔的優點是可組合,我可以把幾個不同場景下的 Tools 組合到一起來創造一個新的 Agent,定義也很方便,不需要單獨寫内部邏輯,隻需要修改動作空間( Tools )。Tools 本身就該是可組合的,我們的工作是把抽象做得更幹淨,目前 HuggingFace 的 Smolagents 也是類似的思路了。
Manus 效果上讓大家覺得很新奇,實際上主要是由于 Browser Use 和 Computer Use 的使用,所以隻要給了 Agent 這兩個工具,那它就都能做到。
OpenManus 在實現中,有哪些關鍵技術挑戰?
在 OpenManus 的實現中,前端界面的實現很關鍵。Manus 很出彩的地方是産品展示很漂亮,我當時打算用 Streamlit 寫前端,方便做類似的展示,但 Streamlit 的底層和 Browser Use 沖突,後來就換了 Gradio,但信息展示有一些問題,當時沒辦法做到實時更新,最後還是改成了 log,直接在命令行裏做展示。
如何有效複現和優化 PlanningTool 的使用也是非常重要的一環,這樣才能充分發揮 Agent 的規劃和工具調用能力,探索其能力上限。
Manus 的用例展示了 Agent 在線性任務規劃中的強大表現,而 OpenManus 需要解決如何設計更複雜的規劃結構( 如使用 DAG 有向無環圖表示任務依賴關系 ),以及如何讓 Agent 動态更新規劃以适應變化的需求,這不僅考驗技術實現,還涉及算法設計和智能體的自适應能力。
目前 OpenManus 的規劃設計與 Manus 保持一緻,都是線性的,而 DAG 規劃對于處理現實世界中更複雜的任務,在一定程度上會更準确,Data Interpreter 就是一個很好的例子。
聽起來 OpenManus 的規劃已經有要超越 Manus 的苗頭了,你們對這個産品有什麽期望嗎?
OpenManus 前期目标打算達到原始 Manus 的相同的效果,後續會不斷優化 Computer Use、Browser Use 和 Planning Use,以及工具調用的能力,從而超越 Manus。
Manus 産品交互做的挺好的,有很多技術也值得學習,比如對後訓練技術的結合,流程設計上比如規劃、Multi Agent 系統也是很優秀的,具體細節我們還在研究。至于 OpenManus 我們沒有單獨調效果,目前達到的效果其實很一般。後續主要靠開源社區小夥伴來貢獻,我們希望開源協作能帶來更高的智能湧現~
好了,到這裏知危編輯部與 MetaGPT 團隊的溝通就到這裏了,我們也可以期待一波 OpenManus 未來的效果。
最後,或許我們可以探讨一下到底什麽應該是好的 Agent ?
Manus 有優點、有亮點,但有誇大之嫌。人們在試用的時候,還是能發現 Manus 有不少毛病,用錯了假數據、來源引用錯誤、表格讀取錯誤等等毛病一個不落,幻覺問題還是不小。
Agent 應用的一大通病是,自動化執行過程越複雜,錯誤發現和查找原因就越困難,而且 Agent 的執行需要經過多個 LLM,每個 LLM 的幻覺一路累積下來的誤差将是巨大的,比如 95% 的準确率,連續經過 10 個 LLM,最後準确率能直接降到約 60% 。
在全面擁抱 Agent 之前,我們首先還是得多關注一下,目前市面上的通用大模型,它們的幻覺率仍然不是一般的高。
所以,想實現真正好用的 Agent,我們仍然要攻克大模型底層能力的提升。裏子不夠好,套太多的殼也沒用。
與此同時,我們還需要強調的一點是,追求 Agent 的過程中,我們一定是要回歸實用主義的不是所有問題都需要用 Agent 來做。
Devin 前不久還被爆出出錯率極高并且出錯方式沒有規律可循,還不如用 Cursor 一步一步來,加上之前的演示造假事件,過于激進的 Agent 産品越來越受到質疑。
與此同時,Agent 的一大通病是,步驟拆解越多,token 消耗量越大,對所有任務一律無腦使用 Agent,對于企業的成本控制而言具有極大的風險。
Agent 的最關鍵的作用就是工作流編排,簡單的任務其實并不需要 Agent 的參與,反而會導緻客戶等待時間過長。
Anthropic 就曾經分享過構建智能體的基本原則,就是 " 簡單爲王,實用至上 ",能用 API 就不要用工作流,能用工作流就不要用智能體。
這些都是手段,哪個不能交付結果呢?
Agent 終究是一個産品概念,不像 LLM 有無法預測的潛在價值( 比如推理能力的發現和增強 )值得冒極大風險押注。
所以回過頭來看,我們應該更多關注開源社區的新技術,比如阿裏在 Manus 發布同一天剛開源的 QWQ-32B 模型,就像前文講的那樣,在追求 Agent 的路上,我們更應該關注模型的突破。
