
幾乎在昨晚蘋果發布新品的同時,整個科技圈卻被一個名爲 Manus 的産品刷屏了。
這是全球首款真正意義上的通用 AI Agent,從官網展示的案例可以看到,它能夠獨立思考、規劃并執行複雜任務,直接交付完整成果。
比起 Claude 的 Computer use 等同樣能操作多任務,或者能幫你點外賣訂酒店的 Agent, Manus 可以覆蓋更多領域和達成更高的執行質量。
Manus 在權威的 GAIA 基準測試中創下新紀錄, 性能遠超 OpenAI 的同類産品。
而 Manus 這個名字來自拉丁語,Mens et Manus,就是 mind and hand,即手腦并用。這也是麻省理工學院的校訓,以此鼓勵學生将創意落地爲實際成果。
創始人肖弘在 Manus 發布的前幾個小時,在即刻平台上發文「高潮來臨」,并分享了莎士比亞的一段書摘:

很難現在就判定 Manus 的誕生就是 AGI 的裏程碑,但它很有可能将讓 Agent (智能體)時代真的進入「高潮時刻」。
Manus 體驗申請鏈接 :
https://manus.im/invitation
篩簡曆、選房炒股,Manus 真會「幹活」?
官方宣稱,Manus 不僅僅是一個隻會聊天的對話式 AI 工具,而是一個真正的自主智能體(Agent)。
當其他 AI 可能隻停留在生成想法的階段,而 Manus 能夠獨立思考并采取行動。官方将其視爲人機協作的新範式,甚至可能是通向 AGI 的一個窗口。
與 Manus 同步出圈的還有一段長達四分鍾的演示 demo。在這些案例中,Manus 完全自主地完成從規劃到執行的全流程,展示了真正的 Agent 能力,而非簡單的助手功能。
比方說,首先從一個常見的人力資源任務——篩選簡曆開始。
演示一開始就放了個大招,官方向 Manus 發送了一個包含 10 份簡曆的壓縮文件,Manus 能像專業招聘人員一樣高效工作。

它會先解壓文件,然後逐頁浏覽每份簡曆,并記錄重要信息。Manus 還能異步處理文件,這意味着你可以随時關閉電腦,等任務完成後,它會通知你。
當然,在這個過程中,你也可以随時給它新的指令。
接着,繼續向 Manus 上傳 5 份簡曆。在認真閱讀了所有 15 份簡曆後,Manus 給出了排名建議,并提供了候選人資料和評估标準作爲參考。

這還沒完,我們還可以讓 Manus 生成電子表格。
由于 Manus 具有知識和記憶能力,所以下次執行類似任務時,它會直接以電子表格的形式交付結果。

另一個演示案例中,結合家庭收入情況和孩子的上學要求,讓 Manus 在紐約篩選一個安全、犯罪率低的社區,并購買符合标準的房産。

面對這類複雜任務,Manus 同樣是有條不紊地将其拆解爲多個步驟,并創建詳細的待辦清單。
搜索并閱讀關于紐約最安全社區的文章。
研究紐約的中學情況。
編寫 Python 程序來計算預算。
基于預算,在房地産網站上篩選合适的房源。
整合所有信息,撰寫詳細報告并整理相關資料

轉場到第三個案例,Manus 搖身一變成了專業的股票分析師。
讓其分析英偉達、邁威爾科技,以及台積電在過去 3 年的股票價格之間的相關性,Manus 可以通過 API 訪問權威數據源。在驗證數據後,它開始編寫用于數據分析和可視化的代碼。

在完成數據分析和可視化後,Manus 也能基于這些數據創建一個網站。經用戶的授權後,還能将網站部署至線上,并提供了一個可供分享的鏈接。

X 網友 @DavidAIinchina 也體驗到了 Manus,并給出了極高的評價——「令人難以置信的用例」。
官方表示,以上展示的内容僅僅是 Manus 能力的冰山一角。
在用于評估通用 AI 助手在解決現實世界問題方面的能力的 GAIA 基準測試中,Manus 在所有三個難度級别上都達到了 SOTA 水平。
爲了确保結果的可重複性,Manus 使用與其正式版本完全一緻的配置進行評測。

除了基準測試,Manus 還在 Upwork 和 Fiverr 等平台上解決真實世界的問題,并在 Kaggle 競賽中證明了自己的實力。
而這一切都離不開優秀的開源社區,因此官方也希望能回饋社區。
Manus 采用多重簽名(multisig)系統,由多個獨立模型驅動。今年晚些時候,官方将計劃開源其中的一些模型,特别是 Manus 的推理(postering)部分。

中國團隊、兩款爆品、百萬用戶
那麽這款震撼業界的産品背後是誰?
據悉,Manus AI 背後的創始人肖弘是是華中科技大學軟件工程專業 2015 屆校友。
畢業後,他連續創業,2015 年創立夜莺科技,推出「壹伴助手」和「微伴助手」,服務超 200 萬 B 端用戶,獲騰訊、真格基金等投資。
萦繞在肖弘身上的還有一個更鮮明的 AI 産品—— Monica。
這是一款号稱 All-in-One 的 AI 助手,最初以浏覽器插件的形式推出。

通過集成主流大模型(如 Claude 3.5、DeepSeek 等),Monica 提供聊天、翻譯、文案處理等功能,用戶可通過自然語言創建定制化工具,并共享至工具廣場。
Monica 同樣是早期以海外市場爲主,用戶規模破百萬,成爲 AI 插件領域頭部産品。
今年 2 月份,Monica 的中文版(monica.cn)已開啓内測,目前免費向國内用戶開放。該版本基于 DeepSeek R1 和 V3 模型打造,具備深度推理思考能力,并支持記憶功能和實時聯網搜索。

Manus 的技術哲學:less structure more intelligence
Manus 奉行的技術理念與主流也有些不同,是 「less structure more intelligence.」(更少的結構,更多的智能)
他們認爲,當數據足夠優質、模型足夠強大、架構足夠靈活、工程足夠紮實時,computer use、deep research、coding agent 等能力會自然湧現,無需被設計爲特定的産品功能。
作爲大力出奇迹的代表之一,GPT-4-Turbo 在 GAIA 公開排行榜上的平均成績不到 7%,即使是使用複雜多智能體系統的解決方案也僅達到 40%。Manus 的表現可以說是「遙遙領先」。

創始人肖弘在最近在和張小珺的訪談中,他也提前談到了當時還未發布的 Agent 産品 Manus 。
「看上去它确實應該就是一個 chatbot,這是很符合大家想象的,同時在應用側卻很複雜,和 Monica 不一樣,光用好不同模型就挺複雜。」
肖弘還将目前 AI 應用分爲兩類:一是填補主要應用産品的空檔的不足,二是爲特定場景提供獨特解決方案的應用,比如 Perplexity ( 提供聯網搜索功能 ) 和 Monica ( 浏覽器插件形态 ) 都屬于此類,它們填補了現有産品留下的空白。
而模型驅動的新場景這類應用,主要出現在圖片和視頻領域,直接由模型技術的進步驅動。像 Pika 和 Runway 等産品利用模型能力創造了新的應用場景。
有用戶調侃 Manus 是「極緻的套殼就是牛逼」,實際上肖弘并不忌諱讓用戶知道自己的産品用的是别人的模型。早在去年,他就把 Monica 比作消費電子産品,并把 ChatGPT 的 Logo 打在官網。
人機交互新時代已來,但别急着把 Manus 捧上 AGI 神壇
APPSO 在 2024 年年初曾作出一個預測:大模型将成爲智能手機新的操作系統,自然用戶界面(Natural user interface, NUI )将逐步替代現有的圖形用戶界面(GUI)。
而實現這種新交互的重要入口,就是 Agent 。
去年我們在很多手機的發布會上都看到類似的案例。 vivo 發布會展示可以 AI 訂餐的 「Phone GPT」,華爲鴻蒙的小藝和意圖框架,還是榮耀的 YOYO 智能體,以及智譜的 AutoGLM,核心都是一樣的:
讓 AI 模仿人類的 Plan-Do-Check-Act(計劃 - 執行 - 檢查 - 行動)循環 ,從而像人類那樣去操作設備。
智譜 AI CEO 張鵬之前提到,目前的 Agent 能力更像是在用戶和應用之間,增加一個智能的調度層,鏈接所有應用甚至是所有設備。
這可以看做是大模型通用操作系統 LLM-OS 的一種雛形,将對人機交互形式産生極大的影響。OpenAI 創始成員、AI 技術大牛 Andrej Karpathy 也曾多次談到大語言模型操作系統(LLM OS)。
他認爲大模型某種程度來說就是一種新的計算機和操作系統,它可以連接各種軟件和硬件,以及所有模态信息組成的外設,并通過函數調用執行各種任務。

傳統操作系統中,你需要圍繞 CPU 構建一堆外設,比如鼠标和鍵盤、磁盤存儲、以及緩存空間等。
而在 LLM OS 中,大模型本身就是中央處理器。I/O 外設也不再是鼠标和鍵盤,因爲 LLM 可以兼容更多模态的數據輸入和輸出。同時大模型調用的外部工具也将從傳統軟件升級爲智能體工具。
其中跨應用的操作是非常關鍵的一環,這意味着 Agent 能實現更加複雜的自主連貫操作,也可能走向真正的商業化落地。至于各家互聯網公司提供的服務能否打通,可能是未來實現這種交互最大的障礙。
不過現在很多 AI 助手實現代操作的方式,實際上是調用手機的無障礙功能 ( accessibility features ) 的權限,來控制屏幕點擊。
Manus 的出現,意味着 Agent 模式下的 AI 能夠理解需求後獨立工作,直到任務完成。這無疑是人機交互領域的一大步,它讓我們看到了 AI 從工具向夥伴轉變的潛力。
但要說我們已經一隻腳邁入了 AGI 大門,也還爲時尚早。肖弘自己也提到,早期的 Agent 更像是「功能機」,需要不斷叠代和完善。目前的 Agent 仍需依賴于模型能力的提升,以及更完善的虛拟環境支持,才能真正勝任各種長尾任務。
如果類比智能駕駛,大概也相當于從 L2 級升級到 L3 級的輔助駕駛。雖然 Manus 在 GAIA 基準測試中表現出色,但這并不意味着它已具備通用人工智能的全部特征。通往 AGI 的道路依然漫長,需要解決模型能力、自主學習、任務泛化等多重挑戰。
但因爲有了 Manus 在自主性與通用性上的突破,通往 AGI 的大航海中,又多了一顆照亮我們的星。