
本期内容的作者是一位特殊的朋友。莊明浩,互聯網行業從業者,早期在經緯中國做投資,現任趣丸科技副總裁兼首席戰略官,去年他開了一檔播客欄目《屠龍之術》,産出了衆多高質量行業報告(PPT)。
本期内容就基于其對 Manus 掀起的 AI Agent 熱潮的觀察。
值得注意的是,繼國内熱議之後,本周 Manus 在海外也再次掀起讨論,推特聯合創始人 Jack Dorsey 用 " 傑出(excellent)" 來評價 Manus。AI 資訊平台 The RundownAI 的創始人 Rowan Cheung 在 X 平台上轉發了 Manus 的介紹視頻并寫道:" 我認爲中國的第二個 DeepSeek 時刻已經到來。"
以下是莊明浩的播客内容,播客首發于小宇宙 App《屠龍之術》,文章經鳳凰網科技節選編輯發布。
作者 tips:距離我上一次講述關于 DeepSeek 内容的 PPT 其實才過去半個多月,回頭看之前的内容,我自己覺得關于 AI Agent 的部分其實有些假大空。因此當我看到 Manus,并且深度體驗了之後,我知道那個之前一直飄在空中的 Agent 概念終于有了一個實打實的可以看到的東西,這或許也是 Manus 的意義所在。
接下來我們就來看看,Manus 究竟撥開了哪些迷霧。
一、OpenAI 定義的 AGI L1-L5
L1(chatbot):以 ChatGPT 爲代表,核心能力是 " 對話 ",用戶感知到機器能流暢地 " 吐出文字 "。但問題顯著:依賴複雜提示詞工程,輸出結果不穩定,存在幻覺等問題。
L2(推理):OpenAI o1、DeepSeek R1 等,通過強化學習對結果激勵(而非過程幹預),實現邏輯推理能力躍升。典型場景如數學解題、代碼糾錯,用戶感知到 "AI 會思考 "。
L3(Agent):暫時還處于探索期,核心特征是自主規劃、調用工具、交付成果。用戶感知到 "AI 在工作 ",例如自動分析财報、編寫程序、生成調研報告。


二、被泛化的 AI Agent 概念和那些已經問過無數次的問題

AI 搜索是不是就是搜索 Agent?
Perplexity 等産品的本質:高級版 " 搜索引擎 + 摘要生成器 ",依賴大模型重組信息。
垂直化悖論:醫療 / 法律等專業搜索工具面臨數據孤島問題,且無法突破 " 檢索 - 呈現 " 模式,與 Agent 的 " 執行 - 交付 " 有本質差異。
AI 編程是不是 coding Agent?
搜索與編程的啓示:當前很多 AI 應用其實都面臨套殼質疑:依賴大模型能力,難以建立垂直壁壘。但 Agent 需突破 " 工具組合 " 思維,轉向自主決策的通用性。

三、Manus 的核心邏輯與實現
給 AI 一個虛拟機:爲 AI 配備完整數字環境(浏覽器、數據庫、編程接口),使其像人類員工一樣操作設備。例如 Manus 執行 " 分析 YouTube 視頻中企鵝種類 " 任務時,會暫停視頻、截圖識别、統計幀數,全程無需人類幹預。

任務規劃 - 執行 - 歸納能力:面對複雜任務(如 " 整理 AI 公司出海榜單 "),能自動拆解子任務、分配優先級、糾錯叠代。例如首次結果遺漏中國公司時,Manus 會重新掃描官網、核對媒體報道,最終輸出準确率超 80% 的清單。
零預設工作流:與 AutoGPT 等早期 Agent 工具不同,Manus 不内置任何任務模闆(如 " 寫郵件 " 流程)。其核心是通過強化學習,讓模型自主探索工具組合方式。例如在 " 小米 su7" 任務中,模型自主決定先搜索維基百科、再調用設計模闆、最後生成 PDF。
成本與商業化挑戰
算力消耗暴增:單個複雜任務(如分析 100 家公司财報)成本達 2-20 美元,相較于傳統對話可能增加 100 甚至 1000 倍。若用戶日均使用 Agent 2 小時,年算力成本可能會超過當前 C 端付費意願。
新指标 AHPU(Agentic Hours Per User):替代傳統 DAU/ 留存率,直接衡量用戶依賴度,但如何将使用時長轉化爲收入(訂閱制 / 任務計費)仍是難題。
四、Manus 的具體體驗效果到底如何?

給 Manus、元寶、豆包一起發了個任務:分析風投機構 Andreessen Horowitz(a16z)發布的 2025 年全球 Top100 生成式 AI 應用榜單,核心目标是統計其中由中國公司或團隊開發的應用數量。


總體來說,傳統的産品錯誤更多,而 Manus 可以反複的排查,直到收到一個最接近真實的結果。
當然,也會有一些不好的地方,比如讓它做一個帶截圖的 PPT,Manus 會特别簡單粗暴地直接截一個網頁的圖,讓它做示意圖,畫了一個非常難看的簡筆畫等等,但無論如何,看上去 Manus 似乎都在很認真地幹活,隻是幹得不好。



綜上所述,Manus 現階段的确是一個實習生級别的能力水平。
五、行業暴論:創新還是泡沫?
" 套殼 " 争議的本質:首先,"Manus 隻是套殼 " 的觀點是傲慢的:工程化能力(如浏覽器控制、多任務調度)和産品設計(用戶感知工作流) 構成壁壘。類比 Perplexity 早期被質疑,最終以體驗和場景定義階段性也獲得了不錯的用戶量和收入。
大廠與創業者的博弈:頭部公司必将跟進 Agent(如最近剛剛發布新更新的阿裏 - 誇克),但創業者窗口期仍在。技術 + 産品的雙叙事 是關鍵:Manus 通過 " 組合式創新 "(搜索 / 浏覽器 / 編程經驗積累)實現爆發,驗證了黑暗森林法則——敢爲者先得紅利。
給普通人的啓示:AI 時代的生存法則
用戶需要成爲 " 好老闆 ":普通用戶需學會精準提需求、分配任務、過程幹預,與 AI 形成協作閉環。Agent 的價值不在于完美執行,而在于降低複雜任務門檻。

行業的樸素真理:大廠恐懼錯失風口,投資人糾結壁壘,創業者渴望複制成功,而用戶隻關心 " 這玩意兒到底能幹啥 "。Agent 的終極考驗是能否讓非技術群體(如财務、教師)真正用起來,而非困在極客圈的自嗨。