
今天淩晨剛剛發布的 Manus 有多震撼人心,已不需要贅述了:較高程度的獨立思考能力,強大的複雜任務解決能力,以及可靠的交付效果。
和純粹的對話式 AI 産品相比,Manus 話少,不止于思考,還能幹活;和傳統虛拟助手相比,Manus 的分解、規劃和解決問題能力(通過 computer use 和編程能力體現)更高。
目前具體細節還很有限,但我們通過公開資料了解和猜測,Manus 的背後有不同 agent 各自處理單項任務,agent 的任務進度同步和轉移通過 API 執行。作爲産品的 Manus,是一個多模型、多獨立 Agent 的縫合體——而團隊也通過 " 套殼 " 的自黑表述承認了這一點。但這并不能消解 Manus 作爲一個成型的,遠高于最小可行水平的産品的意義。
Manus 讓人機交互的範式,升級爲人機協作,比其它同類選手更接近真正意義上的通用 AI Agent。

Manus 目前一「碼」難求,在閑魚的開價一度達到 5 萬元。
APPSO 也用 Manus 進行了實測,但由于任務用時較長,後面又遭遇網站登陸困難的情況,所以隻完成了幾個簡單的任務,其它任務恰逢 Manus 系統超負載,沒能進行下去。
與此同時,Manus 項目方也發出了一份官方回應,表示準備服務器資源不足,導緻用戶體驗較差。

APPSO 無疾而終的測試
先來看我們在有限的時間内做的兩個測試。
和很多人一樣,我們經常會對日新月異的 AI 技術和五花八門的 AI 工具感到困惑。于是我向 Manus 提出了這個請求:

從 Manus 返回的初步結果看,它先搜索了一些 AI 資訊門戶式的網站,意思應該是先掌握大概的分類方式,确認表格的分類維度,然後再分門别類地去找對應的 AI 工具,查詢資料。
它找到了 17 個類别——正在看文章的讀者,如果你也不知道這些 AI 工具該怎麽分類,可以參考 Manus 的思考結果了:

在聯網搜索過程中,Manus 偶爾會遇到浏覽器故障的情況。不過沒關系,它會自行處理這些錯誤,重試或繼續下一項任務。
但是沒過多久,它還是崩潰了。這一天當中,我們從 APPSO 讀者搜集了十幾個任務請求,喂給 Manus,結果也是一樣的:高系統負載導緻了内部服務器錯誤,請稍後重試或創建一個新的對話。

一氣之下,我讓 Manus 直接生成 10 個邀請碼,它倒是挺幹脆。

當然,沒一個能用的。别忘了今天是星期四……
我們找到了一些已經玩上了的朋友,看看他們都是怎麽用 Manus 的。
使用 Manus 的過程,也是直接近距離觀察它的思考路徑、工作流程的,一次難得的機會。
先來一個腦洞大開的:
《文明》(Google CEO 版)
想象一個遊戲,你能在裏面扮演一個科技創業者,曆經艱難險阻,克服重重危機,将公司打造爲全球科技龍頭,改寫人類曆史?
有人就做了這麽一個 谷歌 CEO 模拟器,帶你體驗谷歌曆史上的重要決策,重走從車庫出發,直到成爲科技巨頭的傳奇之路。
遊戲将谷歌的公司曆史分爲了 5 個關鍵發展階段:創業、成長(pre-IPO)、擴張、多元化、重組更名 ( Alphabet 階段 ) 。在每一個階段,遊戲都給玩家提供了多個關鍵抉擇,每個都将影響公司的發展方向、資源分配,以及最終的成就。
更有意思的是,它還特别加入了一些在經營類遊戲裏常見的「突發随機事件」,來考驗玩家作爲谷歌 CEO 的危機處理能力。
讓我們開始遊戲——居然還可以選難度?我直接 hard mode.

APPSO 的讀者恐怕對現實世界裏的谷歌足夠熟悉了,不妨跟我一起來一場抽象離譜的大冒險?
困難模式,初始資金 $80,000,我通過聯合創始人的女朋友,租用了她姐姐的車庫,創辦了 Google。初期我們的技術實力一般,其它各方面要素都十分匮乏——但好在,我們在大學期間研究搜索引擎項目「搓背」 ( BackRub ) 已經初具雛形,特别是裏面的 PageRank 算法,很有潛力。
我們拿到了第一筆天使投資,但這筆錢究竟應該怎麽用?是繼續優化 PageRank,還是換個寬敞點、有空調的辦公室,抑或幹脆去美國在線 ( AOL ) 上買點廣告來做推廣?
搜索引擎靠什麽活着,不就是廣告嘛?舍不得兒子套不着狼,想賣廣告當然要先買點廣告。我直接把錢全扔在廣告上了。

獲得了一些用戶,然而剛剛略微提升的品牌聲譽,就因爲突然發生的重大安全漏洞而掉下去了。着急忙慌地修完了 bug,我又面臨了選擇商業模式、引入外部投資者、如何拓展分支業務等一連串難題。

當我在這邊焦頭爛額,我的員工卻在上班時間裏搗鼓自己的項目,說要做什麽「Gmail」。
這怎麽行?郵件裏怎麽賣廣告?不是跟我的核心模式背道而馳了嗎?直接解雇他,必須 all in 搜索。

到了 2005 年,谷歌收購了 Android。
這妨礙了我專心賣網站廣告,但移動互聯網的浪潮确實不可抵擋。我們可以繼續在新操作系統裏尋找機會植入廣告,聽說有一家中國的手機公司很擅長做這個——我們不跟它合作,也不跟任何公司合作,而是直接自己做自己的手機。
并且要封閉,要垂直整合,要多放廣告。隻有圍牆裏的花園才是最美麗的花園。我叫它 Nexus。

2006 年,中國互聯網市場也快速增長。
雖然經過一番操作,公司賬上隻有 9 萬美元,但我還是決定全面進軍中國市場,擁抱人口紅利。

2011 年,谷歌仍然沒有上市。
看到 Facebook 上市,我沒有心動,而是從微軟招來了一名愛将 Vic Gundotra,授權他全力研發 Google+。我們将 all in 社交媒體!
時間過得飛快,到了 2016 年。谷歌仍然沒有上市。
目前賬上有 8 萬美元——沒虧就是賺。我們做了大量的收并購,特别是一家名叫 DeepMind 的公司,非常火。我決定這次 all in AI。當然,廣告仍然是核心,隻是我們不說。

最終,我的 Google CEO 之旅還是結束了。也許我的一系列的操作,導緻董事會終于失去了信任。我離開了這家奉獻了 20 多年青春的公司,留下了還不錯的技術實力,少而精的用戶基礎,輕松自由的組織管理文化,以及略高于電詐園區的品牌聲譽。
至少,我們是一家穩健的公司。
剛才的遊戲過程,确實多半是我在故意整活。不過這個模拟器雖然很簡單,還是設計很全面的,有劇情,有選項,有資源表,有大事記。作爲一個小遊戲,一個小品級的産品,它已經很完整了,體現出的想象力很豐富。
然而它隻是用 Manus 用一句提示語生成的。
Google 公司運營模拟器,玩家将扮演谷歌 ceo,體驗谷歌曆史上重要的公司決策,讓用戶過瘾的同時,也能了解谷歌的曆程,啓發用戶思考公司決策,互動式的文字遊戲
我們可以通過重放過程看到它的思考、分解任務、執行子項任務、最終彙總和生成結果的全部過程:
Manus 簡單地回答了用戶自己将要做什麽,緊接着打開了一個 Ubuntu 虛拟機,直接開始分解具體任務,編寫了一個基于 todo.md 文件的任務清單。

任務被分解爲 7 個步驟:
研究谷歌的曆史背景和關鍵公司決策
涉及遊戲架構和互動機制
根據研究學習的結果,生成一些可選的,符合史實的決策場景
構建遊戲邏輯以及 UI
進行遊戲功能和遊戲體驗的測試
創建一個靜态版本的成品,供用戶部署
首先,Manus 先去做了大量的搜索,包括谷歌創始人 /CEO 是誰,曆史上的關鍵産品,重要的收購紀錄以及近年來的商業模式和戰略轉變等大量的資料,并且浏覽了包括谷歌官網、維基百科、中英文新聞網站、知乎等等。
通過這些資料的學習,Manus 對谷歌已經有了一個八九不離十的認識,可能并不深度,并不獨到,倒也沒有太多事實出入。
而如果用戶覺得它自動搜索的資料不夠全面,想加一點獨特的味道,完全可以做到:
在執行過程中,用戶随時點擊這個按鈕,手動增加知識内容。Manus 在生成的過程中,仍然會時不時回來複習一下這些資料。


在執行任務的每一步驟,Manus 也都會用正确的語言(中文完全支持),向用戶解釋自己剛才做了什麽,獲得了哪些收獲,而接下來要做什麽。這應該歸功于它在分解任務時候做的類似于 to-do list 一樣的文件。
它的表述也是結構化,有邏輯的,力求向你完整展示它的思考方式。
這顯示 Manus 很聰明。但值得注意的是,任何一個缺乏專業能力的用戶——特别是 Manus 目前所體現出的數據挖掘、整理,以及編程等能力——也能夠通過觀察 Manus 工作流程來提升自己。
重要的不隻是結果,還有過程。
澤連斯基 - 特朗普吵架模拟器
大家都在吐槽澤連斯基在白宮表現糟糕,但你上你行嗎?不要光說不練,來試試這款 Manus 官方測試的小遊戲:澤連斯基白宮辯論模拟器!

輸入提示是這樣的:
中文:最近,澤連斯基、萬斯和特朗普在白宮的激烈交鋒引起了廣泛關注。你能否開發一個簡單的互動模拟遊戲,讓我在辯論中扮演澤連斯基?我對能再現這一政治場景的互動遊戲很感興趣。
原文:The recent heated exchanges between Zelenskyy, Vance, and Trump at the White House have garnered significant attention. Could you develop a simple interactive simulation that allows me to role-play as President Zelenskyy during those debates? I'm interested in an engaging interactive game that recreates this political scenario.
任務總共分爲 9 步:
研究三人之間的互動
設計文字遊戲的架構以及遊戲機制
創建了一個 Next.js 應用來模拟辯論環節
開發一個對話系統,填充對話腳本
創建用戶界面
進行全面的模拟測試
【用戶接管】将遊戲部署到虛拟機,供用戶測試
制作用戶手冊,交付
将完成品部署到公開 URL 上,供永久使用
直到玩家測試步驟,之前的全部工作都由 Manus 在虛拟機上自動完成,不需要用戶做出任何控制。同樣,在任務的關鍵節點上,Manus 都會特别解釋自己做了什麽。
這種「可解釋性」很關鍵,能夠降低 AI 工具的「黑盒」感。

Manus 介紹,自己設計了三種結局,在遊戲結束後會給玩家提供一份完整記錄。遊戲過程中有強硬 ( assertive ) 、外交 ( diplomatic ) 、安撫 ( conciliatory ) 這三種對話選項供玩家選擇,NPC 會對不同風格的表述産生不同的「情緒」,直接影響結局走向。
而這正是《天國拯救》、《巫師》等遊戲最流行的設計理念:choose your own adventure,選擇你自己的冒險。
在我的試玩中,我嘗試代入了一個身處政治外交和軍事漩渦的政治家,在家國被割據的屈辱,和國際政治談判舞台所期待的外交身段之間,試圖在刀尖上找平衡。
我兩度導緻特朗普失望和遭到萬斯的懷疑,但所幸在特朗普的最後通牒時刻,還是把場面救回來了。雖然我的談判沒有達成直接的實質性的結果,至少我沒被轟出白宮……
如果用官方外交辭令來講,那應該就是「交換了意見,會談是有益的」。

雖然隻有 6 個回合,因爲可選項設計的有意思,劇情多樣,我又玩了幾次。可能因爲性格太懦弱,有一次甚至談成了。
一個純文字遊戲,還真玩出了點 RPG 的代入感。
你可以在 Manus 官網的 Use Cases - WTF 一欄,找到這個模拟遊戲。跑完會話回放之後,在它的最後一條回複裏面找到遊戲的鏈接。或者你也可以直接訪問這個地址:https://dgooezit.manus.space/
體驗總結:拒絕「高潮」,好玩好用就已足夠
從 Manus 發布,爆紅,到現在一碼難求,網站登陸訪問困難,團隊對外道歉,隻用了十幾個小時的時間。
APPSO 在 Manus 發布之初就做了報道,給了一個相對正面的評價。而經過了更加深入的試玩,我們提煉出這個産品的優點:
首先,Manus 的用戶界面,讓用戶可以直接觀察它的思考路徑和工作流程。
無論在使用過程中,還是事後重放,都能夠比較完整地展示模型是如何思考的,任務是怎樣被拆解和指派的,每一個步驟都可以追溯。
這即是一種提高 AI 可解釋性的實踐,同時也給用戶一個通過模仿它來自我提升成長的機會。
其次,它不僅具備處理複雜工作的能力,同時還能保持更高的自動化水平。
最直觀的例子就是 Manus 官方做的人力資源任務——篩選簡曆。
Manus 結合 computer use 能力打開虛拟機,解壓用戶上傳壓縮包,遍曆 25 份簡曆,提取并記憶 25 組複雜信息;再将它們整理到一個 Excel 表格當中,進行打分排名,充分列舉了包括資曆、技能水平、項目經驗、關鍵成就在内的多個指征,卻不單獨依賴特定一項。

在過去,同類的工作在過去可能需要用戶用一個 AI Agent 工具,多次分步輸入指令,或者需要用戶自己用多個工具來分别完成任務再自行組合,無論怎麽做都很麻煩。而 Manus 的自動化程度,超過了包括 Claude 在内的同類方案。就算你堅信 Manus 的能力沒什麽過人之處(畢竟套殼),但不可否認它的體驗是更優秀的。
綜上各點,Manus 确實超過了過去一段時間以來我們對 AI 工具的體驗認知。如果說以前的 Agent 更多隻是沒「腦子」的工具,Manus 已經非常接近一個有「腦子」的 AI 助手,從人機互動升格爲人機協作。
但與此同時,我們今天看到了不少過分吹捧的自媒體報道,跟着 Manus 團隊一起提前「高潮」了,稱其「AGI 的裏程碑」;當然,也不乏有人指出其産品「套殼」,團隊人物存在「黑曆史」,技術棧和實現方式缺乏真正的自主創新。
我們應該批評 Manus 什麽?毫無疑問,它的營銷方式并不「體面」:找了一批自媒體來做内部分享,号稱「隻是發一個 demo」,以沒準備好應對用戶爆炸的服務器資源爲說辭,制造一種營銷的「高潮」,随後又對外界封鎖,使得人們難以探知真相,滿足好奇心。
但我想,無論這個産品以公測還是正式發布的方式,向公衆完全開放之前,一切的維護和貶損都沒有太大意義。
AI 技術突飛猛進,早已離開了學術科研的襁褓,和大公司的封鎖。企業航母 all in AI 難保一帆風順,小公司卻完全可以隻用一周時間起飛。現有的開源、半公開,付費、收費的工具比比皆是,隻要不違反相應的開源許可證規則和商業授權協議,任何人都可以充分且自由地利用它們,無論出于純粹的個人使用,還是做拼裝組合疊加的「套殼」式創新。
更别提這個「創新」的結果還挺好玩(就算拿不到邀請碼,你也可以去網站上感受幾十個現成的 use cases)。
好玩的東西,在這個時代太稀缺了。腦洞誰都能開,填的上才是王道。
我們擁抱創新,關注和欣賞那些好玩有趣的東西。對于可能定義我們未來數字生活的産品,我們的包容并不廉價,但絕對足夠。