圖片來源 @視覺中國
有着餘杭 " 曼哈頓 " 之稱的杭州歐美金融城,聚集了一衆從阿裏辭職的創業者。吳翰清的新公司就位于這裏,他最近正在頻繁約見投資人。
2023 年 5 月,網傳阿裏 P10 級人物吳翰清,宣布創業。直到近段時間,他的 AI 項目才浮出水面。
簡單點來說,這位 15 歲進入西安交大少年班的天才,有了一個天才想法:在阿裏浸潤了 15 年,他宣布用 " 魔法打敗魔法 ",用一個 " 新世界 " 打敗 " 數據壟斷的舊世界 "。
數據壟斷與數據剝削
自人類進入數字時代以來,數據以中心化的形式存儲于特定的數字平台中,人類從中獲得便利、甚至在其中構建新的業态和生活方式。于是,平台上的數據越來越多,被人們選中的數字平台成爲了數據壟斷方,而當這種默認契約達成後,數據剝削便産生了——
用戶自願生成的數據以及用戶在數字平台上的 " 存在 " 被平台售賣給廣告主和項目投資公司,平台在這一過程中賺得盆滿缽滿,而作爲數據生産者的用戶和作爲流量的用戶卻并沒有獲得任何實質收益。這是對用戶數字勞動的絕對剩餘價值和相對剩餘價值的雙重剝削。
數字平台與數據剝削
這種數據壟斷和數據剝削也成爲當下一些社會問題的幫兇。比如,近來一組數據受到關注,根據北師大中國收入分配研究院 2021 年發表的調查數據,我國超過一半的人口月收入不到 2000 塊。一個社會的财富總量在一定時期内總是有限的,有人靠壟斷資源攫取了暴利,那麽普通人得到的财富自然就少了。" 互聯網巨頭和背後的資本攫取了過多的暴利,這些暴利已經遠遠高于社會人均收入值,超出了合理範圍。千萬富翁越多,老百姓就越窮。" 吳翰清在個人公衆号中發文表示。
他的觀點是,當今互聯網最深層次的主要矛盾在于:" 信息聚集導緻的數據壟斷 " 和 " 人們對自由、開放、共享、平等的網絡環境的向往 " 之間的矛盾。
去掉 " 中間商 ",構建一個去中心化的互聯網,是吳翰清創業的初衷。
隻不過,他一直在等待一個時機。
時機到了
ChatGPT 橫空出世,吳翰清認爲,打破數據壟斷的時機到了。
他要構建一個 AI 互聯網,并構建個人 AI 計算機。如果這個想法能夠實現的話,吳翰清的願景是:"AI 互聯網 " 将消滅精準營銷廣告,把精準營銷廣告商榨取的萬億級别人民币利潤返還給供應商和老百姓。" 相當于,人們以後在互聯網上買所有東西應當會免除一道廣告稅。
對于那些希望通過看廣告來免費獲取服務的用戶來說,需要認識到廣告的隐蔽危害最終擡高了商品和服務的價格。而想免費獲取某些商品和服務其實有其他辦法,比如通過自己的分享來換取,就是一個健康的機制,它提倡和鼓勵人們分享,而非攫取。因此最終 AI 互聯網會更省時、更便宜、更豐富。
于是,吳翰清成立了新公司 "KMind",第一代産品即 " 半個宇宙 "。
半個宇宙的 "AI 互聯網 " 設想
半個宇宙的産品邏輯與 ChatGPT 有一定的共通之處,在半個宇宙的架構底層也使用大語言模型 LLM,不過囿于 LLM 當前存在的比較嚴重的幻覺等問題,半個宇宙在路線選擇上,主要通過 LLM 在 LUI(Language User Interface,人機對話交互)中完成用戶對話意圖分類,以及在運算器的位置通過 LLM 提高效率。但并不需要 LLM 的邏輯推理能力。
" 邏輯推理能力是我們控制器要建設的核心能力,我們也不需要 LLM 的常識,因爲我們的存儲器将讓用戶建設自己的私有知識庫。" 吳翰清表示。
也就是說,半個宇宙中的用戶可以像使用雲盤一樣,将自己的數據存儲在半個宇宙當中,用戶可以選擇這些數據是否共享。如果選擇共享,當另一位用戶向半個宇宙提出問題時,半個宇宙的 AI 框架會自動在已共享資料中尋找答案并将這些答案帶給提問者。
在這樣的模式下,數據存在于每一個用戶手中,他們對自己的數據是共享享有決定權,當那些被共享出來的數據被其他用戶以提問的形式召喚時,AI 将自動處理數據将信息 " 送貨上門 "。
個人 AI 計算機
半個宇宙所使用的 AI 框架由馮 · 諾依曼架構的擴展而來,保留了馮 · 諾伊曼架構的主要部件:輸入輸出模塊、控制器、運算器、存儲器。
不過,依托馮 · 諾伊曼架構,半個宇宙的底層框架在輸入輸出模塊增加了 LUI,它基于 LLM 對用戶的自然語言做意圖分類,然後觸發控制器執行相應的動作。其次新增記憶器用于處理短時記憶,LLM 和提示詞框架也被放到了運算器中。而其中的控制器相當于整個系統的 " 大腦 ",它理解用戶意圖并對複雜任務做拆解,并調度不同的執行單元完成任務。
吳翰清将這個擴展後的 AI 框架定義爲個人 AI 計算機,這個系統也被命名爲 kOS-1.0。
KMind 通用 AI 計算機架構圖
"個人 AI 計算機主要實現兩類任務,一是自動化的處理數據,二是學會使用工具。個人 AI 計算機要完成的本質工作隻有一個:操作數據。" 吳翰清表示。這也決定了半個宇宙與 OpenAI 的本質不同,半個宇宙追求的是個人 AI 計算機,而 OpenAI 最終可能會形成一個 AI Agent 生态。
半個宇宙與 OpenAI
半個宇宙的世界中除了最終用戶,還有一類群體會對這個宇宙的建立起到至關重要的作用,就是開發者。在半個宇宙的邏輯鏈中,開發者可以自主開發 ACT(Action 縮寫),ACT 強調 AI 自主性,即定義自主智能(Autonomous Intelligence)行爲,初衷在于用戶可以用自然語言來操作計算機,LUI 則在中間完成自然語言 Query 到 ACT 之間的映射。
半個宇宙初始設置了 "Native ACT",通過 Python 編寫代碼,組合 Native ACT 的調用,開發者就可以開發出一個自定義的 ACT。不過,由于實現了 " 基于自然語言的 AI 編程 ", 半個宇宙的開發者群體有望從 700 萬開發者,變成 7000 萬的專業工作者。各行各業的專業工作者如作家、畫家、美食家、律師、醫生、教師、學者等等通過自然語言描述需求,AI 計算機自動完成任務。
吳翰清的觀點是,在 AI 時代,ACT 會成爲新的程序開發形态。
" 新世界 " 能成嗎
叫闆 OpenAI,棒打巨頭壟斷,半個宇宙這件事兒能成嗎?誰來爲這樣一個反壟斷、反剝削的新世界買單?
半個宇宙承諾不使用用戶數據來訓練 AI,也承諾絕不上線廣告,但它最終還是需要用戶買單的付費産品。
" 現在爲計算機花多少錢,未來在‘半個宇宙’就會花多少錢。但半個宇宙價格可能會更親民一點。" 吳翰清表示。
對于一家計算機公司來說,計算是重資産,服務器也是重資産,這些成本無論如何也無法用廣告收入來抹平,它必須是付費而不是免費的生意。就商業的本質來說,吳翰清認爲,半個宇宙最終賣的是算力,用戶未來按月彈性訂閱,也可以分成 48 個月付款,每個月花幾十塊錢就能夠得到一台計算機了,并且這台計算機還可以随時擴容,随時進行算力升級。
爲了觸達用用戶的不同使用場景,半個宇宙未來也不排除推出硬件類産品。" 你不能說我們把 AI 真的塞到這個硬件盒子裏,不是這樣的,但它肯定會有一些雲端之間的協同,這是必然會産生的。" 從吳翰清的表達中看,硬件可能是更長期的布局,不會現在立即就做,它會跟随半個宇宙成長規模慢慢展開。
"半個宇宙的數據量最終會超過百度,會不會超過谷歌再說,但一定會超過百度。" 吳翰清表示。他也并不害怕與巨頭的正面競争," 這是兩個時代的競争,如果真的這件事情成了,或者說如果我預測的未來到來,他們就自然消亡掉了,所以都不是說我把它們打敗,是時代把它們打敗了。"
以下爲訪談節選:
1. 在所有的 GPT 都是希望成爲 OpenAI 的情況下,半個宇宙如何保證不成爲 OpenAI?
吳翰清:這裏面有一個很重要的區别就是,首先如果這個公司的商業模式是廣告,那我覺得最終它很難避免自己不作惡。不提倡數據壟斷意味着我們不會用大數據去盈利,但這不是說我們不會用大數據,我認爲我們未來數據總量至少超過百度,會不會超過谷歌再說,但是我認爲我們的數據總量未來至少是超過百度的。
第二我們不會自己搞一個擁有所有常識的 AI 出來,然後去收費,我們不會幹這個事情。那我們這家公司幹嘛呢?我們賣算力," 半個宇宙 " 提供的是算力,程序員進來提供的是算法,用戶提供的數據,所以數據是歸用戶的。用戶得到了數據,創造了價值,程序員得到了他寫的算法創造的價值,最後 " 半個宇宙 " 提供了算力,這是一個良性的生态結構。OpenAI 是這三者全是它的,數據的價值是它的,算法的價值是它的,算力的價值還是它的,所以最後它是會讓所有 agent 公司死掉,我們會讓所有的 agent 公司活,這就是差别。
從另一個角度來講,爲什麽我剛才提到 OpenAI 有點問題?就是它最近的這個 " 宮鬥 ",我不知道外界怎麽解讀的,從我的角度我覺得是非常糟糕的一件事情。
2.OpenAI 的董事會和 Sam,你支持誰?
吳翰清:這不是一個支持不支持的問題,如果我在 Sam Altman 的位置我會做同樣的事情,但是今天我是一個外部觀察者的角度來看,我認爲是非常非常糟糕的。原因就是 OpenAI 這個母體它的非盈利性的組織,它是通過協議在約束商業公司的,最後如果這個員工起義就能夠把董事會給 fire 的話,那所有商業的契約精神就不複存在了,所以我認爲這是一家沒有契約精神的公司。不管他的出發點是不是正義的,但是他一定是違背了契約精神。你看看 OpenAI 它原本的董事會,他們想幹嘛?他們是認爲 AGI 對人類可能會造成威脅,所以他們試圖去維護它。他們是在捍衛道德,還是在捍衛商業之間做了一個博弈,最後商業赢了。
在發生了這樣的 " 宮鬥 " 之後,我認爲 OpenAI 對我們已經沒有威脅了,因爲我們的價值觀比它更正。我們一直是走在希望創造更平等的互聯網的道路上,但 OpenAI 曾經試圖堅持這件事情,我認爲如果他們真的把 Sam 給 fire 掉了,我認爲這是一家非常偉大的公司。
3. 如何去抵抗數據剝削?因爲 " 半個宇宙 " 最終要成爲一家盈利的公司,要成爲一家商業公司。
吳翰清:我要把最關鍵的 " 半個宇宙 " 信息推薦算法和檢索算法開源掉,由一個開源社區來維護,第一天我們就做了這件事,斷掉了未來 " 半個宇宙 " 想要閉源的根子。如果某一天 " 半個宇宙 " 竟然想要把它給閉源掉,把開源算法替換掉,那我也号召所有 " 半個宇宙 " 的居民來推翻它,因爲從那一天可能就是他作惡的開始,他開始嘗試又從不壟斷數據走向了數據壟斷,那就是違背了這家公司的使命和初心。
4. 剛才您提到了 " 半個宇宙 " 賣算力,這個具體是怎麽做的?最終付費的是不是還是用戶?
吳翰清:最終付費的當然是用戶,因爲我們是一家做計算機的公司,而且我也說了,我們隻對标蘋果,所以你想想吧,你買蘋果手機是要付費的,沒有人說會免費的給你用智能手機,除非是運營商買單,然後積分什麽換,但實際上一定是有人爲此去付費的。
5. 您剛才也提到了做硬件,接口很重要,那這個是必選項還是說未來可能爲商業模式去考慮更順利然後做這件事情?
吳翰清:剛才談到硬件純粹是出于商業考慮,就像我說的,我們真正的主體是在雲上的,所以我們的星伴它一定是一個 AI 永遠在線的形态,硬件隻是爲了更好的去通過商業觸達不同的場景。因爲今天很多消費者的購買選擇是非理性的,比如說很多消費者去買車的時候,他壓根不懂車裏面的引擎到底有多好,他是看這個車的外形好不好看。不好看的統統否掉,就都不進入到購買選項,隻去看好看的車,它貴也會買,所以消費者的選擇往往是非理性的,我們做硬件可能也是出于這樣的消費者心理的考慮。但你不能說我們把 AI 真的塞到這個盒子裏,不是這樣的,但它肯定會有一些雲端之間的協同,這是必然會産生的。所以是不是做硬件對我來說是一個商業選擇,而且可能也不是我們第一天的商業選擇,但是随着我們成長的規模和路徑慢慢地都會覆蓋到。
6. 半個宇宙的思路在現在看來是超前的,因爲超前就有可能失敗,會有這個問題嗎?
吳翰清:我認爲可能之前我們看到了很多公司,他們嘗試着想做類似的事情,但是他們可能出現在 10 年前,所以他們失敗了。那到今天我之所以敢出來做,是因爲我認爲時機和條件成熟了。就像我在我們這裏分析的就是到今天誕生個人 AI 計算機的幾個基礎前提今天已經具備了,今天出現了大模型這樣的具備足夠泛化能力的神經網絡,在之前是沒有這個東西的,之前都是小模型,都是基于特定場景的,必須依賴于數據的樣本,這件事情大概在 4、5 年前還是這個樣子,但是到今天我們突然發現大模型出來之後改變了很多,它最關鍵的改變我認爲是在這個地方,所以 LUI 是一個巨大的變化。
第二是談到雲計算今年也是産生了,所以今天我們是有足夠的能力支撐我們來做這樣的事情,有足夠的算力。這個算力不是指的英偉達這個東西,我們談到的是雲計算這種模式。
三是我們認爲到今天可能這個臨界點就是在于可編程這件事情,如何讓一個 AI 具備可編程能力,我認爲是到了一個臨界點。這件事情還沒有真正突破,但是恰恰因爲它沒有真正突破,所以我們才有機會。如果它已經被别的公司突破了,我們也沒有機會了,所以我認爲最後這臨門一腳應該我們射出去。恰好是在一個天時、地利、人和的時間點上,天時、地利、人和,你不這樣想嗎?我認爲是天時、地利、人和。
7. 打破數據壟斷這個東西一定會動各大廠蛋糕,如何考慮這些難點?
吳翰清:首先我認爲跟這些大廠的競争是兩個時代的競争,所以我跟他們其實也沒什麽好競争的。如果真的這件事情成了,或者說如果我預測的未來到來,他們就自然消亡掉了,所以都不是說我把它們打敗,是時代把它們打敗了,是時代淘汰了它們。時代認爲未來應該是一個更平等的互聯網,而不是說一個被壟斷的互聯網。所以 AI 互聯網到來的那天,首先不一定是 " 半個宇宙 " 做成的,但是 AI 互聯網我認爲它一定會到來,所以那些公司就是今天做廣告的,它自然就淘汰掉了。爲什麽會淘汰掉呢?因爲我們認爲它們很難轉型,因爲它們都是上市公司,财報把他們壓到他們沒法轉型,沒法調整,做任何的調整财務數據一掉,投資人跳起來,股民跳起來,他們就又不能調了,所以就很艱難。你會看到的現象是這些大廠裏面的人才都流失,然後出來去擁抱 AI 互聯網,你會看到這樣的現象,那我就把這個預言放在這好了。
所以我才覺得 " 半個宇宙 " 是在順勢而爲,我們不是說我們今天創造了 AI 互聯網,我認爲是 AI 互聯網必将到來,我們看到了這樣的未來,看到了這樣的機會,所以我們提前進去了。
更高的事情,我們是在做一件效率更高的事情,所以最終我會把它做到安全讓大家選擇去相信它。今天是一個很好的開始,在今天我們一定會受到一些質疑,就是關于隐私和安全的挑戰,但是我們會優先選擇願意相信我們的人來共同成長和發展。随着相信我們的人越來越多,我相信最終我們會被社會所普遍接受,所以這是一個社會需要去接受它的一個新事物的過程,它不是别的過程,所有技術都需要經曆這樣的過程。
8. 怎麽看待下一代搜索?很多公司都想成爲一家下一代搜索公司。
吳翰清:搜索引擎本身是在聚合互聯網上的大量信息,才會有搜索這個概念。在我們 AI 互聯的概念裏面是沒有這個概念的,你要做搜索也隻是一個局部搜索,所以在我們 AI 互聯的概念裏面,應該是你有需求你要廣播,無非是看你廣播的範圍,最後會有很多 AI 出來應答,應答是一個推薦的過程。推薦過程有可能開源掉,所以我認爲在我們看到的 AI 互聯的未來裏面是沒有搜索這個中心化概念的,這是我們非常重要的一個區别。
9. 但它實際上做的就是搜索這個事,隻不過換了一種去中心化的方式。
吳翰清:它做的不是搜索這個事,因爲搜索是人在找信息,我們 AI 互聯講究的是信息找人,是信息的反向流動。這個反向流動你已經不能把它叫做搜索了,你獲得了信息,但它不是搜索來的。