「今天距離 ChatGPT 發布,已經第 131 天了。」
身着橙色帽衫,王小川走進一間近 30 平米的會議室,在這裏,他宣布了自己即将投入創業的大模型産品名叫「百川智能」。「川」字一語雙關,既象征了河流彙聚入海的過程,如同數據彙聚産生支持;又隐含了自己的名字,「我把自己也放進去了。同時也意味着需要更多人才加入進來。」
這場内部交流會可謂低調,現場沒有 PPT,王小川對着一台 iPad 講述完自己的創業背景與願景,過程中樓上不時傳來一陣陣裝修的電鑽聲。這是在搜狐網絡大廈的二層,戲劇性的是,不久前亦投入大模型創業的王慧文所創立的光年之外也在這棟大樓辦公。
而本次創業的啓動資金也同樣低調——「百川智能」由 5000 萬美金啓動,據王小川本人介紹,資金部分來源爲他個人出資,其餘爲幾位友人的個人支持。相比光年之外的兩億美金融資(未宣布 close),在大模型領域,五千萬美金并不是一筆引人矚目的金額。但王小川表示,将産品從 0 到 1 跑通,這筆錢在初期夠用了。
但據極客公園了解,王小川完全可以拿到更大金額的融資,他卻選擇了相對較小的初步啓動資金。在大模型領域大消息不斷的 3 月,外界環境的變化令他逐漸從沖動過渡到冷靜,選擇了以極低調的身姿入場,爲的是「不讓早期團隊有太大壓力」。
事實上,早在一個月前王慧文高調入局後,王小川就開始了與産學界和政府有關部門的密切交流。最近他在社交平台上發布了不少言論,稱如果機器掌握了語言,則強人工智能的時代就要到來。在此次交流會上,王小川強調,創業搜狗的背景是他帶領團隊做大模型的最大優勢。「搜索就是做語言,在 AGI 方向,做語言是很大的優勢。」而據極客公園觀察,這一個月以來,王小川也是大模型創業者中,最被業内看好的一個。
在「百川智能」目前公布的圖景中,目标是「要構建中國最好的大模型底座」——「最好」體現在參數、品測以及體驗。與别家大模型有所區别的是,「百川智能」将率先在教育、醫療兩個垂類領域做知識增強,目标是要幫助大衆獲得普惠知識,幫助企業做通用服務。底座産品目标在年底公布,垂類産品可能會提前公布。
人才是大模型領域競争的關鍵詞。王小川透露,「百川智能」到月底團隊會接近 50 人,不到一半是搜狗班底。而半個月後他本人就要飛去美國繼續招募技術人才。
有趣的是,這場交流會的靈感來自 ChatGPT,當王小川問及 ChatGPT:如何招到更多更好的大模型領域人才?ChatGPT 給出的回答是,你要先對外界講清楚你的邏輯。于是才有了這場交流會。
有關此次創業的融資節奏,王小川的表現和外界的狂熱期待并不相符,當被極客公園問及這是否仍是職業經理人作風,而非創業者身位——他笑着回答,「我習慣了一切 ready 才公布,我承認這有職業經理人的慣性思維,但我走出來了,所以先選擇向大家公布。」
01 從狂熱,到冷靜
王小川低 a 調官宣的背後,是過去數月大模型創業從狂熱到冷靜的一個縮影。
說起王小川,第一個浮現出的标簽往往是「理工天才」,他有着世人對「理工男」刻闆印象裏的那些特質:做事審慎,不想好不出手。但在大模型這件事情上,王小川最初也曾陷入狂熱之中。
就在王慧文在朋友圈宣布做中國版 OpenAI 的前一天,創業者社區「前沿社」舉行了一場關于通用大模型的線上交流會。「OpenAI 正在展現出一場革命的開篇,這将是是互聯網和移動互聯網之後,同等量級的産業變革。」會上,極客公園創始人張鵬提出這個觀點,并在與會者中發起投票。
一共 13 票投向認同,這裏面第一個投票的就是王小川。參與活動多次以來,那一晚是他一年多來表達最多,也最興奮的一次。
在這場交流活動上,王小川是 ChatGPT 最堅定的支持者之一。當幾位參加交流的 AI 領域創業者,嘗試僅僅從功能上定義 ChatGPT 的進步的時候,王小川甚至明确表态,說大家「把這件事想小了」。
「我看到了 AGI(通用人工智能)的曙光!」王小川說這是他去年末開始體驗 ChatGPT 的時候,内心最強烈的感覺。并且在這次讨論活動裏,第一次含蓄透露了自己可能也會參與大模型這場變革的态度。
在 2023 年 2 月 12 日極客公園前沿社的一次「AGI 信徒聚會」上,王小川第一次明确表達了「早就下決心肯定要入局」的決心。或者說,王慧文的突然高調入場,實際上打亂了王小川原本四平八穩的節奏,某種程度上幫他走出了「經理人的思維」,開始激活了「腎上腺素」。
左起:李志飛、周源、王小川、翟光龍、張鵬
極客公園從接近王小川的人士處得知,在王慧文高調宣布入局後一周左右的時間内,王小川也曾準備對外宣布入局。但那段時間密集的輿論熱潮,外界不上船就要被落下的 FOMO 心态,讓他最終開始刹車反思自己急匆匆宣布,是否真的有必要。
王小川最熟悉的「老地方」
王小川沉默的這段時間,其他先放出消息的團隊開始了緊鑼密鼓的籌備工作。王慧文設立北京光年之外科技有限公司,吸引了頂級 VC 上億美元的認購。
另一位宣布投身大模型領域的出門問問的創始人李志飛,曾向極客公園表達過他的觀點,他認爲,通用 AI 大模型就像是核武器,入局确實有時間窗口。「人才壁壘、時間壁壘、數據壁壘、資金壁壘一旦建立起來,小的團隊就沒有戲了。」王小川和李志飛也是很熟悉的朋友,他也認同這個觀點,但是他也提出了一個觀點——「這事情不能上頭,還是要走心多思考下。」
在過去一段時間中,确實有些東西是值得思考的。比如以最早宣布入局的王慧文爲例,一個月過去了,即使手握大筆資金,招到足夠人才,特别是一個業界被認可的首席科學家或者 CTO,依舊是充滿挑戰的任務。
而從收購 AI 架構公司一流科技 Oneflow,到意向收購兩家清華 NLP 團隊的初創公司——深言科技和面壁智能。也體現了王慧文希望盡快用最短路徑集結人才,而這恰恰體現了大模型創業的複雜性,資本意義重大,但不是唯一決定性的因素。
而王小川在 AI 領域的積累和在技術産品領域的個人品牌和經驗,确實讓他在思考後,可以選擇另一種入局的方式。
02 融資思路爲何變化?
值得關注的第一個不同的思路,就是王小川爲何把啓動資金設在 5000 萬美元。
在 ChatGPT 問世的時候,王小川曾經發過一條朋友圈說:OpenAI 的勝利,是技術理想主義的勝利。
從創立公司到推出 ChatGPT,OpenAI 整整走過了八年,在那之前,他們投入了大量的資金和資源。但也正是這種對技術的信仰,才能讓他們取得震驚世界的成就,在 AGI 的前夜,爲自己賺取今天難望其項背的領先優勢。
最初國内創業者都是想做中國的 OpenAI,也就是做底層的通用大模型,這件事背後的邏輯很簡單:
OpenAI 不能進入中國,國内一定需要自己的大模型。
互聯網大廠會做大模型,但他們吃不下所有市場。有業務重合的公司不會把命脈交給大廠,所以創業團隊就有生存的空間。
OpenAI 已經踏出了一條成功的路徑,如果哥倫布已經發現了新大陸,你在這個方向上,就有可能用更短的時間和更少的資源在國内做出同樣的事情。
幾個月過去,今天來看前兩者都沒有問題。但複制 OpenAI 的路徑,卻看起來越來越有挑戰。
3 年前發布的 GPT-3,還隻是一個基礎的底座;
半年前的 AI 機器人 ChatGPT(GPT-3.5),已經是一個完整的産品,并具備了泛用場景下對話這個更高階的技術能力;
一個月前的 GPT-4,則具備了更強的推理能力和多模态轉化能力;
幾周前,OpenAI 宣布支持 ChatGPT 插件,後者已經不隻是一個産品,而是一個生态,甚至是操作系統。
以大模型能力爲基礎,OpenAI 已經構建起産品能力、商業化能力和生态能力,這爲他們積累了大量用戶,而數據飛輪效應進一步加快 OpenAI 叠代基礎大模型。
如果說做一個大模型的難度系數是 1,想要快速做出能對标 ChatGPT 水平的、「完全開放式對話産品」的難度是 100 了。
既便王小川決心要做中國的 OpenAI,甚至最終要超越他。那麽他核心要面對的問題就是:
你要做哪一年的 OpenAI?2015 年的?2020 年的?2023 年的?還是 2025 年的?每一年 OpenAI 的能力體系都是不一樣的,新的創業者如何建立自己的特點、差異化和優勢呢?
從追趕到超越,一個創業公司的萬裏長征第一步要怎麽走?第一個裏程碑設立到哪裏?第一個能閉環的商業循環是什麽?
當面對 OpenAI 在過去數年燒掉數十億美元構建起的完整生态,複制相同的路徑需要的資源,不論是 5000 萬美元還是幾億美元,如果不考慮造勢問題,其實都是杯水車薪。
比較務實的思考是如何迅速啓動,設定合理的裏程碑,并且用最高的效率,以及超預期的結果到達裏程碑,那麽後續的資源才會源源不斷。
據參與了王小川本輪融資的好友透露,王小川正是出于這個考慮,改變了之前設定的融資計劃。在内部交流會上,王小川被問及五千萬美金是否經過詳細的計算,他透露,「從 0 到 1,5000 萬的啓動資金就夠了。但要持續做到最好,我估計應該是從 3 億 -20 億美元之間。」
03 王小川想要怎麽做?
交流會上,王小川給出了百川智能現階段的幾個目标:
構建中國最好的大模型底座。
在幾個方向加強:搜索的增強,多模态的增強,教育、醫療等知識層面的增強。
相比 OpenAI 專注在一個通用模型,百川智能則會同時發展垂類模型和通用模型。
對于通用大模型,王小川稱,百川智能目前已經開始訓練 500 億參數的模型,進展很順利,年底前預計會發布對标 GPT-3.5 的大模型,有信心今年年底做到國内最好。
相比之下,垂類模型預計會出來的更快。盡管垂類模型的通用性沒法與 OpenAI 抗衡,但可以通過針對具體場景優化,在細分場景裏達到與 OpenAI 相近的效果,從而積累用戶、構建起生态,跑通小閉環。
而王小川選擇的幾個場景,除了搜索這個老本行外,選擇醫療、教育這兩個垂類賽道,是因爲這兩個行業「對知識的要求最高」,而這個特征也會是大模型最先落地的方向。
甚至王小川曾經與參與本次投資的朋友表示,大模型的之外,最需要花精力的,是打造超級應用的思考和實踐,「最大最成功的公司一定是在應用上想得最清楚的公司。」
顯然,中國 OpenAI 這件事,今天已經不隻是大模型本身的競争,而是大模型、超級 App、行業應用三合一的「新鐵人三項」賽了。
附:王小川公開信全文
今天我正式宣布,創建「百川智能」,一家研發并提供通用人工智能服務的中國公司。
生活在二十一世紀初是如此幸運,波瀾壯闊的互聯網革命還沒有謝幕,通用人工智能時代又呼嘯而來。多年前我曾斷言,機器掌握語言,通用人工智能時代就來了;我也有暢想,搜索的未來是問答。ChatGPT 的騰空出世,地動山搖,這一切都開始成爲現實。ChatGPT 發布到今天,僅僅 131 天,每天都有撲面而來的新進展、新突破。131 天恍如隔世!
大半個世紀以來,科學家們前赴後繼,努力創造通用智能機器。這一天終于到來,我們找到了一條巧妙的路徑,用 AI 成功将語言轉化成了數學模型。語言是知識、思考、溝通和文化的載體。維特根斯坦說,語言的邊界就是世界的邊界。當 AI 掌握了語言後,就開始認知世界,成爲有知識、能思考、善表達、會學習的智能體。我把這樣的智能體稱爲「語言 AI」。
人類個體總有消亡的一天,但能夠将畢生的知識通過語言記錄下來供新生命學習、繼承,文明因此延續。人類協作也需要個體之間通過語言溝通。掌握了溝通和世界知識的語言 AI 不再隻是人類的「工具」,而将成爲我們的夥伴和超級助理,成爲人類文明的一部分。
智能時代會改寫互聯網時代的範式。『連接』會被『陪伴』取代,『信息服務』會被『知識服務』取代,『免費與廣告』會被『付費與高品質』取代。
智能時代也會改寫自工業時代以來的範式。曾經是專業化社會分工帶來規模效應與效率提升,而未來會是逆專業化分工:之前需要很多公司協作完成的工作,會因爲 AI 的賦能『端到端』的完成。
智能時代将再一次開啓「文藝複興」。每個人都會因爲 AI 的助力而變得更加強大。用好 AI,一個人就可能做一個公司,解決之前難以解決的難題,也更容易成爲自己想成爲的人。社會也會更加扁平,以前少數人才能享有的智力服務,也能更普惠。
告别搜狗後,我已開啓新的遠征:立志往後二十年,爲生命科學和醫學的發展盡一份力,爲大衆健康做出一點貢獻,核心路徑是構建生命健康數學模型,并已經付諸行動。ChatGPT 的出現,也将成爲新遠征的重要助力。
不僅如此,ChatGPT 是我過往經曆的延續和升華。2019 年我将搜狗的使命升級爲「讓表達和獲取知識更簡單」,願景定義爲「幫助每個人輕松地對話和書寫。便捷地獲得知識和服務,提升工作效率和生活品質」。
搜狗輸入法和搜狗搜索的數據制備和産品形态,也與 ChatGPT 接近。它們都是把互聯網上的全部語言數據收集、清洗,壓縮成數據庫并構建超級産品。随着深度學習的發展,這些産品都多次叠代升級,全面用上了 Transformer/Bert 等技術。輸入法猜你想說什麽,搜索猜你想要什麽。而 ChatGPT 把這些能力推到了一個全新的高度,是輸入法、搜索之外,第三個把全網數據轉化成語言服務的超級産品。搜狗未盡的使命在機器掌握了語言後終于可以實現。
很多朋友認可我的技術理想主義和技術驅動的創業經驗,鼓勵和支持我做中國的 OpenAI。也有很多搜狗和非搜狗的技術大拿,得知我有做大模型的想法,主動申請參與組隊,甚至「帶資入組」。
我最動心的是,能和一群有理想的人,用極緻的技術驅動創造出颠覆性的智能産品。這一次,百川智能将借助語言 AI 的突破,構建中國最好的大模型底座,并在搜索、多模态、教育、醫療等方面增強,幫助大衆輕松、普惠的獲取世界知識和專業服務。
籌建百川智能不到兩個月,已有多位技術合夥人和領軍人物的加入。到這個月底将會有近 50 人規模的精英團隊。大模型的訓練也已經啓動,進展順利。按照現在的進度,争取年内發布國内最好的大模型和颠覆性的産品。
我們是中國公司,但我們并不希望隻是「中國的 OpenAI」,而是能建立世界級的視野和技術品質,讓中國享有世界級的産品,産生有世界影響力的技術的突破,進而服務海外。百川本意是衆多的河流彙集奔赴海洋,象征着衆多數據、行業知識彙聚成爲一個強大的智能體系,生生不息。百川也象征着集百家智慧,更多人與我一道共赴山海。我們呼喚中國的領軍人物、行業産品經理和遠在美國的同仁的加入。
同志們,請通過如下郵箱聯系我們:
通用人工智能時代剛剛開啓,我們作爲第一批跨入新時代的人類,帶着焦慮和好奇去擁抱它,思考和探索「我是誰?」我們還可以把自己的智慧注入它,做新時代的開創者,讓後代們有一個更美好的未來,繁榮和延續人類文明。
百川智能 CEO 王小川
2023 年 4 月 10 日