作者 |James
3 月初,AI 公司月之暗面(Kimi)據報完成了新一輪超過 10 億美元的融資,投資方包括紅杉中國、小紅書、美團、阿裏等。Kimi 引爆了資本市場的新一波熱情,甚至出現了 "Kimi 概念股 "。
視智未來注意到,這輪融資進行時公司估值達到 25 億美元,意味着創始團隊在這一輪融資中出讓了 40% 的股份。換句話說,如果基于公開報道推斷,月之暗面創始團隊手裏的股份有可能已經小于 50% 了。
這次陣勢極大的新融資,一舉将 Kimi 從原來的第二梯隊玩家,推進了中國大模型最亮眼的獨角獸行列;同時,也似乎把人們重新帶回了 10 年前一度暗淡下去的,那份對于中國互聯網行業黃金時代的回憶當中,尤其是擔心創始人稀釋的風險,有時甚至會喪失對公司的控制權。這種情況之前就頻繁發生在摩拜等共享單車領域,以及去哪兒、拉手網等競争烈度極高且資金需求極大的領域。
跟那個時候相比,現在的國内各路資金,不論是大廠還是私募,确實仍然處于 " 缺錢 " 狀态。而 AI 公司特别是基礎大模型公司,跟之前那些燒錢換市場的 " 微創新 " 相比,又似乎是真的需要錢。
" 我覺得他們幾乎拿走了市場上的所有資金。" 面對視智未來采訪,規模較小的 AIGC 應用層創業者這樣說。
" 我們還需要大量資金,10 億肯定還不夠。" 在面對視智未來提問時,Kimi 相關人士這樣說。
風雲變幻之間,原先以爲斷崖式領跑的廠家們,現在再看似乎也沒有那麽遙遙領先。初期 " 百模大戰 " 的浮躁褪去,仍有玩家在退潮後幸存,進入下一輪遊戲,但他們沒人敢高枕無憂。
曆史确實不會重複,但是一直在押韻。Kimi 帶來的熱度,是意味着一個新的互聯網 10 年周期的開啓?
VOL.1
誰是真 · 長文本
200 萬字(token)的長文本處理能力,是月之暗面長期主打的唯一差異化定位。
對上下文長度的規模拓展(Scaling)已經迅速成爲一種趨勢。中信建投研報指出,長文本能力能将大模型應用場景拓展至長文總結、劇情創作、代碼複現等複雜任務,且可以直接基于全文理解進行問答和信息處理,從而緩解大模型 " 幻覺 " 問題。
在 Kimi 穩定支持 200k(20 萬字)之前,其它模型的文本能力如下:
GPT-4 從一開始的 4k、8k 拓展到了 GPT-4-turbo 的 128k。
Claude2 支持 200k 的輸入。
百川、零一萬物首次發布的模型也接近支持 200k。
去年底,Gemini 1.5 Pro 一次性将文本輸入長度拉到 1m,但據第三方測試,效果很差。
在月之暗面 " 出圈 " 後,其他家在支持長文本方面的升級進度,幾乎在一夜之間趕了上來:
百度文心一言:200 萬 -500 萬字;
360 智腦:500 萬字;
阿裏通義千問:1000 萬字;
岩山科技 Yan 自稱 " 無限長度 "。
就在近期,阿裏發布通義開源模型 1.5 的 32B 版本時,還引入了一個叫 " 大海撈針 " 的趣味能力測試,也就是在長文本中随機放入與主題無關的文字,并讓大模型找出。他們說,這可以證明它并不是依靠自己的知識庫或者幻覺,而是依靠用戶提供的文本作答。
不過,當視智未來問到:" 您怎麽看待其他模型公司在發展長文本技術?" 的時候,Kimi 相關人士的回答充滿了領先的自信:" 我們最近發現回應這個問題挺難的。你比如說,誰在發展長文本技術?(其他家)這些其實都不是真正的長文本。他們隻是用技術術語說自己能做到而已。"
該人士提到,大模型基于前文來預測下一個字,前文越豐富,預測越準确。這裏的 " 前文 " 就是預測的窗口。
" 我們已經将窗口擴展到 200 萬。我們使用的是負注意力機制,進行全面采樣,不進行降采樣。他們還停留在 8000 字的限制,他們的模型基于這個範圍,從資料中搜索片段,拼合進 8000 字中,然後提供信息。"
" 他們的模型缺乏足夠的上下文來回答問題,就像是考試時準備的小抄,可能有用,也可能沒有。我們的方法則是完整閱讀并理解每個字,然後進行交流和讨論。"
Kimi 的 200 萬字長文本支持需要排隊申請内測
作爲參考,阿裏解釋它們對 qwen 開源模型采用了分組查詢注意力機制,用最通俗的話就是将輸入分拆成段,再組合理解。同類技術在将模型參數規模縮小,使之更爲節能或可以端側運行時經常使用。
不管怎樣,模型支持長文本的綜合效果如何,還缺乏實際場景的證明。和當下的大模型基準測試一樣,長文本能力測試也是缺乏可信标準,處在自說自話的狀态中。
對于 Kimi 而言,在最終可用性上大幅抛離競争對手,當然是它們要盡力追求的目标。但實際情況并不是那麽泾渭分明。
即使是争議最少的參照對象 GPT-4,也偶爾會有 " 季節性倦怠 "、" 變懶 " 等不盡人意的時刻。将生成結果的用戶滿意度做到 80%,和做到 99.99%,是完全不同的兩碼事。
VOL.2
獲客成本很高嗎?
如果各家大模型在效果上很難做鮮明的區分,用誰都不會太好或者太差,那麽營銷推廣就變成了重要的命題。自從春節前後,在 B 站、抖音等平台上,以及機場、電梯裏,好像到處都能看到大模型廣告。
例如,視智未來經常在電梯廣告看到下面這種投放:
智譜 AI 截止 2023 年已經獲得 25 億美元融資,它主要在電梯、公交地鐵、機場等戶外場合投放。與之相對,Kimi 的主戰場是 B 站。
有人說:" 像 B 站網頁端,我滑下來 10 個廣告有 9 個都是它,而且這個情況持續很多天了。"
" 其實這是一個誤會。"Kimi 相關人士告訴視智未來,目前 B 站的廣告投放可以選擇按安裝量效果付費,加上其它投放廣告的人少,也沒有出現太典型的個性化投放。" 我們隻花了一點點錢,它的算法也不足以将廣告足夠分散。"
資料顯示,B 站的 App 下載廣告計費方式有 CPM 曝光計費、CPC 點擊計費、OCPC 點擊計費等。其中确實存在隻有完成下載安裝才付費的模式。
Kimi 目前客戶群體很大一部分是大學生,這與 B 站主流用戶群重合。" 所以對我們來說,B 站是個好的渠道。但我們不能讓它過度曝光,以至于大家産生反感。我們需要讓用戶了解并使用它,并保持用戶粘性。這是一個良性循環。不能讓已有的用戶每天打開就看到一大堆廣告,這會造成不好的體驗。"
在大量投放和媒體宣傳的共同作用下,Kimi 獲得的成果也比較顯著,iOS 客戶端一度沖進 App Store 免費版應用的第五名,超越微信。3 月 21 日,Kimi 的小程序、App、網頁版一度宕機,官方解釋稱已經進行了 5 次擴容。
有數據統計,目前 Kimi 模型的日活躍用戶數已達 100 萬人(60 萬在小程序,34 萬在網頁端,還有 5 萬在 App 端)。此外,在 iOS 和安卓主要應用市場,每月 Kimi 下載量大約維持在 1.8 萬左右。
據 Similarweb 統計,月之暗面官網 3 月的月訪問量約爲 1220 萬次
曾有媒體根據行業通用的估算方法,測算目前 Kimi 投放廣告的獲客成本約在 10 元,如果算上拉新後用戶問答互動産生的算力成本,每個用戶的獲客成本達到 12-13 元。按此計算,Kimi 每天的獲客成本将燒掉至少 20 萬元。
前述相關人士對視智未來否認了任何推測 Kimi 獲客成本的說法。" 他們基于的是行業内的成本标準,但他們不知道實際情況。"
VOL.3
算力,算力,算力
表面上,我們看到的是大模型的宣傳陣勢極大。但如果推廣成本也沒有太高,錢要花在什麽地方呢?
在冰山隐藏于水面之下的部分,可能是更多的算力和數據成本。
3 月,有消息稱微軟計劃在未來幾年爲 OpenAI 投資 1000 億美元建設數據中心,這比當今一些最大的數據中心的成本高出 100 倍。
1000 億美元的投資,也已經是截止 2020 年,自動駕駛汽車領域投資的很多倍,也可能相當于 Meta 在元宇宙相關技術上的總投入。而這,居然僅僅是花到一個數據中心的項目上而已。
OpenAI 和 Meta 等巨頭一直在爲百億、千億、萬億美元級别的新融資奔走,奧特曼認爲對芯片企業的投資額将會高達 7 萬億美元。這些數字就好像随口一提一樣,即使它們可能已經是某個省份乃至國家的全年 GDP。
人工智能的發展成本如此高昂,這還沒有提到算力是不能複用的,每次運行都會重新産生成本,以及購買語料數據等同樣需要錢。一個大模型開發商需要以上所有這些成本支出,這解釋了爲什麽投資者如此關心大模型企業的投資回報。
AI 基礎設施正取得肉眼可見的回報,因此 AI 部門在綜合性大廠内,早期往往和雲計算部門視爲同一分支。假設大廠自己運營芯片或數據中心的供給,那麽哪怕它們自己的大模型沒有一炮打響,至少也可以通過把算力賣給别人獲利。
但是月之暗面目前還不是這樣。它如何證明自身産品的實用性,以及在給基礎設施提供方轉移支付以後,還能保證自己和投資人的利益,目前還不清楚。
首先,Kimi 很難自有算力。在 3 月份 Kimi 爆火宕機前後,一份關于 Kimi 的 " 專家交流紀要 " 流傳,其中提到公司使用字節的火山引擎來支撐訓練和運營," 公司不太可能私有化一個數據中心,供應鏈資源很難開拓,而且成本很高。"
火山引擎的官網将月之暗面列爲案例
其次,大模型通用的準确性問題沒有解決。作爲黑盒的大模型,使得判斷問題和缺陷,進而改善效果變得很困難。人們對聊天機器人答案的準确性提出了越來越多的質疑,而這種不确定性,在大模型浪潮持續一年後,已經顯著阻礙企業和消費者對 AI 服務的支出。
終端用戶們有的會使用 ChatGPT+Kimi 等多個模型交叉驗證,有的在讓其閱讀一本書時,将結論和引文,頁碼等一同輸出。但越是加入人工核驗,就越影響 AI 輸出内容的性價比。對于企業需要尋求自動化方案而言,假如大模型驅動的自動回複系統出現一次問題,就可以變爲一場公關災難。
第三,Kimi 不能一舉終結國内基礎大模型的競争。它目前純靠提示詞(zero-shot)的編程能力跟智譜、文心等還有差距,規劃中的多模态還沒發布,付費 API 定價也高。
在文心、360 智腦、通義等切入長文本之前,它們普遍談到長文本處理是通過消耗算力到單位内容上來實現的,技術含量沒有想象的那麽有決定性。
視智未來也問到了 Kimi 何時切入多模态的問題,回答是:
" 我們一直在做多模态,隻是還沒到一個好的發布點。我們的策略是,必須有獨特的亮點才能發布。不可能發布一樣的東西。比如我們的 Kimi 發布時,它支持 20 萬字的上下文。我們不會發布市面上已有的一樣的東西。"
VOL.4
投資 = 投人
既然融資好處這麽多,其它 AI 創業公司就沒有融資的想法嗎?
" 我覺得他們幾乎拿走了市場上的所有資金。Kimi 一輪融資就達到了 7-8 億美金。" 時隔一年,秘塔科技 COO 王益爲再次接受視智未來的專訪。本次專訪于 3 月 30 日晚 8 點在視頻号 " 娛樂資本論 " 全網首播。
" 作爲一個小公司,我們的資源和預算非常有限。我們不能像大公司那樣參與重大的競争。确實,看到 Kimi 和智譜,我也很羨慕。如果我們有無限的資源,我們的策略會完全不同,我們可能更擅長口口相傳。"
秘塔的寫作貓及法律 AI 産品,之前已經引起了一些行業關注。2023 年秘塔擁有超過 1200 萬注冊用戶,增長速度在 AI 創業公司中頗爲引人注目。最近,秘塔又官宣了新産品 " 秘塔 AI 搜索 ",它一次搜索生成的文本可以長達 3000-4000 字,實際上相當于 " 代寫論文 "。
不過,在去年一年的 AIGC 狂飙突進中,秘塔沒有拿到任何新的資金。王益爲感覺,他們和投資人之間多少有點兒 " 不對付 "。
" 我能理解投資者的觀點。我們的項目可能看起來有些不同尋常。我們既不是純粹的技術大模型公司,也不完全是應用型公司。或者說,我們和投資人的口味不一樣。"
" 我和許多 VC 談過,他們有一種觀點很有意思。他們說我們沒有大牌科學家,我們的運營團隊看起來不夠豪華。在這種競争激烈的環境中,我們公司的 CEO 雖然非常有實力和洞察力,甚至産品思維非常出色,但這似乎還不足以讓人相信我們能帶領公司走得更遠。"
" 投資就是投人 " 曾經本來就是風投的其中一條規律,在模型效果缺乏客觀實際評判标準的時候,現在基本躍升爲一條 " 鐵律 "。
月之暗面有着極高的人才密度,公司員工也就 100 多人,其中北京總部的員工不到 100 人。但這些人當中,有在 Google Scholar 上引用次數過萬的聯合創始人,又吸納了大量參與過 Google Gemini 等重要大模型研發的人才,這讓它成爲目前最有投資價值的大模型初創公司之一。
有報道稱,在楊植麟剛開始大模型創業時,大量 VC 曾試圖能夠在項目早期聯系上他,但他對投資方的選擇十分謹慎。除去後續的廣告鋪路,Kimi 其實從一開始就可以說是 " 含着金鑰匙出生 "。
視智未來報道過的另一家在融資方面比較順利的初創公司,是做文生 3D 的 VAST AI。我們的報道提到,宋亞宸的招聘思路是從一開始去找行業内最核心的論文,然後把這些論文的一作、二作、三作找到,每天和他們聊公司業務規劃和行業進展。
宋亞宸自己每天前期花 80-90% 的時間在招人上,而且 " 隻要最好的人 ",因爲 " 做更難的事,需要花最大的精力找同路的人。" 因爲創業團隊早期沒有露出,爲了招聘到最頂尖的人才,去年 8 月份他争取前往圖形學頂會 SIGGRAPH 做了主題演講,和 IBM,英偉達,索尼等的高管同台。
相比之下,秘塔的聯合創始人們有北大校友提供的法律應用資源,但在團隊整體履曆上确實沒法跟獨角獸們比。
" 那我們能做什麽呢?隻能一點一點證明自己。現在我們又進入搜索領域,也是要靠優質體驗打出名聲,讓投資人相信這件事,而不再質疑我們在面對百度和阿裏時該怎麽辦。我們能做的就是堅持。" 王益爲說。
VOL.5
退出的方式
随着公司估值的提升,未來 Kimi 如果需要進一步融資,可能會面臨更高的估值要求,和更大的股權稀釋風險。現有投資方也擔心如何退出的問題,因爲他們占有的股份這麽大,要是不上市,就沒什麽好辦法了。
除了極少數專注于投融資的評論者,似乎沒人意識到,Kimi 這輪融資,在如此早期就出讓這麽大比例的股份,從以往的案例來看是不尋常的。回想科技創投剛剛在中國興起的 2010 年代,如果像去哪兒一樣,投資人理論上可以随時踢掉創始團隊選擇被并入其他巨頭;如果公司經營不佳,創始團隊也可以如拉手網的吳波般開新公司。
" 關于這個事情,它在當代并不重要。"Kimi 相關人士對視智未來說道," 京東等大廠創始人手持的股份可能連 10% 都不到。最重要的是什麽呢?是要獲得資本,用來實現這個項目。這可能是更關鍵的事情。"
這也确實是以 Kimi 融資爲代表的這一輪 AIGC 融資熱,跟曆史相比不同的地方。看看國外 Anthropic、Mistral AI、OpenAI 等 AIGC 獨角獸企業的股權結構,可說是一個比一個特殊。
Anthropic 擁有谷歌和亞馬遜的 " 雙料投注 "。Mistral AI 在成立後的半年多時間裏,接連完成了 1.05 億歐元種子輪融資和後續的 4.15 億歐元融資,微軟也對其進行了 1500 萬歐元的投資。
OpenAI 的實體是一個爲了 " 全人類共同利益 " 成立的非盈利機構(雖然咱也看不出它哪兒非盈利了),微軟持有 49% 的股份,其他 VC 各持 49%,OpenAI 基金控制剩餘 2%。之前深度參與的馬斯克似乎在一次次跟團隊的紛争中被徹底踢出了公司,在他 " 起訴 "OpenAI 時,對方的回應是,認爲他眼紅自己走後公司的發展成就,想回來分得一杯羹。
通過同股不同權、反稀釋條款等方式,這些公司都在想辦法維持控制權,同時拿到最多的錢。但是歸根結底,這裏面起到最大控制作用的變量,是創始團隊本身。
OpenAI" 宮鬥 " 期間,奧特曼一度不得不戴上 " 訪客 " 工牌才能進入他的公司
實際上,相關的故事已經在 AI 界上演過。去年 11 月 OpenAI 經曆大震動,Sam Altman 有整整一周時間 " 被踢出 " 公司。此後,我們又看到蘇萊曼的 Inflection AI 被微軟 " 吸血丢殼 ",核心團隊跑去了微軟,留下投資人手裏拿着 " 殼 " 和有限的補償。
Inflection AI 被微軟 " 雇傭式收購 ",是一個意料之外,情理之中的結局。Pi.ai 雖然很獨特,但怎麽看都無法獨立生存。然而,它原本的 " 殼 " 已經在此前的融資狂潮中被各種股東深度綁定,想跑可沒那麽容易。放到 10 年前的上一次投資狂熱中,這樣騎虎難下的公司可能難以如此體面地退場。
這些在 AI 業界不斷上演的劇本,再次證明了現階段 " 投資就是投人 " 的鐵律。在投資環境惡劣時,資方和創業者之間缺乏互相了解,投資人急于投出錢,卻又對選擇标的畏首畏尾。
融資過程中的 " 主動 PR",一般來說目的有兩個:爲正在進行的談判創造有利條件;吸引更多資方參與投資。而融資消息本身,也是一次好的 PR 機會。
通過海量投放和消息轟炸打出聲量,Kimi 這樣的獨角獸新貴既可以讓自己穩穩跻身 " 第一梯隊 ",也爲之後找大客戶打下良好的認知基礎。
不管用什麽方式,在它一旦可以證明自己之後,投資人 " 等待出手 " 的勢能,就會在它身上充分釋放,轉化爲 " 害怕錯過 "(FOMO)。