AI長文本之戰：Kimi快跑，大廠圍剿

文 | 周鑫雨

編輯 | 蘇建勳

一條名爲 "Kimi" 的鲶魚，将大模型公司卷到了長文本的新戰場。

這款來自 AI 獨角獸月之暗面的大模型對話産品，最大的标簽就在于 " 長 "。上下文窗口的大小，代表着一個模型的記憶力。窗口越長，模型單次可處理的文本就越長。對用戶而言，模型能讀懂的文字越多，在學習、工作等場景下就越有用。

深谙營銷之道的月之暗面，是國内乃至全球範圍内，第一家将 " 長文本 " 作爲标簽的大模型公司。2023 年 10 月 30 日，打着 " 全球首個支持輸入 20 萬漢字 " 名号的 Kimi Chat 就快速在一堆卷榜單、卷參數的模型中，擁有了辨識度。

Kimi 有多火？國信證券的調研顯示，從 2023 年 10 月到 2024 年 3 月，Kimi 的 DAU 從 10 萬攀升到了 300 多萬，翻了 30 倍。自春節起大規模投放廣告後，SimilarWeb 數據顯示，Kimi 的訪問量在 2 月增長了 107.6%，僅次于百度的文心一言和阿裏的通義千問。3 月 21 日，無法承接過多用戶的 Kimi App 和小程序一度宕機，用戶需要排隊才能正常使用。

Kimi 的爆火，還直接牽動了股市——一些與月之暗面有合作傳聞的上市公司，被冠以 "Kimi 概念股 " 之名，股價飙升。後續紛紛出來辟謠的海天瑞聲、中廣天擇，已經先吃上了 Kimi 的紅利，在 3 月 20 日應聲漲停。這段時間，滬深互動平台最多的問題是 " 公司是否與 Kimi 助手有合作 "，又或是 " 公司有接入 Kimi 嗎 "。

網上流傳的 "Kimi 概念股 " 名單。

在 2024 年 3 月 24 日的一場用戶活動上，月之暗面的幾位産品負責人直言：" 我們不敢說太多，還是希望大家關注産品本身。"

而一場對 Kimi 的長文本圍剿戰，也已經在大廠中打響。3 月 23 日，360 AI 浏覽器宣布内測 500 萬字長文本處理功能。百度的文心一言也被曝将在 4 月開放長文本功能，長度在 200 萬 -500 萬。阿裏的通義千問則一口氣免費開放了 1000 萬字的長文檔處理功能，坐上了 " 全球第一長 " 的寶座。

可炮制的技術，被驗證的需求

Kimi 帶起的長文本之火，無外乎兩個原因：技術門檻不高，市場需求已經被月之暗面初步驗證。

2023 年 10 月 9 日，Kimi 帶着 " 全球首個支持輸入 20 萬漢字 " 的标簽走進大衆視野。彼時，這一上下文窗口長度達到了 Claude-100K（約 8 萬字）的 2.5 倍，GPT-4-32K（約 2.5 萬字）的 8 倍。

不過，多名從業者對 36 氪表示，長文本處理的技術壁壘并不高。長文本建模的方案，主要有外部召回（借助外部工具處理長文本或者利用外部記憶存儲上下文向量）、模型優化、注意力計算優化三種，而每一種都有公開的研究論文和技術方案。

很快，Kimi"20 萬字 " 的記錄就被他人打破。2023 年 10 月 30 日，Kimi 首發僅過了 21 天，王小川的百川智能就推出了上下文窗口達 192K 的大模型 Baichuan2-192K，單次能處理 35 萬個漢字。11 月，王座再次易位，李開複成立的零一萬物，又發布了能夠處理約 40 萬字的大模型 Yi-34B，是 Kimi 的約 2 倍。

長文本帶來的模型競速，最根本的原因，還是在于看到了龐大的消費群體。

"C 端用戶對大模型的需求無外乎兩種，一是提效工具，二是娛樂工具。" 一名 AI 從業者告訴 36 氪。他認爲，目前 AI 對短文本的理解和生成能力，還沒完全超過人類，比如看咨詢、寫短文案，" 人用在修改 AI 生成的文案的時間，其實不比自己從頭想來的少。"

但大模型相較于人的競争力，恰恰在于理解長文本的效率。"10 萬字的論文，一般人讀完起碼要 30 小時，還是在不休息的情況下，但大模型隻要幾分鍾。"

一名法律行業 AI 産品經理向 36 氪提及，問答機器人、模拟法庭等 AI 産品在專業度高、實踐性強的法律行業都跑不通，唯一能跑通的隻有對判決文書等長文本的總結，而 "Kimi 是目前律師等法律專業用戶認可度最高的一款 AI 産品 "，不少律師用 Kimi 來總結資料，輸出法律文書。

Kimi 的火爆，是苦于 C 端變現途徑的大廠所垂涎的。在大模型落地的打法上，體系龐大的大廠們，采用的基本是模型 + 雲服務、AI 功能 + 原有産品的保守打法。在 B 端，這樣的打法初見成效。百度在 2023 年的财報中，強調了大模型對雲等 B 端業務的推動。

但大模型對 App、搜索等 C 端産品營收的助推，依然是個謎。百度财報顯示，2023 年 12 月，百度 App 的月活達 6.67 億，同比增長了 3% ——然而，這個數字與 9 月的 6.63 億基本持平，不及 6 月的 6.77 億。

而 Kimi 證明了，不采用和其他産品的 " 打包 " 模型，大模型本身也有拉新造血的潛力。通過月之暗面這個對手，大廠們完成了對長文本的市場驗證。

Kimi 的難題是商業模式，大廠的難題是獲客

但要讓長文本真正造血，廠商們擔心的仍然是高昂的成本。

日前，Kimi 的獲客成本就引發了讨論。據新浪科技獲得的數據，算上廣告投放和算力成本，Kimi 每個用戶的獲客成本達 12-13 元，按照近一個月 17804 的日均下載量計算，Kimi 每日的獲客成本高達 20 萬元。

Kimi 在 B 站投放的廣告。

每日 20 萬元的獲客成本，加之随着參數規模水漲船高的大模型研發費用，對尚未商業化造血的月之暗面而言，燒錢的局面依然要維持一段時間。

初創公司的另一難題，則在于如何運營如此龐大的用戶群體，并提供穩定的服務。2024 年 3 月 21 日下午，由于用戶數超出負荷，Kimi 的 App 和小程序一度無法正常使用，用戶需要排隊等待。

但月之暗面的困境，對于作爲後來者的大廠們而言并非難題。億歐智庫 2022 年 3 月的數據顯示，中國互聯網企業的平均獲客成本在 380-580 元之間。

可以說，Kimi 人均不到 20 元的獲客成本，對于大廠而言，反倒是用更低的獲客成本，找到了新的流量入口。

而在服務質量上，算力資源、人力資源充足的大廠，更容易輸出穩定的服務。而在技術上，一名 AI 從業者告訴 36 氪，将可以處理 1000 萬字的通義千問後和 Kimi 比較，可以發現同等文本的解讀，通義千問的總結完成度略高一籌。甚至于，360 的長文本功能，增加了摘要和思維導圖的能力。

但後來者的劣勢，也恰恰在于失去了先發優勢和辨識度。

當面向龐大的 C 端用戶，亮眼的營銷手段顯得格外重要。被當成過河搭石的 Kimi，勝在有一個别出心裁的亮相，早早就貼上了 " 長文本 " 的标簽，在一衆大模型模糊的面孔中打出了差異化。至少提到 " 長文本 "，用戶腦海中最先跳出的，大概率是月之暗面的 Kimi。

而大廠的包袱，還在于要爲用戶提供更完整、更複雜的産品體系。不少體驗過各家大模型産品的用戶都告訴 36 氪，大廠模型産品的 UI 設計、插件生态很複雜，功能過多，導緻用戶的需求要經過多步操作解決。但 Kimi 的界面很簡潔，對于用戶而言，使用門檻反而降低了。

Kimi 首頁。

Kimi 的爆火已經爲商業化創造了時機。月之暗面表示，有用戶反映是否可以用付費解決等待的問題，今年公司會有初步的商業化方案。

隻是找到合适的商業模式，證明自身的造血能力，是月之暗面接下來面臨的考題。面對異軍突起長文本之戰，當 Kimi 在用戶前構築了一道付費牆，能否貼牢 " 長文本第一家 " 的标簽，還未可知。

歡迎交流