出品|虎嗅商業消費組
作者|苗正卿、王欣
題圖|虎嗅拍攝
1993 年出生的楊植麟穿着一件黑色的月之暗面工裝 T 恤、米白色工褲、帶着黑色半框眼鏡走進了月之暗面北京海澱知春路總部大樓的會議室。他面帶微笑,但略顯腼腆,笑的時候甚至會不經意地用手捂嘴。
此時是 11 月 16 日下午,距離 Kimi Chat 開放恰好一周年。在過去一周,月之暗面被複雜的輿論與情緒包裹環繞,但從楊植麟的神情上看,似乎外界的情緒對他影響并不大。
在稍坐幾分鍾後,楊植麟放下手中的咖啡,站了起來。相比于一年多前,他變得更幽默也 " 社牛 " 了許多,他跟大家寒暄了幾句,還開了幾個小玩笑。但很快,他恢複了原本那個 " 楊植麟 " 的樣子:滔滔不絕地講起技術和數學公式,眼神盡量躲避着與人接觸,而是興奮地盯着屏幕上的代碼與數字。
" 我們希望 AI 去探索,接下來最重要的方向是讓 AI 具備思考的能力。什麽能讓模型鍛煉模型的思考能力呢?我覺得是數學。" 楊植麟說。
緊接着,他講到了伽利略,談到了伽利略的觀點 " 宇宙的底層語言是數學 ",然後亮出他今天第一張牌:他宣布發布 Kimi 新一代數學推理模型 k0-math。在基準測試中,k0-math 的數學能力可對标全球領先的 OpenAI o1 系列可公開使用的兩個模型:o1-mini 和 o1-preview。
在接下來大約 20 分鍾的時間裏,31 歲的楊植麟幾乎化身爲一個 " 高中老師 ",他在現場用大量高考數學題目演示 kimi 數學模型的 " 思考能力 "。他是那樣興奮,以至于一度在近十分鍾的時間裏楊植麟目不轉睛盯着桌面電腦、不看衆人、沉迷講題——像是北大數學天才韋神附體。
" 目前,IMO 題目和高考難題,有一定的概率會做錯。但模型成長很快,去年這些題目正确率 20% 多,今年已經有 90% 多。這個最新的數學模型,估計未來一兩周就會上線。" 楊植麟說。值得注意的是,局限依然存在,kimi 數學模型也會因爲過度思考,而在簡單問題上花費多餘的步驟,同時在生物、化學、物理等學科的泛化性上仍然有待提升。
終于,在沉浸式體驗 30 多分鍾的 " 數學老師角色 " 後,楊植麟從中抽離,然後他回顧了過去一年:" 我們去年也是這一天發布的産品,當時從 1 個用戶開始,現在總用戶數超過 3600 萬。" 在說完這些後,楊植麟如釋重負,狠喝了一口水。
不過人們對于楊植麟的好奇,并不局限于他最新的模型。隻是他在這次與媒體的交流中,并沒有回應一切。
以下是 11 月 16 日下午在月之暗面總部,楊植麟交流實錄:
今年什麽時候決定聚焦 Kimi,去縮減其他産品的?是什麽原因做出這個決定?
楊植麟 :今年 2~3 月份,我做了這個決定。一個是基于美國市場的判斷,一個是基于我們自己的觀察。我們決定必須要做減法,而不是做加法。我會選擇聚焦。以及,我會觀察海外的情況,然後去判斷哪些業務上限最高,接下來思考哪些業務最匹配我們的能力,基于此做聚焦,去把核心的創新能力做好。(虎嗅注:據虎嗅了解,此前月之暗面發力的 ToC 類出海産品 Ohai 和 Noisee,都已經出現了業務調整,或縮減合并到 kimi 本身,或進行項目裁撤)
最近你們有人才流失嗎?如何看待行業内 AI 創業公司被收購、人才回流大廠?
楊植麟:我們沒有遇到人才流失,月暗也沒有出現人才回流大廠的情況。在幾個大模型公司裏,其實我們做的還好,我們一直保持人數最少,保持人和卡的比例保持健康。我們的規模保持在一個合理的狀态,不希望公司人數漲得很猛。對 AI 行業而言,堆規模在一開始或許管用,但從長遠看應該意義不大。所以應該聚焦,不要活生生做成大廠模式。比如說,如果我現在依然三個業務一起做,那我就活生生把自己做成了一個大廠,那我肯定沒有任何優勢。
今年最核心的任務是什麽?
楊植麟 : 用戶留存。這是最關鍵的任務指标,它和你的技術成熟度有正相關,我們還有提升空間。現在模型的思考能力還不夠強,這些能力提高後,用戶留存會繼續上升。
留存提高到多少,符合你的預期?
楊植麟:永無止境。
今年 Kimi 好像投放動作比較大?你們的投流策略是什麽?
楊植麟:對我們而言最核心的是把留存做好,适當的投放是需要的,但平衡需要做好。
思考和交互哪個最重要?多模态是必要的麽?
楊植麟:思考比交互更重要,思考是必要條件,之後才是交互。我覺得思考是當下大模型需要解決的第一要務。我們的多模态在内測,但多模态的前提是模型的思考能力
你怎麽看待超級應用?
楊植麟:已經出現了。ChatGPT 其實已經是了,它有 5 億用戶。就算說它不是一個超級應用,起碼可以算半個吧?起碼說明 ChatGPT 這個模式是被驗證可以做成的。但相比之下,character.ai 這種産品,一開始用戶量很多,但最後發現是很難破圈的。這些海外發生的事情,都是我們的關鍵參照。
如何看待豆包今年猛烈的增長
楊植麟:我們不關注競争本身,競争本身并不産生價值。我們聚焦模型的思考能力、推理能力,去解決怎麽給用戶更大的價值。我覺得關鍵是去做正确的事情,而不是去思考做差異或者爲了競争單獨做什麽。