來源:獵雲精選,文 / 王非
在 OpenAI 的文生視頻模型 Sora 引發廣泛關注的當下,國内這家 90 後清華學霸創辦的大模型公司,持續受到知名機構追捧。
今日,月之暗面(Moonshot AI)被爆完成超 10 億美元新一輪融資,投資方包括紅杉中國、小紅書、美團、阿裏,老股東跟投,投後估值達約 25 億美元。
就在春節前的 2 月 3 日,月之暗面則被爆正在進行 2 億美元融資,由螞蟻和阿裏集團共同投資,投前估值預計 15 億美元。
針對 " 最新一輪融資 ",月之暗面對獵雲網表示," 感謝關注!公司對具體融資信息暫不方便評論。月之暗面過去未來一直堅持推進中國 AGI 領域的底層關鍵技術進步及産品創新,也會持續匹配與公司發展階段相應的資本策略,期待未來有更多好消息與大家分享。"
事實上,成立于 2023 年 4 月的月之暗面在融資披露方面 " 鮮有明确說法 "。針對成立僅兩個月就被爆完成的首輪融資,創始人楊植麟于 2023 年 10 月 " 更正 " 道,公司已獲得紅杉資本、今日資本、砺思資本等知名機構近 20 億元投資。
而這,也是月之暗面成立近一年來,唯一一次準确的融資披露。
清華學霸創業,攜手同門組建全明星陣容
月之暗面之所以能在成立之初就獲得頭部 VC 押注,與 90 後楊植麟本人的 " 學霸 " 身份、豐富經曆,關系匪淺。
清華求學時,楊植麟師從清華大學計算機系知識工程實驗室(KEG)帶頭人,智源研究院學術副院長、悟道項目負責人唐傑教授。最終他以滿分成績通過所有程序設計課程,并以年級第一的成績畢業。
随後在 2015 年,楊植麟進入卡内基梅隆大學(CMU)語言技術研究所(LTI),跟随蘋果公司 AI 負責人 Ruslan Salakhutdinov 和 Google AI 智能首席科學家 William W. Cohen 攻讀博士學位。
畢業後,楊植麟曾效力于谷歌大腦研究院和 Meta(Facebook)人工智能研究院,是 Transformer-XL 和 XLNet 的第一作者。其中,XLNet 模型曾在 18 項自然語言任務中取得了好于谷歌 BERT 的效果,是當時 NLP 領域熱門的國際前沿模型之一。
據不完全統計,楊植麟曾在 ICLR、NeurIPS、ICML、ACL、EMNLP 等計算機頂會發表論文 20 餘篇,研究成果累計 Google Shcolar 引用超過 17000。
目前,楊植麟還是清華大學交叉信息研究院的助理教授,研究方向:大規模預訓練,自然語言處理,自然語言理解與生成,少樣本學習,零樣本學習,多模态學習。
90 後的楊植麟,在大模型領域,可謂聲名顯赫:循環智能、智譜 AI、智源研究院……到處都有他的名字和身影。
同時,楊植麟和團隊也曾作爲核心研發成員,參與 Google Bard、Gemini、Einstein、盤古、悟道等大模型的研發,發明包括 TransformerXL、XLNet、RoPE、Detectron2、Group Normalization 在内的 AI 領域裏程碑式的成果,被諸如 Google PALM、LLaMa 等模型采用。
天眼查 App 信息顯示,月之暗面由楊植麟持股 78.97%,擁有絕對控制權。圍繞在他身邊的創業夥伴,同樣實力非凡,不容小觑。
月之暗面聯合創始人周昕宇持有公司 10% 股份,他和楊植麟、張宇韬,是清華大學計算機科學與技術系 2011 級本科的同學。在大四時,周昕宇就加入各方面都符合他标準的曠視實習,并在畢業之後正式加入,工作内容是算法量産,就是要把算法的生産效率提高很多倍。
作爲持股 5.96% 的第三大股東,月之暗面聯合創始人吳育昕畢業于清華大學與卡耐基梅隆大學,曾獲 2018 年歐洲計算機視覺會議(ECCV)最佳論文提名。在 2018 年 10 月的 GeekPwn 國際安全極客大賽上,IYSWIM 是 6 個參賽團隊中,唯一一個破解人臉識别算法的團隊。吳育昕當時以 IYSWIM 團隊的身份參賽,據他介紹," 自己(以個人名義報名參賽,有名隊友沒有來到現場)用了谷歌的 FaceNet 開源代碼模型攻破了該算法 "。
此外,楊植麟的同門師兄張宇韬,目前持有公司 5% 股份。公開資料顯示,張宇韬本碩均在清華大學計算機系就讀。他的研究方向是異構數據融合和知識圖譜構建,在 KDD、CIKM 等計算機頂會上發表多篇文章。他作爲技術負責人,參與了科技大數據分析平台 AMiner 的研發。
大語言模型後,正秘密研發通用多模态模型
憑借豪華的團隊陣容與深厚的積累,月之暗面成立不到半年,便于 2023 年 10 月宣布在 " 長文本 " 領域實現了突破。
據楊植麟介紹,針對于 " 大模型輸入長度受限帶來的應用困難 ",月之暗面正式推出了首個支持輸入 20 萬漢字的大模型 moonshot,以及搭載該模型的智能助手産品 Kimi Chat。
随後,他以 Kimi Chat 的一些實際使用案例,進行了詳細介紹。以輸入整本《月亮與六便士》爲例,Kimi Chat 可以和用戶一起閱讀,幫助用戶更好地理解和運用書本中的知識:
相比當前市面上以英文爲基礎訓練的大模型服務,Kimi Chat 具備較強的多語言能力。例如,Kimi Chat 在中文上具備顯著優勢,實際使用效果能夠支持約 20 萬漢字的上下文,2.5 倍于 Anthropic 公司的 Claude-100k(實測約 8 萬字),8 倍于 OpenAI 公司的 GPT-4-32k(實測約 2.5 萬字)。
同時,Kimi Chat 通過創新的網絡結構和工程優化,在千億參數下實現了無損的長程注意力機制,不依賴于滑動窗口、降采樣、小模型等對性能損害較大的 " 捷徑 " 方案。
就在今年 1 月 26 日,Kimi Chat 最新發布了 "v1.3 迎春版 ": 基礎模型能力全面升級,用友聯網搜索能力、上下文學習能力、文學創作能力、語言翻譯能力……小程序版 Kimi 智能助手,則已支持中英文語音輸入。
需要的是,近期,OpenAI 的文生視頻模型 Sora,憑借突破一分鍾的時長,再加上演示視頻的高度逼真和高質量,持續引發關注。
據多方消息報道,月之暗面也正在秘密研發通用多模态模型,預計今年内将推出。
換言之,在以文本爲主的大語言模型領域取得階段性進展的月之暗面,未來也将在以圖像、視頻爲主的多模态模型領域,與 OpenAI 等國内外同行展開較量。
而月之暗面在資本市場上的 " 動作頻頻 ",似乎也正是在爲更高的訓練成本,更大量的資金和人才需求,做更充足的準備。
以團隊規模爲例,月之暗面在 2023 年 10 月有 50 人左右,目前該公司團隊人數則已超 80 人。
未來,月之暗面在 " 多模态模型 " 領域,究竟能否占有一席之地,我們也将持續保持關注。