AI大牛周明發布MChat：生成可控，參數規模可負擔，順便官宣了新融資

大模型賽道又有融資新動态：

語言大模型玩家瀾舟科技，剛剛完成了 Pre-A+ 輪融資。

本輪融資由北京中關村科學城公司領投，斯道資本和創新工場跟投。這是瀾舟科技 1 年内收獲的第 2 輪融資，2 輪累計總額數億元。

不止于此。和融資消息一同公布的還有瀾舟科技推出的語言生成模型，孟子 MChat 可控大模型。

它有類 ChatGPT 的能力，加上原來瀾舟科技孟子大模型 N 個項目功能引擎，最終呈現出來的 MChat，既有對話能力，又具備翻譯、生成、信息搜索等能力。

關于 MChat，瀾舟科技創始人兼 CEO 周明還作了如下介紹：

将陸續推出 10B 和 100B 參數級的大模型；

具備聊天、問答、翻譯、文本生成、信息抽取等多種能力；

可融合搜索結果、領域數據和知識圖譜；

對功能、風格、人類認知等方面具可控性。

孟子 MChat 可控大模型

本次融資是創新工場對瀾舟科技的 " 繼續跟投 "。

創新工場董事長兼 CEO 李開複在 3 月 14 日的趨勢分享會上談到，AI 已經來到從 1.0 邁入 2.0 的拐點。

順着這個思路，MChat 可以視爲瀾舟科技嘗試從平台和基礎設施兩個層面邁入 AI 2.0 時代的具體動作：

首先，發布叠代而來的孟子 MChat 可控大模型，視其爲通用底座，提供語言預訓練模型、多模态預訓練模型、垂直領域預訓練模型等能力。

其次，再在其上架構能力平台，提供知識圖譜、輔助寫作、機器翻譯等模塊化能力。

據周明介紹，團隊走訪了 100 多家公司，發現市場需求迥異。這種情況下，瀾舟科技認爲在更垂類的賽道做定向優化顯得尤爲重要。

也因此延伸出孟子大模型技術體系的特點之一，更多樣化。

具體而言，就是孟子支持 BERT（分析類）、GPT（生成類）和 T5（翻譯類）等架構，能夠覆蓋閱讀理解、文本生成、機器翻譯、對話等不同場景。

值得注意的是，MChat 雖然具有 ChatGPT 同樣的對話能力，但兩者有所不同。

ChatGPT 盡可能将多模态數據納入訓練庫，數據量越大越好，不甄别數據好壞；

而 MChat 強調" 可控性 "。

一是功能可控，即根據具體需求加減可調用的具體功能；二是結果可控，保證輸出内容的健康、良性。

" 未來我們是想繼續探索從 AI 1.0 到 2.0 到 AGI，" 周明說，" 不過 AGI 有點太遠，但下一步已經确定，就是從單語言擴展到更多的語言。"

選擇在這個時間點進軍 AI 2.0 時代，瀾舟科技似乎地利不足，放眼大模型創業領域，千帆競賽；但好處是已有諸多鋪墊，且孟子輕量化模型的能力已經經過驗證。

MChat 背後依托的孟子大模型，是瀾舟科技自研技術研發的大規模預訓練語言模型，于 2021 年 7 月推出。

可處理多語言、多模态數據，同時支持多種文本理解和文本生成任務，快速滿足不同領域、不同應用場景的需求。

與追求打造 AGI 不同，基于 Transformer 架構的孟子，行進路線是輕量化——僅包含 10 億參數。

靠這 10 億參數，孟子大模型在中文語言理解領域最具權威性的測評基準CLUE上屢次刷榜第一，四兩撥千斤，擊敗其他公司百億甚至千億的模型。

到具體的應用層面，同花順、華夏基金爲代表的金融領域，以及中文在線代表的文案寫作領域，瀾舟科技都以孟子大模型爲底座提供了能力支撐。

NLP 大牛周明

瀾舟科技是以 NLP 技術爲基礎的認知智能公司，由 AI 大牛周明創辦的公司，成立于 2021 年 6 月。

周明，當今 NLP 領域成就最高的華人之一，他不僅是中國第一個中英翻譯系統的研制者，還在 2019 年成爲 AI 語言領域最高級頂會 ACL（國際計算語言協會）主席。

1991 年在 NLP 重鎮哈工大拿到博士學位後，周明進入清華任教；1999 年被微軟亞洲研究院創始院長李開複挖走，後來不久成爲 NLP 研究組負責人。

2020 年離開 MSRA 加盟創新工場擔任首席科學家時，周明已擔任 MSRA 副院長多年。

從工作 21.5 年的 MSRA 出走的原因，周明有些戲谑地解釋：

"2020 年年底，我隐隐約約感知到未來大模型要興起，所以毅然決然離開微軟，成立瀾舟科技，專門從事大模型研究。"

據介紹，除了孟子大模型外，目前瀾舟科技已經開源了近 20 個大模型。

如果真如李開複所說，AI 來到了從 1.0 過渡到 2.0 的拐點，這對 NLP 意味着什麽？

周明一邊提到，AI 2.0 反映在 NLP，能看到 GPT 這樣的通用模型，一套模型解決很多問題，效率大幅提升；一邊又提出了兩個現象：

一是 AI 2.0 時代的 NLP 能力足夠強，在處理新任務時隻需用一個提示詞來代替它的能力；

二是模型大到一定程度時，會湧現新的能力，尤其是會迸發出一些從未見到過的能力。

他個人表示出對新能力湧現的格外關注，因爲湧現這件事目前還是未解之謎，" 唯一能啓迪你的是在能力範圍之内，盡量把模型做的比較大 "。

ChatGPT 身上的邏輯和思維能力，就是由 GPT 系列模型的大力出奇迹出品。既然如此，瀾舟科技會不會也在模型參數上加碼？

周明直截了當地回答，瀾舟不會去追從千億、萬億大模型。

我們會尊重大模型，把模型做到相當大，但同時快速考慮它的落地。

關于大牛周明和他對大模型的最新思考，歡迎鎖定 3 月 29 日量子位舉辦的中國 AIGC 産業峰會，周明博士已經确認出席并帶來最新思考。

— 聯系作者 —