大模型賽道又有融資新動态:
語言大模型玩家瀾舟科技,剛剛完成了 Pre-A+ 輪融資。
本輪融資由北京中關村科學城公司領投,斯道資本和創新工場跟投。這是瀾舟科技 1 年内收獲的第 2 輪融資,2 輪累計總額數億元。
不止于此。和融資消息一同公布的還有瀾舟科技推出的語言生成模型,孟子 MChat 可控大模型。
它有類 ChatGPT 的能力,加上原來瀾舟科技孟子大模型 N 個項目功能引擎,最終呈現出來的 MChat,既有對話能力,又具備翻譯、生成、信息搜索等能力。
關于 MChat,瀾舟科技創始人兼 CEO 周明還作了如下介紹:
将陸續推出 10B 和 100B 參數級的大模型;
具備聊天、問答、翻譯、文本生成、信息抽取等多種能力;
可融合搜索結果、領域數據和知識圖譜;
對功能、風格、人類認知等方面具可控性。
孟子 MChat 可控大模型
本次融資是創新工場對瀾舟科技的 " 繼續跟投 "。
創新工場董事長兼 CEO 李開複在 3 月 14 日的趨勢分享會上談到,AI 已經來到從 1.0 邁入 2.0 的拐點。
順着這個思路,MChat 可以視爲瀾舟科技嘗試從平台和基礎設施兩個層面邁入 AI 2.0 時代的具體動作:
首先,發布叠代而來的孟子 MChat 可控大模型,視其爲通用底座,提供語言預訓練模型、多模态預訓練模型、垂直領域預訓練模型等能力。
其次,再在其上架構能力平台,提供知識圖譜、輔助寫作、機器翻譯等模塊化能力。
據周明介紹,團隊走訪了 100 多家公司,發現市場需求迥異。這種情況下,瀾舟科技認爲在更垂類的賽道做定向優化顯得尤爲重要。
也因此延伸出孟子大模型技術體系的特點之一,更多樣化。
具體而言,就是孟子支持 BERT(分析類)、GPT(生成類)和 T5(翻譯類)等架構,能夠覆蓋閱讀理解、文本生成、機器翻譯、對話等不同場景。
值得注意的是,MChat 雖然具有 ChatGPT 同樣的對話能力,但兩者有所不同。
ChatGPT 盡可能将多模态數據納入訓練庫,數據量越大越好,不甄别數據好壞;
而 MChat 強調" 可控性 "。
一是功能可控,即根據具體需求加減可調用的具體功能;二是結果可控,保證輸出内容的健康、良性。
" 未來我們是想繼續探索從 AI 1.0 到 2.0 到 AGI," 周明說," 不過 AGI 有點太遠,但下一步已經确定,就是從單語言擴展到更多的語言。"
選擇在這個時間點進軍 AI 2.0 時代,瀾舟科技似乎地利不足,放眼大模型創業領域,千帆競賽;但好處是已有諸多鋪墊,且孟子輕量化模型的能力已經經過驗證。
MChat 背後依托的孟子大模型,是瀾舟科技自研技術研發的大規模預訓練語言模型,于 2021 年 7 月推出。
可處理多語言、多模态數據,同時支持多種文本理解和文本生成任務,快速滿足不同領域、不同應用場景的需求。
與追求打造 AGI 不同,基于 Transformer 架構的孟子,行進路線是輕量化——僅包含 10 億參數。
靠這 10 億參數,孟子大模型在中文語言理解領域最具權威性的測評基準CLUE上屢次刷榜第一,四兩撥千斤,擊敗其他公司百億甚至千億的模型。
到具體的應用層面,同花順、華夏基金爲代表的金融領域,以及中文在線代表的文案寫作領域,瀾舟科技都以孟子大模型爲底座提供了能力支撐。
NLP 大牛周明
瀾舟科技是以 NLP 技術爲基礎的認知智能公司,由 AI 大牛周明創辦的公司,成立于 2021 年 6 月。
周明,當今 NLP 領域成就最高的華人之一,他不僅是中國第一個中英翻譯系統的研制者,還在 2019 年成爲 AI 語言領域最高級頂會 ACL(國際計算語言協會)主席。
1991 年在 NLP 重鎮哈工大拿到博士學位後,周明進入清華任教;1999 年被微軟亞洲研究院創始院長李開複挖走,後來不久成爲 NLP 研究組負責人。
2020 年離開 MSRA 加盟創新工場擔任首席科學家時,周明已擔任 MSRA 副院長多年。
從工作 21.5 年的 MSRA 出走的原因,周明有些戲谑地解釋:
"2020 年年底,我隐隐約約感知到未來大模型要興起,所以毅然決然離開微軟,成立瀾舟科技,專門從事大模型研究。"
據介紹,除了孟子大模型外,目前瀾舟科技已經開源了近 20 個大模型。
如果真如李開複所說,AI 來到了從 1.0 過渡到 2.0 的拐點,這對 NLP 意味着什麽?
周明一邊提到,AI 2.0 反映在 NLP,能看到 GPT 這樣的通用模型,一套模型解決很多問題,效率大幅提升;一邊又提出了兩個現象:
一是 AI 2.0 時代的 NLP 能力足夠強,在處理新任務時隻需用一個提示詞來代替它的能力;
二是模型大到一定程度時,會湧現新的能力,尤其是會迸發出一些從未見到過的能力。
他個人表示出對新能力湧現的格外關注,因爲湧現這件事目前還是未解之謎," 唯一能啓迪你的是在能力範圍之内,盡量把模型做的比較大 "。
ChatGPT 身上的邏輯和思維能力,就是由 GPT 系列模型的大力出奇迹出品。既然如此,瀾舟科技會不會也在模型參數上加碼?
周明直截了當地回答,瀾舟不會去追從千億、萬億大模型。
我們會尊重大模型,把模型做到相當大,但同時快速考慮它的落地。
關于大牛周明和他對大模型的最新思考,歡迎鎖定 3 月 29 日量子位舉辦的中國 AIGC 産業峰會,周明博士已經确認出席并帶來最新思考。
— 聯系作者 —