大模型創業江湖,又來了兩位重磅大牛。
張家興,粵港澳大灣區數字經濟研究院(IDEA 研究院)講席科學家、認知計算與自然語言中心負責人,被曝已經啓動了創業項目,而他站在他身後,以顧問身份出現的是知名 AI 大牛、IDEA 研究院創始理事長沈向洋。
量子位獲悉,張家興新公司據說代号深度空間,大方向是打造大模型底座,希望瞄準 B 端市場打造企業級應用。
以及大牛創業多的是排隊想進的投資者。所以即便項目尚未官宣,也隻是小圈子裏所知,但首輪估值已經高達3 億美元(折合人民币 20 億)。
而張家興,從過往履曆和能力來看,确實也值這個價。
去年開源中文版 Stable Diffusion
張家興,北京大學電子系博士畢業,師從侯士敏;本科階段在南開大學學習嵌入式系統。主要研究領域爲 AI、DL 和分布式系統。
加入 IDEA 研究院之前,先後就職于百度、微軟、阿裏巴巴,曾任微軟亞洲研究院研究員、360 數科首席科學家。
△張家興
在微軟亞洲研究院期間,2014 年,深度學習框架研究正處于萌芽期。張家興在工作Minerva(發表于頂會 NIPS,即後來的 NeurIPS)中,提出用高級語言表述網絡結構和用數據流圖(dataflow graph)來解耦網絡結構和執行引擎。
——這是後來出現的 Tensorflow、Pytorch 等主流深度學習框架的核心設計理念。
同年,他在 NIPS 發表的另一篇論文《Attentional Neural Network: Feature Selection Using Cognitive Feedback》裏提出了Attentional Neural Network,以認知概念作爲 query 對輸入進行選擇。
這個概念的提出,比 attention 成爲主流早了一年。
△《Attentional Neural Network: Feature Selection Using Cognitive Feedback》
公開資料顯示,離開 MSRA 後,張家興先是任職阿裏巴巴螞蟻金服 AI 資深算法專家," 從零到一創建了阿裏巴巴和螞蟻集團的深度學習團隊 "。
又以360 數科(原 360 金融)首席科學家的身份," 組建了 360 數科的 AI 數據融合中台部門 "。
2021 年,張家興加入 IDEA 研究院,角色是認知計算方向負責人,參與過 IDEA 研究院發布的 " 悟道 · 文源 " 等大模型項目。
去年,AIGC 在文生圖領域刮起一陣風暴,張家興帶領團隊開源了第一個以中文爲主的 AI 繪畫模型太乙——它被稱爲中文版的 Stable Diffusion,并在 11 月 1 日推出純中文版本和中英文雙語版本。
據透露,太乙的訓練數據量超過了 1 億中文圖文對。
△太乙根據提示詞 " 小橋流水人家,水彩 " 生成的畫作
張家興曾對外表示,在 IDEA 前作 Taiyi-CLIP-Roberta-large-326M-Chinese、Taiyi-Diffusion-532M-Nature-Chinese 等的基礎上,太乙團隊從全力投入到完成面世," 用時不足一個月 "。
在 IDEA 同時推進的還有他帶領團隊創建的" 封神榜 " 大模型開源計劃,截至去年年底,共開源了 88 個模型。
今年 2 月底舉辦的 "2023 全球人工智能開發者先鋒大會 " 上,張家興曾在圓桌讨論上公開表達:
我也是在這一波 ChatGPT 創業的大潮裏邊,準備入局。
不過一個來月,張家興已經身體力行地動起來了。
不僅自己躬身入局,還拉了 IDEA 研究院理事長沈向洋一同在大模型之路上探索。
新公司還有誰?
在新公司擔任顧問的沈向洋,是 IDEA 研究院的創立者,包括 ACM 和 IEEE 等全球計算機頂級組織的 Fellow,前微軟乃至科技巨頭裏最具權勢的華人高管。
他博士畢業于 CMU 計算機學院,是圖靈獎得主 Raj Reddy 的學生,主要緻力于計算機視覺、圖形學、人機交互、統計學習、模式識别和機器人等領域。
後來沈向洋與李開複、張亞勤、洪小文共同參與創建影響深遠的 MSRA。
此外,他還是微軟必應、微軟小冰等一系列知名産品的領導打造者,并因計算機視覺和圖形方面的研究成就享譽世界。
△沈向洋
2019 年 11 月,微軟對外公告稱:全球執行副總裁、AI 及技術研發體系負責人沈向洋博士,将于 2020 年 2 月正式從微軟退休。
于是 2020 年開始,沈向洋揮别了任職 23 年之久的微軟。
但他并未遠離 AI 江湖,沈向洋先後出任了小冰公司、Newsbreak 的董事長,其後又親自參與創辦了 base 粵港澳大灣區的 IDEA 研究院成立,擔任創始理事長。
在沈向洋的帶領下,IDEA 迅速集結起大批人才,其門生故吏雲集,迅速打響了影響力。不僅沒落下去年爆火的 AI 繪畫,打造并開源太乙模型,今年的 AIGC 浪潮也沒有落伍。
而且就在最近—— IDEA 還發布了 zero-shot 的視覺應用Grounded-SAM,把目标檢測、分割、生成幾大視覺 AI 功能 all in one。
發布至今不足半個月,已經在 GitHub 上狂攬 7.2k 星。
張家興談大模型
不過目前,還不知道張家興爲何 " 出走 " 創業,或者新項目和 IDEA 研究院之間是否存在關聯。
張家興原本就是沈向洋在 MSRA 治下的老兵,但後來加盟螞蟻集團,後來又輾轉 360 擔任首席科學家。
2021 年 6 月,張家興正式加入 IDEA 研究院擔任認知計算方向講席科學家 。做爲認知計算方向的負責人,帶領團隊,在認知計算和自然語言相關的各個方向進行前沿探索。
他最近一次公開亮相是今年 3 月,在 2023 全球 AI 開發者先鋒大會現場,他與幾位微軟系老朋友,縱論大模型和 ChatGPT 變革後的世界,他認爲 ChatGPT 的出現,開啓了一個新十年。
并且這個新的十年,就是Generative + General,就是未來是屬于生成式 AI 和通用 AI 的。
在這次讨論中,張家興還留下了名言:
如果我們套用《三體》裏面非常著名的一句話," 物理學不存在了 ",那麽我們今天從某種意義上也可以說,NLP 技術不存在了。
— 聯系作者 —