智譜 AI 的大模型産品智譜清言(圖片來源:钛媒體 App 編輯拍攝)
随着 OpenAI 即将推出 GPT-5,國内人工智能(AI)大模型正加速追趕。
钛媒體 App 1 月 16 日消息,阿裏、騰訊投資的 AI 公司智譜 AI 在北京發布全新自研的第四代多模态基座大模型 GLM-4 系列,稱性能相比上一代全面提升接近 60%、模型性能直接逼近 GPT-4," 特别是中文能力可比肩 GPT-4",并且該公司還公布 GLMs 個性化智能體模型等産品。
同時,智譜 AI 今天還公布一項由智譜聯合生态夥伴發起的大模型創業基金 "Z 計劃 ",總投入 10 億元人民币,專門支持大模型原始創新,覆蓋大模型算法、底層算子、芯片優化、行業大模型和超級應用等方向。
智譜 AI 公司 CEO 張鵬表示,此次 GLM-4 的發布及上線,是智譜 AI 大模型研發上的關鍵突破。他強調,爲了瞄向 AGI,公司每 3-6 個月更新一次做一次升級,上一代智譜解決的是模型能力矩陣的對标,這一次是模型能力上跟 GPT-4 做到基本對齊,"GLM-4 的基本能力已經比肩 GPT-4。"
智譜 AI 公司 CEO 張鵬
據悉,智譜 AI 成立于 2019 年,脫胎于清華大學計算機系知識工程研究室團隊,是清華大學知識成果轉化的創業公司,瞄準 AI 大模型研發落地,公司 CEO 張鵬畢業于清華計算機系,總裁王紹蘭爲清華創新領軍博士,清華大學計算系教授唐傑也參與研發中國最大規模預訓練模型悟道 2.0。
2020 年,智譜 AI 開始啓動 GLM 預訓練架構的研發,緻力于打造新一代認知智能大模型,專注于做大模型的中國創新,并訓練出 100 億參數模型 GLM-10B;2021 年利用 MoE 架構成功訓練出萬億稀疏模型;2022 年公布 1300 億級超大規模預訓練通用模型 GLM-130B,并以此打造大模型平台及産品矩陣。
2023 年初,智譜 AI 推出千億基座的對話模型 ChatGLM,并開源單卡版模型 ChatGLM-6B 等,部署于個人開發者和企業應用領域。6 月,智譜發布 ChatGLM2,包括 6B、130B、12B(120 億參數)、32B、66B 等參數的模型,推理速度增長 42%。據張鵬透露,相比 GPT-4 版的 ChatGPT,ChatGLM2-12B、32B 和 66B 性能分别提升 16%、36% 和 280%。
2023 年 10 月,智譜 AI 公布 ChatGLM3-1.5B、3B 和 6B(15 億、30 億、60 億)參數版本,在多模态理解、代碼模塊、網絡搜索等能力上有所提升,而且相對最佳開源模型推理速度提升 2-3 倍。同時,基于集成自研 AgentTuning 技術,在智能規劃和執行上比 ChatGLM-2 提升 1000%。另外,ChatGLM3 還利用華爲昇騰生态,使算力推理速度提升 3 倍以上。同時,該公司也進行商業化探索,打造 AIGC(生成式 AI)模型及産品矩陣,包括已獲批上線的智譜清言、高效率代碼模型 CodeGeeX 等。
融資方面,創立至今的四年多,智譜 AI 已完成四輪融資,投資方包括君聯資本、啓明創投、中科創星、美團、螞蟻、阿裏、騰訊、小米、金山、順爲、Boss 直聘、好未來、紅杉、高瓴等多家機構,去年融資額超過 25 億元人民币。目前,智譜 AI 估值超過百億,是國内 AI 領域獨角獸企業。
公開信息顯示,截至目前,智譜 AI 開源模型在 Hugging Face 的全球下載量已超過 1100 萬次,GitHub 累計有超過 5 萬 Stars。
此次,智譜 AI 首屆技術開放日(Zhipu DevDay)上,主要公布三個重要消息:GLM-4 系列多模态模型的發布,上線全新 GLM-4 的 All Tools(所有工具)、GLMs 個性化智能體定制能力,以及發起并聯合成立多個大模型開源基金、商業化進展,從而拓寬智譜 AI GLM 系列模型生态。
首先是 GLM-4 系列模型。具體來說,GLM-4 可支持 128k 的上下文窗口長度,單次提示詞可以處理的文本可以達到 300 頁。同時,它的推理速度更快,支持更高的并發,大大降低推理成本,而且文生圖和多模态理解等方面都得到了一定增強。
據張鵬透露,在支持中文的文字寫作、數學計算、邏輯推理等 AlignBench 對齊能力基準測試中,GLM-4 達到 GPT-4 的 95%-116% 的水平;中英文的指令跟随能力方面,GLM-4 基本能達到 GPT-4 的 80% 左右水平;在支持總結、信息抽取、複雜推理能力的 LongBench 基準測試中,GLM-4 128k 版本達到 81.1 分,超過了 GPT-4(71.2)。
其次,GLM-4 的 All Tools 是全新的智能體能力展示,可實現自主根據用戶意圖,自動理解、規劃複雜指令,能力完全自動,自由調用網頁浏覽器、代碼解釋、多模态文生圖、文件處理、數據分析、圖表繪制等複雜任務;GLMs 個性化智能體定制功能則是支持用戶用簡單的提示詞指令創建屬于自己的 GLM 智能體,包括實現自動寫代碼、幫老師設計豐富有趣教學方案的教案設計師,或是能根據關鍵詞快速生成 Logo 的畫師等。
在會議現場,張鵬同時預告,GLMs 模型應用商店開發者分成計劃也将同期公布。
最後是關于基金和生态部分,智譜 AI 共公布了四個基金項目:一、其聯合發起了 CCF- 智譜大模型基金、SMP- 智譜大模型交叉學科基金,去年爲全國 30 餘所高校參與的 41 個研究項目累計提供超過 1000 萬元資金和算力支持;二、今年智譜 AI 還發起大模型開源基金,提供 1000 張 GPU 卡、1000 萬元現金支持、1000 億免費 API tokens;三、智譜 AI 也将 "Z 計劃 " 進一步升級,聯合生态夥伴發起總額 10 億元基金,支持大模型創業項目的創新探索,目前已公開投資了聆心智能、無問芯穹等項目。
商業化層面,目前智譜 AI GLM 系列模型與德勤、火山引擎、蒙牛、中國電信、金山軟件、芒果 TV、馬蜂窩、華泰證券等數十家公司合作,應用于政務、金融、能源、制造、醫療等領域,支持 10 餘種國産硬件生态。張鵬透露,除了 To B 端業務落地,未來智譜 AI 還将做 To C 端超級應用,目的要把閉環做起來,給未來也留下一個可能性。
钛媒體 App 了解到,目前智譜 AI 主要銷售三類技術服務:數字人 SaaS/PaaS 方案,科技情報 SaaS/PaaS 方案,以及包括 ChatGLM 系列在内的認知大模型 PaaS/MaaS 平台方案。
張鵬對外透露,2023 年下半年,公司簽單客戶約有幾百家,2023 年整體有億級簽單額。
對于中國大模型與 GPT 的差距,據騰訊新聞深網,張鵬表示,目前兩者還處于追趕、縮小差距态勢,主要是國産大模型起步比 OpenAI 晚,因此需要不斷積累去調整發展速度、曲線的斜率,隻有算法、系統工程、數據、應用到落地等鏈條所有的創新累加起來,才有可能去超越 GPT。
此前張鵬曾表示,在規模和核心能力上,國内研發的大模型與世界先進水平差距約一年左右。
中國科學院院士、清華大學教授張钹卻認爲,大語言模型(LLM)仍存在不自知、質量不可控、不可信、不魯棒(受提示詞影響)等問題," 幻覺 " 錯誤也很多。然而,盡管如此,但他卻依然支持大模型技術發展,他認爲 AI 産業發展一直受制于特定領域、特定模型和特定任務的限制,難以做大做強,因此發展比較緩慢,而大模型給行業提供了發展通用硬件和軟件的更多機會。
" 我想經過 2023 年的充分競争,現在我們逐漸可以說進入一個決戰時刻了。"張鵬表示,智譜 AI 将希望與 AI 行業所有的參與者、産業鏈上下遊合作夥伴、開發者社區、學術界一同努力,爲中國 AI 未來發展貢獻綿薄之力。
(本文首發钛媒體 App,作者|林志佳)