在國内競争激烈的 " 百模大戰 " 中,智譜 AI 被業界寄予厚望:這家成立于 2019 年的公司,是國内最早研發大模型的企業之一,由清華大學知識工程實驗室(KEG)技術成果轉化而來;在今年 10 月底,智譜 AI 官方宣布,年内已經累計完成 25 億元的融資。業内也有分析稱,其估值已超過 150 億元。
2024 年開年,智譜 AI 公布了最新動态。1 月 16 日的首屆技術開放日上,智譜 AI 團隊展示了其三年多來積累的技術成果,并發布了新一代基座大模型 GLM-4。智譜 AI 的 CEO 張鵬表示,新一代國産全自研的基座大模型 GLM-4,中文能力已可比肩 GPT-4。他還稱,2024 年将是 AGI(通用人工智能)元年。
(圖源 / 智譜 AI)
01 GLM-4 模型全家桶來了
還記得 OpenAI 在去年的首屆開發者大會吧?讓所有的 AI 創業者幾乎都夜不能寐——除了 GPT-4 性能升級,包括 128K 的上下文長度、更強的控制能力,模型提升多模态能力、知識升級等之外,用戶可以打造專屬于自己的 GPTs。這場大會上提到的 GPT 商店,也在 2024 年實現——今年 1 月 11 日淩晨,OpenAI 在其官網發布公告,正式上線了業界期待已久的 GPT store。
而在智譜 AI 的開放日上,我們也看到了國内企業追趕 OpenAI 的不懈努力。
在大語言模型預訓練框架中,存在不同的技術路徑。像 OpenAI 選擇的是 GPT,而智譜 AI 則自研了 GLM 預訓練架構。2019 年成立後,公司就在做相關的算法研究;2022 年 8 月,智譜 AI 的雙語千億級預訓練模型 GLM-130B 正式上線。在當年的斯坦福大學大模型中心對全球主流大模型進行全方位評測中,GLM-130B 成爲亞洲唯一入選模型,并在準确性等部分标準方面被認爲,已與 GPT-3 持平。
據資料顯示,目前智譜是唯一全内資、國産全自研的大模型企業。CEO 張鵬曾對市界表示,這對智譜 AI 的商業化也是有利的。畢竟,安全性已經成爲大模型領域最受關注的問題,而自研也意味着風險可控。2023 年 8 月底,作爲 8 家首批通過備案的大模型公司之一,智譜 AI 推出了 AI 助手 " 智譜清言 "。
也因此,在業内,智譜 AI 曾被視作是最具有 "OpenAI 氣質 " 的大模型公司。
在智譜 AI 看來,GLM-4 的發布及上線,是其大模型研發上的關鍵突破。在開放日上,其技術團隊也重點介紹了 GLM-4 的性能。
據智譜 AI 表示,GLM-4 的整體性能相比上一代實現了大幅提升,逼近 GPT-4。比如說,它可以支持更長的上下文,具體來說,GLM-4 可以支持 128k 的上下文窗口長度;單次提示詞可以處理的文本,可以達到 300 頁之多。同時,多模态能力方面,文生圖和多模态理解都得到了增強。同時,它的推理速度更快,支持更高的并發,大大降低推理成本。
現場舉的例子裏,像 " 魚眼鏡頭中,有一隻烏龜坐在森林裏 ",以及 " 一隻打扮的像 20 世紀 80 年代的職業摔跤手的博美犬,臉上塗着霓虹綠、霓虹橙,還有亮綠色的顔料 " 這樣複雜的提示詞,模型也作出了基本準确的理解。
(圖源 / 智譜 AI)
此外,GLM-4 的 All Tools 能力 " 全家桶 " 發布——這也讓人聯想起了 OpenAI 的 "GPT Store"。據了解,GLM-4 的 All Tools 能力完全自動,而且可以處理各種任務,比如包括文件處理、數據分析、圖表繪制等複雜任務,支持處理 Excel、PDF、PPT 等格式的文件。
在去年 6 月,OpenA 就提出 Agent 是 AI 應用層的發展方向。AI Agent 是一種能夠感知環境、進行決策和執行動作的智能實體。360 集團創始人周鴻祎在日前的 "2023 年風馬牛年終秀 " 上也預測,Agent(智能體)将激發大模型潛能,成爲超級生産力工具。
智譜 AI 表示,GLM-4 大幅提升了智能體能力。GLM-4 All Tools 實現了自主根據用戶意圖,自動理解、規劃複雜指令,自由調用網頁浏覽器、Code Interpreter 代碼解釋器和多模态文生圖大模型以完成複雜任務。
對标 OpenAI 推出的 " 自定義 GPT" —— GPTs,智譜 AI 發布的 GLMs 個性化智能體定制功能也在開放日同時上線。用戶用簡單的提示詞指令就能創建屬于自己的 GLM 智能體。智譜 AI 表示,這也是爲降低大模型使用門檻所做的努力。
02 構建大模型生态之路,需要共同努力
在大模型紛紛開放後,國産大模型競争已進入新階段,大模型的商用化也提上日程。在此前張鵬曾對市界坦言,智譜一直在思考通用大模型和垂直行業大模型之間的關系。在當下的時間段内,通用大模型在技術上、服務的适配性上還有不足,而不同行業内低成本、快速滿足某些特定場景的需求,催生了衆多垂直大模型。但在他看來,行業大模型的發展,仍然無法脫離通用底座,提升通用大模型的能力和實用性,才是最基礎的。
AI 生态的建立,還是要依賴底層技術的發展上,它們是相輔相成的。" 通用模型和行業模型,不是并行競争的關系,而應該是合作關系。後者以前者爲底座,站在它們的肩膀上往上走。" 張鵬曾如是說。
智譜 AI 自己也在推動大模型在産業場景中的應用。在智譜 AI 的官網上顯示,其主要擁有大模型 MaaS 平台、AMiner 科技情報平台和認知數字人三塊主要業務。在此基礎上,智譜 AI 形成了産品矩陣,除了數字人和 AMiner 外,還包括 AI 助手、編程、寫作、繪畫等大模型産品。
和 GPT-4 相比,國内大模型的能力仍然還需要繼續提升。新階段的 " 百模大戰 ",還在持續進行中,企業的技術實力,仍然還是在這場競争中勝出的決定性因素。
國内大模型生态的創建,也需要不同主體的共同參與。
2024 年,智譜 AI 計劃發起開源開放的大模型開源基金,其中包括三個 " 一千 ":将爲大模型開源社區提供 1000 張卡,助力開源開發;提供 1000 萬元的現金,用來支持與大模型相關的開源項目;爲優秀的開源開發者提供 1000 億免費 API tokens。
張鵬表示,智譜 AI 也将聯合生态夥伴發起總額 10 億元的大模型創業基金,用于支持大模型原始創新,覆蓋大模型算法、底層算子、芯片優化、行業大模型和超級應用等方向。
" 大模型創新研發是一條長征路,我們希望與人工智能行業所有的參與者、産業鏈上下遊合作夥伴、開發者社區、學術界一同努力。" 他說。(作者 | 楊潔 編輯 | 孫春芳)