智譜 AI CEO 張鵬
大模型 " 獨角獸 " 智譜 AI 公布最新的 AI 應用進展。
钛媒體 App 11 月 29 日消息,在上午北京智譜 GLM OpenDay 上,智譜 AI 發布 AutoGLM 及 GLM-PC 兩款 AI 智能體産品。
其中,AutoGLM,基于智譜自研的 " 基礎智能體解耦合中間界面 " 和 " 自進化在線課程強化學習框架 ",是智譜第一個産品化的智能體 Agent,通過文字 / 語音指令模拟人類操作手機,實現大模型從 " 言 " 到 " 行 " 的範式轉變,目前已經 " 百萬内測 " 開放申請;GLM-PC 則是基于 CogAgent 模型的視覺理解和任務規劃能力,操作計算機的桌面應用,用戶通過簡單的一句話即可實現複雜任務的快速執行,同時具有任務規劃、屏幕界面信息理解的能力,能夠根據頁面信息進行計劃更改和自我糾錯,根據用戶的指令完成任務。
智譜 AI CEO 張鵬表示,Al Agent 今天非常火,從蘋果的 Apple Intelligence、谷歌的 Jarvis,到 OpenAI 即将發布的 Operator,全球科技巨頭紛紛布局。而國内智譜率先開放 AutoGLM 内測,已受到很多關注,過去一個月申請頁面已經有超過 100 萬的用戶訪問。
會後,張鵬對钛媒體 App 等透露,大家對于大模型的期待值過高,當然這畢竟是一個高投入的事情。信息的理解在于底層的技術,但底層技術并不是一個簡單的單項能力,如果想讓它做生産力工具,面對的是全面性的需求,可能會存在特别明顯短闆,所以智譜不止是技術上的布局,還需要産業生态的布局。智譜主要定位是 " 開放平台 ",助力大家去做原有産品的改造,有能力的探索。
" 确實,因爲數據和訓練規模原因,Scaling Law 可能不像我們之前預測的一樣,還是會指數級往上漲。但是你放更寬的範圍來看這件事,我們不隻單獨去看,所以我們不止要看現象,而是要看這個現象的本質,我們都在尋找。相對來說,我們依然還是比較樂觀,我覺得 Scaling Law 還是有很大的空間,延續我們帶來的技術增長。" 張鵬稱,相對于語音,視覺 Scaling Law 還是在漲的,因此他認爲,計算量可能是 Scaling Law 發展趨勢的最佳解釋。
針對于發展端側 Agent 之後,智譜是否還做預訓練基座大模型,張鵬沒有進行回應。
據悉,成立于 2019 年的智譜 AI,由清華大學計算機系的技術成果轉化而來,源自清華大學知識工程(KEG)實驗室,是國内最早入局大模型賽道的公司之一,也是目前國内 " 大模型六小虎 "(智譜、百川、月之暗面、零一萬物、MiniMax、階躍星辰)之一。
自 2023 年 3 月智譜 AI 推出千億開源基座對話模型 ChatGLM 系列以來,GLM 大模型經曆四個大版本叠代,共發布了超過 20 款 AI 模型技術和産品。
智譜 AI 聚焦于基座模型的研發投入,落地方向以 TO B 賽道爲主,以 TO C 賽道爲輔。談及國内的大模型賽道,張鵬曾表示,國内大模型賽道過于擁擠以至内耗,更符合商業規律的模式應走向分層——先基座大模型,再行業側模型,再面向更加細分場景的推理模型。國内創業生态在分層方面較美國略慢,而美國在多樣性方面選項會更多。
To B 端層面,截至 2023 年底,智譜 AI 已擁有超 2000 家生态合作夥伴、超 1000 個大模型規模化應用,覆蓋傳媒、咨詢、消費、金融、新能源、互聯網、智能辦公等多個細分場景。
融資方面,智譜 AI 已完成九輪融資,總額接近 60 億元人民币。
其中,2023 年智譜 AI 累計融資額超過 25 億元人民币,投資方包括君聯資本、啓明創投、中科創星、美團、螞蟻、阿裏、騰訊、小米、金山、順爲、Boss 直聘、好未來、紅杉、高瓴等多家機構;2024 年 3 月,北京市人工智能産業投資基金參與投資智譜華章;今年 6 月,沙特阿美(Aramco)旗下風險投資部門管理的基金 Prosperity7 投資智譜 AI,本輪總融資額達到 4 億美元(約合人民币 28.94 億元);今年 9 月,北京海澱設立的市場化投資平台中關村科學城公司宣布,以投前 200 億元估值領投智譜華章(智譜 AI)新一輪融資,金額達數十億元。
如今,智譜全面發力 AI 智能體應用。
事實上,智譜已在芯片、應用 app、操作系統 OS 和模型側進行了長時間、全鏈路布局。
2023 年 4 月,AgentBench 項目啓動;今年 1 月,智譜 All Tools 能力率先發布,它能自動調用代碼解釋器、web 浏覽器和文生圖模型等;今年 4 月,AutoWebGLM 公布,成爲首個全面超越 GPT-4,網頁浏覽能力的模型。此外,智譜與高通、三星、英特爾、榮耀、華碩等端側芯片、手機、電腦廠商合作,聯合發力大模型應用,在 AIPC、智能助手等領域落地。
張鵬認爲,通過端側芯片性能優化和端雲一體架構;Agent 不僅在操作系統 OS 和應用 App 上實現用戶體驗變革,還能将其推廣到各類智能設備上,實現基于大模型的互聯互通。
如今,今天的 Agent 可以做到像人一樣,理解界面、規劃任務、使用工具、完成任務,從而更聰明地代替人類行動。
他分析稱,大模型發展至今開始逐步具有上述人類與現實物理世界互動的能力:L1 語言能力進程 80%、L2 邏輯能力(多模态能力)60%、L3 使用工具的能力進程 30%,甚至 L4 自我學習的能力也正在逐漸出現。
" 大家都知道,大模型不隻是 Chatbot,它的價值遠超于 Chatbot。其本質在于對世界的 " 理解 " 能力以及序列輸出能力。過去兩年,智譜緻力于将這種 " 理解 " 能力融入各行各業及各種場景,與在場衆多客戶和夥伴進行了大量實踐。在探索的過程中,我們也不斷思考大模型的 " 序列輸出 " 意味着什麽,以及應以何種形式呈現。我們認識到,輸出形式不僅限于語言文本,更可以擴展至圖像視頻,甚至是操作 /Action。我們的階段性成果就是大家今天看到的 Agent 應用。" 張鵬稱。
" 當然,雖然展現出比較大的進步,但與人類的表現相比 Agent 仍有較大差距。目前我們人類毫不費力完成的一些操作 (滾動、拖動、縮放),對 Agent 來說也是極具挑戰的。因此在 L3 階段,智譜今天的理解是才走到 30%。" 張鵬稱,盡管目前技術還比較初期,但 Agent 的未來應用已經展現出了強大的前景。目前的 Agent 能力更像是在用戶和應用之間,增加一個智能的調度層,鏈接所有應用甚至是所有設備。這可以看做是大模型通用操作系統 LM-OS 的一種雛形。
會後交流時,張鵬表示," 所以很多時候我們看待問題,它更多的是一個技術導向,二個是最終的目标導向,而不是僅僅局限于單項技術的快速變現。我們還是最終的目标還是面向的是說,最終要幫助大家切切實實的去解決生産力的問題,而非簡單盈利。所以,我們需要更中長遠去做這個事情,從生态建設上也是一樣,就像今天我們可以看到,很多夥伴、很多客戶其實是在我們開放的技術體系之上構建發展自己的應用和商業價值。"
" 爲用戶創造價值,這個是最重要的。我們無意跟這些(廠商)強,而是我們再找其他新的方式,讓用戶得到最真實的價值,讓他們自己去投票。操作系統在合作,嘗試把我們的 AI 能力去合作進去。" 張鵬稱。
談到 AI 智能體和搜索關系,張鵬提到,在辦公應用場景中,AI Agent 助手可以幫你解決一些問題,提升工作效率,所以智譜希望推動 AI Agent 技術本身的應用産生價值。而搜索是一個重要場景。
張鵬強調,AI Agent 已經對人機交互形式産生極大的影響。未來,基于大模型智能能力(從 L1 到 L4 乃至更高),有機會實現原生的人與機器交互的方式 LM-OS,這将從根本上改變人與機器交互的方式。
" 人的需求往懶惰方向走,但技術永遠是在幫助大家解決問題。" 張鵬稱,
(本文首發于钛媒體 App,作者|林志佳,編輯|胡潤峰)