圖片來源:企業官方
藍鲸新聞 11 月 29 日訊(記者 朱俊熹)" 幫我創建一個面對面群聊,在群聊裏發個一萬的紅包,數量爲一百個,名字爲‘ AI 給你發的第一個紅包’。" 在 11 月 29 日舉辦的 Agent OpenDay 現場,智譜 AI CEO 張鵬對着手機裏的智能體 AutoGLM 發出以上語音指令。除了因現場同時進群的人數過多,導緻 AutoGLM 一時未能馬上加入群聊外,數百位群成員很快就成功領取到了微信紅包。
今年 10 月,國内大模型獨角獸智譜 AI 推出能夠模拟人類操作手機的自主智能體 AutoGLM,并開啓内測。在最新的 OpenDay 活動上,智譜 AI 除了帶來升級後的 AutoGLM,還發布了基于 PC 的自主智能體 GLM-PC,主打能夠像人一樣操作計算機。
智譜 AI 表示,新升級的 AutoGLM 可以挑戰完成更複雜的任務。據張鵬現場演示,通過 AutoGLM 在美團 App 上采購火鍋食材時,該智能體能夠自主執行 54 步無打斷操作。在這一過程中,AutoGLM 可以理解并記住複雜指令,在速度表現上也略快于人手動操作。
升級後的 AutoGLM 不再局限于單一應用内的操作,而是支持跨 App 操作。例如,用戶可直接對 AutoGLM 輸入指令:" 在美團和餓了麽上對比一點點的烏龍奶茶的價格哪個更便宜 ",它就會自主完成打開不同 App、比價甚至下單購買等一系列操作。
最新發布的 Auto 産品 GLM-PC 則将交互終端進一步拓展至電腦端,智譜 AI 稱這是其 GLM 團隊 " 面向‘無人駕駛’ PC 的一次技術探索 "。據官方介紹,目前第一階段 GLM-PC 的内測體驗場景包括發送信息、參與會議、文檔處理、網頁搜索與總結、遠程和定時操作等。此外,還将于明年一季度推出隐形屏幕功能,讓人和 GLM-PC 能夠使用同一台電腦工作,在提高協作效率的同時,又不會影響人類用戶使用物理屏幕。
在演示視頻中,當用戶下班後沒帶電腦,但領導要求發送電腦上的某份文件時,用戶就可以用手機給 GLM-PC 發消息來實現遠程遙控。GLM-PC 能夠自動進行電腦操作,幫用戶找到并發送指定文件。但若涉及到最終發送等關鍵步驟,GLM-PC 會彈出提醒窗口,待人工确認後才會繼續執行操作。
張鵬表示,GLM-PC 使用電腦的方式幾乎完全和人一樣。理論上,隻要是爲人類設計的應用,GLM-PC 在學習之後都能夠執行。它所基于的模型僅需視覺截圖作爲輸入,而不依賴 HTML、API 等傳統接口。因此,其能力上限更高,具備跨平台、跨系統的泛化能力,可以應用到任意的圖形用戶界面。
" 不過,由于 PC 的複雜程度,以及大家在 PC 完成的幾乎都是複雜任務,坦率的說,今天大模型的能力距離真正代替大家辦公還有一定距離。" 張鵬補充稱,"GLM-PC 在目前的内測體驗中,用戶仍需要輸入非常精準的指令。"
近來,Anthropic、OpenAI、谷歌等不少國外科技企業也瞄向了 AI 接管人類設備這一領域,已推出或正在開發相關 AI 産品。據智譜 AutoGLM 技術負責人劉潇現場分享,在探索智能體的過程中,團隊發現 AutoGLM 智能體和 OpenAI 的推理模型 o1 從本質上服從同一套 Scaling Law(擴展定律)。o1 模型通過推理過程中的自我反饋監督來持續提升其性能,智能體則通過和環境進行交互,獲得來自環境的反饋和監督信号,滿足類似 o1 的規模擴展效應。
劉潇表示,在 o1 scaling 的基礎上,還觀察到智能體存在的能力湧現。例如,随着進一步的訓練和規模的擴展,AutoGLM 能夠在一個月的時間内,從完成單應用、短距離任務進化到初步勝任跨應用、長距離任務。即使 AutoGLM 從未與微信小程序進行過任何交互式訓練,當下達 " 幫我在微信的 Tims 咖啡小程序裏下單柑橘美式 " 的指令,并給出一些關鍵步驟的建議時,AutoGLM 依然能夠完成操作。
智譜 AI 稱,希望通過規模擴展,未來進一步提升 AutoGLM 的泛化能力,支持更廣泛的商業場景。其中一個重要的落地方向便是智能硬件,智譜希望将其智能體推廣到手機、電腦、汽車、眼鏡等各類終端設備上。過去半年以來,智譜已與榮耀、華碩、小鵬等衆多終端廠商達成合作,相關技術負責人也紛紛亮相此次 OpenDay 活動。