圖片來源 @視覺中國
文 | 産業家,作者 | 鬥鬥 ,編輯 | 皮爺
今年 4 月份,斯坦福和谷歌的研究者共同創建了一個 " 西部世界小鎮(Westworldsimulation)",在這個小鎮裏,25 個智能體可執行類似人類的日常行爲,比如起床後做早餐然後去上班,藝術家作畫,作家寫作。
這些就是如今人們共同談論的 "AI Agent 實驗 "。而在國内的今年下半年,大模型市場的玩家們,似乎正齊刷刷地轉向 AI Agent ——這個清晰可見的 AGI 終局産品。
一組數據顯示,截止 11 月中旬,AI Agent 賽道發生融資事件 13 起,總融資金額約 735 億人民币,公司融資均值爲 56.54 億人民币。
而在國外,這一領域亦是火爆。" 至少有 100 個項目正緻力于将 AI 代理商業化,近 10 萬名開發人員正在構建自主 Agent。" 外媒 MattSchlicht 曾表示。
AI Agent 爲何如此火爆?
關于 AI Agent 的想象力,一個高贊回答是:" 大語言模型隻能編個貪吃蛇,而 AI Agent 可以整出一個王者榮耀。"
成熟的 AI Agent 可以使軟件生産大幅降低成本。未來 Coding 工作流中會很多 Agent 臨時寫成的軟件和測試方案,不追求長期的可複用性,可以随用随抛。目前一家軟件行業巨頭動辄上萬甚至十萬人,有了 AI Agent 之後研發、交付需要耗費的人力和資金将大幅降低。而且使得軟件可以靈活地解決更多長尾需求。
此外,AI Agent 或将爲 LLM 搭建一套框架來進行深度思考和分析,從而做出更複雜和可靠的決策。
總之,就像微軟創始人比爾 · 蓋茨所說的那樣:" 誰能主宰個人助理 Agent,那才是大事。因爲你将永遠不去搜索網站,不去生産力網站,不去亞馬遜。"
值得注意的是,在這種巨大的技術變革下,目前我們仍沒有切身體會到 AI Agent 所帶來的紅利和變化。很明顯,AI Agent 的發展仍面臨一些難題。
一些值得探讨的問題是,國内外 AI Agent 的發展現狀如何?AI Agent 落地的關鍵點是什麽?以及 AI Agent 未來是怎樣的?
AI Agent 現狀,海外 VS 本土
目前,國内一些科技公司已經産出了數個知名大模型,因此孕育而生的 Agent 智能體應用也開始逐漸進入大衆視野。
例如百度将文心大模型應用到智能搜索、自動駕駛;阿裏将通義千問模型應用到高德地圖、優酷,盒馬等産品。華爲将其盤古模型應用到智能氣象、語音識别等。
一家叫面壁智能的創業也公司推出了他們的 AI Agent 産品 ChatDev,可以在短時間内完成一個軟件或者一個小遊戲的開發,用戶所需要做的,隻是提供給它一個要求。
值得注意的是,協同辦公領域似乎是巨頭們做 AI Agent 的 " 必經之地 "。
例如釘釘魔法棒套件中,從聊天 AI、文檔 AI、會議 AI、宜搭 AI、TeambitionAI 等都彙集了釘釘 AI 産品能力;騰訊會議中的 " 會議助理 " 功能提供了一些智能化的支持,如自動總結會議紀要、轉錄和翻譯;百度推出的智能工作平台如流搭載了文心大模型,可以實現智能創作、智能推薦等功能;字節跳動旗下的辦公軟件飛書宣布推出智能 AI 助手 "MyAI",旨在提升團隊協作效率。
曾有投資人對媒體調侃:" 十個 AI 應用裏面,五個辦公 Agent,三個 AIGC,還有兩成是回春的數字人。"這不僅是國内 AI Agent 發展的現狀,其實從國外一些諸如谷歌、微軟等企業也在将 AI Agent 落于協同辦公場景。
其實在海外,AI Agent 概念從出現到爆發,已經邁過多個階段。
在單一 Agent 階段,主要是針對不同領域和場景的特定任務,開發和部署專門的智能體。以 GPTengineer 爲例,給它一個需求,其就可以把代碼寫個大概。
而多 Agent 合作階段,是由不同角色的 Agent 自動合作完成複雜的任務。例如在 MetaGPT 上,如果讓其做一個股票分析的工具,它會把這個任務分别翻譯給産品經理、架構師、項目經理等 5 個角色,模拟整個的軟件開發中所有決策工作流。
不過,随着微軟全新工具 AutoGen 的發布,AI Agent 很快翻開了新的篇章。
AutoGen 允許多個 LLM 智能體通過聊天來解決任務。LLM 智能體可以扮演各種角色,如程序員、設計師,或者是各種角色的組合,對話過程就把任務解決了。這與 MetaGPT 不同,MetaGPT 的角色模型是被定義好的,而 AutoGen 可以讓開發者自己定義 Agent,還可以讓他們相互對話。
這是一個新的且富有創造性的 Agent 框架。在 AutoGen 發布的兩個星期内,星标量從 390 狂增到 10K,并在 Discord 上吸引了 5000 多名成員。
微軟在 AI Agent 的布局較早。2023 年 3 月 Microsoft365Copilot 發布,在當時便提示了一種基于 LLM 的應用開發範式,即 Agent。目前,微軟 CopilotStudio 已經支持自定義 ChatGPT 助手無縫集成在 CRM、ERP、OA 等日常辦公系統中。
可以發現微軟的 AI Agent 能力主要是從其本身業務衍生出來的,AutoGen 更像是一種自身基于業務所打造的能力的外放,這與 OpenAI 并不相同。
OpenAI 開發的 GPTs,以及推出的 GPT-4Turbo 和可定制 AI Agent,使得每個人都可以打造自己的大模型應用。諸多業内人士認爲,超低的創建門檻和 APP Store 一樣的商業模型,會讓 OpenAI 快速構建 GPTs 生态。
OpenAI 提供的是基礎 Agent 的構建能力,如工具調用、基于知識庫文件記憶能力等。這項産品的發布,使得 AI Agent 進入了另外一個新階段,即爲人人都可以打造自己的 Agent 提供了一種可能性。
值得注意的是,目前海外已經在零售、房地産、旅遊、客戶服務、人力資源、金融、制造業等多個領域出現 AI Agent 架構與産品。
例如零售領域的亞馬遜 Alexa、Aktify、Regie.ai 等;房地産領域的 Epique、propertypen、Listingcopy 等;客戶服務領域的 Agent4、Ebi.Ai、JasonAI、Aide 等;人力資源領域的 AutonomousHRChatbot、AIInterviewCoach、CareersAI 等。
總體來看,在 AI Agent 在底層技術、架構以及具體産品應用等方面都較爲完善。像 OpenAI、微軟、谷歌這類科技巨頭,有着先發優勢。另一個可以看到的現象是,國内 AI Agent 的深度與廣度仍有所差距。
一個值得思考的問題是,Agent 落地的關鍵是什麽?
Agent 落地的關鍵:模型?行業經驗?還是載體?
當前市場上的大多數 Agent,包括 OpenAI 推出的 GPTs,其實隻是構建了一個基于特定知識庫或專業數據的 Chatbot。這些智能體主要用于進行問答交互,如獲取行業資訊、報告等。
然而,在程序聯動和操作方面還有很大的提升空間。目前,我們還無法直接使用 GPTs 來操作 SAP 或金蝶等 ERP 系統,因爲這涉及到 API 的應用、授權、維護以及無 API 管理軟件的連接問題。
對于企業而言,如果 GPTs 等 AI 智能體僅用于知識問答,那麽其作用将非常有限,就像一個玩具一樣,因爲它目前還無法深入到企業的業務流程中。
這背後的原因有很多,包括模型能力、行業經驗、場景貼合度等,都會影響 Agent 的能力體現。
AI Agent 需要具備感知環境、做出決策并執行适當行動的能力。在這些關鍵步驟中,最重要的是理解輸入給 Agent 的内容、進行推理、規劃、做出準确決策,并将其轉化爲可執行的原子動作序列,以實現最終目标。
目前,許多研究利用 LLM 作爲 AI Agent 的認知核心,這些模型的發展爲完成這一步驟提供了質量保證。因此,基于 GPT-4 的 Agent 表現得更加智能。
但就目前而言,包括 GPT-4 在内的所有大模型,能力仍需提升。
" 底座模型問題都還很大,AI Agent 真正落地還要等更優秀的模型。"某位身處大模型技術一線的業内人士對産業家說。
不過針對模型能力不足這一問題,智譜 AI& 清華 KEG 提出了一種對齊 Agent 能力的微調方法 AgentTuning,該方法使用少量數據微調已有模型,顯著激發了模型的 Agent 能力,同時可以保持模型原有的通用能力。
AI Agent 的行業經驗對于其落地也至關重要。
" 如果一篇論文提出了某種不同的訓練方法,OpenAI 内部的 Slack 上會嗤之以鼻 , 因爲這些都是我們玩剩下的。但是當新的 AI Agents 論文出來的時候 , 我們才會認真興奮的讨論。" 這是 OpenAI 聯合創始人 AndrejKarpathy 最近發表的一段講話。
簡而言之,我們基于大模型能做出什麽樣的東西,說到底還是要靠行業經驗,而這恰是 OpenAI 等一衆大模型巨頭們所欠缺的。
要知道,企業要引入 AI Agent 進行流程優化,必須經過成本控制、投入預算、實現效率、安全管控等多方面嚴格及缜密的評估。這就要求技術供應商提供的必須是平台級解決方案,而不是隻針對單一、個别場景需求來提供的 AI Agent 自動化解決方案。
大型企業引入新的 AI 技術不允許任何試錯成本,因此技術供應商給出的解決方案必須是開箱即用、具備行業 Know-How 術語和業務規則的真實智能體數字員工。也隻有這樣的标準化 AI Agent,才能被納入企業的内部編制中去統一管理和調度。
例如,一個醫療行業的 AI Agent 需要具備醫學知識,并能夠理解和處理醫療數據。一個金融行業的 AI Agent 需要具備金融知識,并能夠理解和處理金融數據。
AI Agent 的落地效果也受限于應用場景。在如出行預訂中,得益于豐富的 API 等問題,AI Agent 表現出色。而在如法律助手場景中,由于新知識的頻繁出現和 API 的不完善,實際應用面臨更多挑戰。
這一點,從國内 AI Agent 紛紛生長于協同辦公平台就可見一斑。
事實上,協同辦公平台本身具備良好的 API 接口和插件體系,這使得将大模型集成到現有工具中變得更加容易。
此外,許多企業和組織都在使用協同辦公軟件,這意味着大模型可以迅速覆蓋大量的潛在用戶。廣泛的用戶基礎可以加速大模型的叠代和優化過程,使其更好地滿足用戶需求。
還有大量的數據資源助于提高模型的性能,豐富的場景也可以推動大模型技術持續改進。
釘釘、飛書和企業微信在作爲 Agent 載體時,也各自具有不同的優勢。釘釘提供了完善的組織架構管理功能,可以方便地創建、管理和調整團隊架構,使得企業能夠快速搭建适應其需求的組織結構。
飛書強調實時協作和溝通,支持多人在線編輯文檔、共同讨論等功能,有助于團隊高效地完成協作任務。其特有的一體化,使得整個辦公流程更加标準化。
企業微信與微信互通,這使得其 AI Agent 有可能借助微信龐大的用戶數據和應用場景,提供更加個性化和場景化的服務。
站在這個角度來看,國内 AI Agent 紮堆協同辦公領域,則變得理所當然。而找到一個适合 AI Agent 落地的場景或者說載體更爲重要。
不過,除了協同辦公,還有許多其他載體可能更适合 AI Agent 的落地應用。
例如智能客服、智能助手、RPA、CRM 等。具體來看,在智能客服方面,AI Agent 可以自動回答用戶的問題,處理投訴和建議,提高客戶滿意度和效率。在智能助手方面,蘋果公司的 Siri、谷歌公司的 GoogleAssistant 和亞馬遜公司的 Alexa 都是智能助手的代表。
在智能流程自動化方面,許多企業采用智能流程自動化工具,如 UiPath、BluePrism 等,來自動完成某些特定的業務流程。
在智能營銷方面,許多營銷平台都集成了 AI Agent,如 HubSpot、Salesforce 等。這些平台的 AI Agent 可以通過數據分析和機器學習技術,提供精準的營銷建議和預測,幫助企業更好地了解客戶需求,提高銷售業績。
總而言之,模型能力是核心,行業經驗是關鍵,載體是保障。無論是模型能力還是行業經驗抑或是載體都是 AI Agent 落地的關鍵。值得注意的是,國内的軟件業态,倒逼國内廠商造就了一身定制化、個性化能力,這種能力側面驗證了國内企業在技術落地上的潛力,這将會進一步推動 Agent 的落地。
AI Agent 的終局是什麽?
在文章開篇的 " 西部世界小鎮(Westworldsimulation)" 裏,這些智能體可以與别人和環境交流(互相注意到彼此舉動、發起對話或者問候)、反思這些觀察結果(形成獨特的個人觀點)、制定每天的計劃。他們擁有自己記憶和目标,會産生可信的個人和湧現的社交行爲,而不是通過預先設計實現。
例如從用戶指定的單一任務開始,即一個 AI Agent 想要舉辦情人節聚會,AI Agent 們在接下來的時間裏會自發的傳播邀請、認識新朋友、互相約出參加聚會的日期,并協調在正确的時間一起出現在聚會上。
這是 Agent 項目裏具有代表性的應用。人們之所以爲這個項目感到驚訝,是因爲 Agent 的交互出現了人類意料之外的現象。AI Agent 爆發的一段時間,人們普遍認爲補齊了大模型短闆的 AI Agent 更具備實用性,将是大模型重要落地方向。
随着 Agent 的構建越發簡單,Agent 生态的成熟會讓 C 端 Agent 出現百花齊放的局面,面對用戶,Agent 将會更加接地氣,引起新一輪的爆發。
但就目前而言,這一路徑的商業化存在諸多問題。拿遊戲場景而言,目前收費主要來源于出售遊戲裝備、皮膚等方式。而 AI Agent 的價值無法體現在這些固有的變現途徑上。并且就目前 Agent 落地效果來看,未出現颠覆性的能力,C 端用戶是否會爲其買單無法得知。
更值得注意的是,随着讓 C 端 Agent 百花齊放,其應用價值方面也随邊際效應而無限趨向于更小量級。換言之,AI Agent 能否成爲 AI 大模型從 C 端商業化爆發一個最核心應用方向,還需時間驗證。且即使未來會成爲 C 端商業化爆發一個最核心應用方向,但其 " 壽命 " 并不長。
一個事實是,AI Agent 最終的落腳點或将在 B 端。
比爾蓋茨認爲,智能體作爲下一個平台,将會影響人們使用軟件的方式以及軟件的編寫方式。它更擅長查找信息并爲用戶總結信息,能夠會爲用戶找到最優惠的價格,将取代搜索網站及電商網站,也将取代文字處理器、電子表格和其它生産力應用程序。并且,現在各自獨立的搜索廣告、廣告社交網絡、購物、生産力軟件等,都将變成智能體這一項業務。Agent 會徹底改變應用軟件的打開方式。
這些變革來臨之前,相對于 Agent 本身帶來的影響,如何構建一個 Agent,是一個更值得關注的問題。
Agent 構建平台上,企業或将可以自己構建自己 RPA、CRM、辦公 OA 等一系列管理軟件;軟件廠商也可以基于此平台構建軟件爲企業提供服務。
對于身處或準備進入 AI Agent 領域的玩家而言,找到切入點以及好的商業模式至關重要。
未來 AI Agent 的發展将不僅僅局限于單體智能,而是會擴展到物的智能和機器人的聯動。
從群體智能的角度來看,ToC 可能會形成更大的社區化虛拟組織,每個人的 Agent 都能通過虛拟數據連接在一起;而 ToB 則可能形成虛拟的組織和企業,不同的企業和員工都能通過智能體納入到網絡當中。
最終,整個社會将變成一個巨大的虛實結合的網絡,形成 " 智聯網 "。在這個網絡中,不同的智能體将提供更強的生産力,重新塑造整個生産關系,從而提升整個社會的産能。
因此,AI Agent 的發展前景非常廣闊,它們将不斷擴展其應用範圍和影響力,爲未來的社會發展帶來巨大的變革和機遇。
時至今日,AI Agent 雖然帶來了諸多想象力,卻仍舊存在諸多質疑。技術發展之路本就充滿質疑與批判,科技變革對于任何一個企業與個體都是一場機遇,關鍵在于如何把握它。