以下文章來源于 AI 大模型應用實踐 ,作者秋山墨客
AI 技術正以前所未有的速度改變着我們的工作與生活。2024 年,作爲大模型驅動的重要應用形式之一的 AI 智能體(AI Agents)已經不再隻是科技圈的熱門話題,而是成爲了各行各業關注的焦點。從自動化簡單任務到協助數據分析,甚至編寫代碼,AI 智能體的應用範圍正在不斷擴大。那麽,這些 AI 智能體是否真的如預期般發揮了作用?企業又是如何将它們融入日常工作流程中的?本次爲大家簡單解析LangChain 公司發布的最新調查報告《State of AI Agents》中的核心觀點,了解 AI 智能體的現狀與未來。
整體應用現狀
AI 智能體被定義爲使用大型語言模型(LLM)來決定應用程序控制流的系統。它們的能力範圍廣泛,從簡單的自動化到複雜的決策支持。調查顯示,約有 51% 的受訪者已經在生産中使用 AI 智能體,而 78% 的受訪者有計劃不久後将 AI 智能體投入生産。這表明,盡管很多潛在用戶對 AI 智能體的興趣很高,但實際部署仍然面臨挑戰。
行業采用興趣
調查發現,不僅技術行業,非技術行業的公司也對 AI 智能體表現出了濃厚的興趣。90% 的非技術公司受訪者表示已經或計劃将 AI 智能體投入生産,與科技公司的 89% 幾乎持平。這顯示了 AI 智能體的跨行業吸引力:已經不再局限在科技型企業,未來将在更多行業與領域得以應用。
主要應用場景
AI 智能體已經在很多領域展示出了強大的應用潛力。調查結果顯示,在三個最重要的應用場景中,58% 的受訪者将 AI 代理用于研究和摘要生成,53.5% 用于提升個人生産力或提供個人助理服務,45.8% 用于客戶服務。例如,AI 智能體可以幫助用戶從大量數據中提煉關鍵信息,或者協助日常任務如日程安排和組織,從而提高個人生産力。在客戶服務領域,AI 智能體也發揮着重要作用,幫助公司處理咨詢、故障排除,并加快客戶響應時間。
智能體的控制與人類監督
AI 智能體是一個具有自我思考與行動能力的智能應用。随着其功能的逐漸強大,對它們的控制和安全性要求也随之提高。調查顯示,大部分人認爲追蹤和可觀察性工具是控制 AI 智能體的首要手段,很多公司還采用了護欄來防止智能體偏離預定路徑。例如,一些公司通過人工專家手動檢查或評估響應,增加了一層預防措施,确保 AI 代理的決策過程透明且可控。
智能體部署的主要挑戰
智能體完成任務的質量是受訪者最關心的問題,也是限制更多智能體部署的最重要因素,其重要性是成本和安全的兩倍多。AI 智能體的不可預測性(主要來自 LLM)增加了錯誤的可能性,使得團隊難以确保智能體始終提供準确、适當的響應。
需要注意的是,小型公司尤其關注任務的性能與質量,45.8% 的小型公司将其作爲主要關注點,而成本僅爲 22.4%。這一差距凸顯了可靠、高質量的任務完成對于組織将智能體從開發轉移到生産是決定性的因素。
當然,智能體的挑戰并不限于任務質量。許多人對構建和測試智能裏的最佳實踐感到不确定,來自于另兩個主要障礙,技術與時間。
技術知識:團隊對智能體構建所需的技術知識儲備不足,尚在學習中。
時間成本:構建、部署、調試、平塗智能體所需的時間投入非常大。
成功案例(海外)
在調查中,Cursor、Perplexity 和 Replit 是最受讨論的 AI 智能體應用。這裏面 Cursor 是一個 AI 驅動的代碼編輯器,幫助開發者編寫、調試和解析代碼;Perplexity 則利用 AI 革新了傳統的搜索引擎的工作與呈現方式;而 Replit 則通過設置環境和配置,加速軟件開發生命周期,讓用戶在幾分鍾内構建和部署功能完備的應用。
最感興趣的智能體能力
随着 AI 智能體的采用,組織在采用與部署時面臨着不斷演變的期望和挑戰。調查顯示,人們對智能體以下能力最感興趣:多步驟複雜任務、自動化重複任務、多智能體任務路由與協作、智能規劃與推理。
以上是 Langchain 公司在最新的 AI 智能體調查報告中展示的核心結論與觀點,我們進行提煉供大家參考。
不得不說,當前 AI 智能體與 RAG 應用(某種意義上也可以把 RAG 看作一種智能體)是在大模型之上最被寄以厚望的應用形态。随着基礎大模型、以及各種理論、框架與實驗性項目的發展與成熟,可以預計,AI 智能體的可靠性、可控性等問題将在未來得以逐步解決,從而将得以更廣闊與深入的應用。可以期待,AI 智能體将以更加深遠的方式塑造我們的世界。
文中配圖來自 LangChain 調查報告,原文參考:
https://www.langchain.com/stateofaiagents