一周打完1000場官司，中科院發布首個AI法庭AgentCourt

在人工智能重塑各個行業的今天 , 法律界也迎來了前所未有的變革。傳統的法律實踐面臨着效率低下、成本高昂等挑戰，而 AI 技術的出現爲解決這些問題提供了新的可能。

從最初斯坦福小鎮火遍全網，25 個由大語言模型（LLMs）驅動的智能體生活交友，打開了多 Agent 新視角。

而現在，AI 法庭也來了！

最近，來自中科院深圳先進研究院的研究團隊開發了一個名爲 AgentCourt 的模拟智能法庭，

它是一個基于大語言模型 ( LLMs ) 的法庭模拟系統 , 旨在通過 AI 驅動的虛拟法庭來革新法律教育、案例分析和法律研究。

論文地址：https://doi.org/10.48550/arXiv.2408.08089

代碼：https://github.com/relic-yuexi/AgentCourt

AgentCourt 實戰演示：https://b23.tv/e6eQMfM

該系統能夠模拟完整的法庭程序。法官、原告律師、辯護律師以及其他參與者均由大型語言模型驅動的自主代理扮演。他們的主要目标是通過模拟法庭流程來幫助律師代理學習如何有效辯論案件，并提高其整體法律專業技能。

該篇文章的主要貢獻有：

1. 全面模拟，真實再現

AgentCourt 不僅僅是一個模拟工具，它是一個高度複雜的系統，能夠精确模拟民事法庭的設置，實現多方互動和複雜的法律推理。這是首次将 AI 技術應用于法庭環境模拟中，爲法律教育和實踐提供了前所未有的可能性。

2. 對抗性交互，強化法律推理

在 AgentCourt 的模拟過程中，大型語言模型（LLMs）的法律推理能力通過智能體之間的對抗性交互得到了顯著增強。這種利用對抗性多智能體交互的方法，不僅超越了簡單的信息傳遞，更爲未來的相關研究提供了新的視角和思路。

3. 高效模拟，真實案例驗證

該工作成功模拟了 1,000 個中國真實的民事案例，這些案例在 AgentCourt 中僅用數天時間完成，而在現實世界中，這可能需要律師們花費十年時間。通過自動和人工評估方法，驗證了智能體進化的有效性。

爲了盡量真實的模拟法庭，研究人員設置了以下的人物：

1. 原告與被告代理

模拟開始于案件發生之前，兩名由 ERNIE-Speed-128K 驅動的代理分别扮演潛在的原告和被告。一旦涉及案件，他們将自動尋求律師事務所的法律援助，這是法律糾紛中的典型行爲。系統配置使得原告或被告在與律師的互動中可以直接獲得訴狀或答辯狀，無需從頭起草。

2. 律師代理

設計了兩名律師代理，同樣由 ERNIE-Speed-128K 驅動。當原告和被告在律師事務所尋求幫助時，這些律師代理将被随機分配爲原告律師和被告律師。他們與各自的客戶溝通，收集案件相關信息，并利用豐富的法律經驗、案例先例和法定代碼，按照規定程序進行法庭辯論，維護各自客戶的利益。

3. 法官代理

在法庭中，法官負責監督整個過程，聽取雙方律師的論點，并在适當時候提問。最終，法官總結并評估律師的每一輪論點，然後作出最終判決。

4. 法庭書記員代理

爲了創造更真實的法庭環境并促進代理的進化，他們設計了法庭書記員代理，負責宣布審判的開始和記錄審判的全過程。

這些由大模型驅動的 Agent，可以根據初始數據，自發地進行法庭的模拟，而無需任何人工的監督。

數據集

研究人員利用中國裁判文書網的數據，編譯了一個包含 10,000 個民事判決的數據集。預處理的重點是提高數據集質量，精心清洗并選擇了 1,389 個高質量案例，這些案例同時包含原告的訴求和被告的辯護。

爲了解決潛在的重複問題，他們采用了 BERT 進行「案件介紹」部分的語義向量化，并使用 K-Means 聚類對相似文檔進行分組。這産生了 1,000 個代表性文檔，用于模拟法庭訓練和測試。

數據生成與匿名化

利用 ERNIE-Speed-128K API（百度智能雲文檔 2024）生成并匿名化高保真模拟文本，這些文本專門針對民事判決。這産生了一個精選的數據集，包含 1,000 個訓練樣本和 50 個測試樣本，旨在支持模拟法庭環境中強大的法律論證和判決預測，從而推進法律分析技術。

通過這些嚴格的數據處理步驟，AgentCourt 确保了模拟環境的真實性和數據的可靠性，爲法律 AI 的發展奠定了堅實的基礎。

在得到數據後，各個 Agent 各司其職，根據一定的流程展開法庭的辯論。該論文的模拟過程如下：

在模拟完 1000 個民事案例後，原告律師和被告律師的能力都得到了很大的提升，文章中的自動評估和人工評估展示了實驗結果：

實驗基于 1,000 個真實世界的民事案件，通過自動評估和人工評估兩種方式，全面檢驗了 AgentCourt 系統的效能。自動評估采用了 LawBench 評估标準，涵蓋了法律知識的記憶、理解和應用三個層面。人工評估則由經驗豐富的法律專家進行，評估了智能體的思維敏捷性、專業知識性和邏輯嚴謹性。

實驗結果顯示，在 AgentCourt 中經曆了數千次對抗性法律案件模拟（相當于現實世界律師十年的工作經驗），律師代理在處理法律任務的能力上有了顯著提升。無論是在自動評估還是人工評估中，進化後的代理都展現出了更快的響應速度、更深的法律知識和更強的邏輯推理能力，在複雜案件分析、法律推理和辯論策略上 , 部分 AI 律師甚至超越了人類專家的表現。

就像自動評估中的 Article Recitation 任務，經過進化後的律師 Agent 可以較好的背誦出指定法律的内容。而未經進化的律師就隻能「阿巴阿巴」了。

AgentCourt 的出現在未來可能對法律行業産生深遠影響 :

1. 法律教育革新 : 爲法律院校提供高度仿真的實踐平台 , 學生可與頂級 AI 律師對戰 , 快速積累經驗。

2. 提高司法效率 : AI 輔助可以加速案件預審、證據分析等流程 , 減輕法官和律師的工作負擔。

3. 降低法律服務成本 : AI 律師助手可以處理大量初級工作 , 使優質法律服務更加平價可及。

4. 推動法律研究 : 海量案例模拟爲法學研究提供了前所未有的數據支持 , 助力發現新的法律模式和理論。

5. 倫理挑戰 : AI 在法律領域的應用也帶來了一系列倫理問題 , 如決策過程的透明度、AI 偏見的控制等 , 需要社會各界共同探讨。

參考資料

https://github.com/relic-yuexi/AgentCourt

本文來自微信公衆号" 新智元 "，作者：LRST ，36 氪經授權發布。