《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 中國科學院發(fā)布首個AI法庭AgentCourt

中國科學院發(fā)布首個AI法庭AgentCourt

一周打完1000場官司
2024-09-02
來源:新智元

人工智能重塑各個行業(yè)的今天 , 法律界也迎來了前所未有的變革。傳統的法律實踐面臨著效率低下、成本高昂等挑戰(zhàn),而 AI 技術的出現為解決這些問題提供了新的可能。

從最初斯坦福小鎮(zhèn)火遍全網,25 個由大語言模型(LLMs)驅動的智能體生活交友,打開了多 Agent 新視角。

而現在,AI 法庭也來了!

最近,來自中國科學院深圳先進研究院的研究團隊開發(fā)了一個名為 AgentCourt模擬智能法庭,

它是一個基于大語言模型 ( LLMs ) 的法庭模擬系統 , 旨在通過 AI 驅動的虛擬法庭來革新法律教育、案例分析和法律研究。

1.jpg

論文地址:https://doi.org/10.48550/arXiv.2408.08089

代碼:https://github.com/relic-yuexi/AgentCourt

AgentCourt 實戰(zhàn)演示:https://b23.tv/e6eQMfM

該系統能夠模擬完整的法庭程序。法官、原告律師、辯護律師以及其他參與者均由大型語言模型驅動的自主代理扮演。他們的主要目標是通過模擬法庭流程來幫助律師代理學習如何有效辯論案件,并提高其整體法律專業(yè)技能。

2.jpg

該篇文章的主要貢獻有:

1. 全面模擬,真實再現

AgentCourt 不僅僅是一個模擬工具,它是一個高度復雜的系統,能夠精確模擬民事法庭的設置,實現多方互動和復雜的法律推理。這是首次將 AI 技術應用于法庭環(huán)境模擬中,為法律教育和實踐提供了前所未有的可能性。

2. 對抗性交互,強化法律推理

在 AgentCourt 的模擬過程中,大型語言模型(LLMs)的法律推理能力通過智能體之間的對抗性交互得到了顯著增強。這種利用對抗性多智能體交互的方法,不僅超越了簡單的信息傳遞,更為未來的相關研究提供了新的視角和思路。

3. 高效模擬,真實案例驗證

該工作成功模擬了 1,000 個中國真實的民事案例,這些案例在 AgentCourt 中僅用數天時間完成,而在現實世界中,這可能需要律師們花費十年時間。通過自動和人工評估方法,驗證了智能體進化的有效性。

為了盡量真實的模擬法庭,研究人員設置了以下的人物:

1. 原告與被告代理

模擬開始于案件發(fā)生之前,兩名由 ERNIE-Speed-128K 驅動的代理分別扮演潛在的原告和被告。一旦涉及案件,他們將自動尋求律師事務所的法律援助,這是法律糾紛中的典型行為。系統配置使得原告或被告在與律師的互動中可以直接獲得訴狀或答辯狀,無需從頭起草。

2. 律師代理

設計了兩名律師代理,同樣由 ERNIE-Speed-128K 驅動。當原告和被告在律師事務所尋求幫助時,這些律師代理將被隨機分配為原告律師和被告律師。他們與各自的客戶溝通,收集案件相關信息,并利用豐富的法律經驗、案例先例和法定代碼,按照規(guī)定程序進行法庭辯論,維護各自客戶的利益。

3. 法官代理

在法庭中,法官負責監(jiān)督整個過程,聽取雙方律師的論點,并在適當時候提問。最終,法官總結并評估律師的每一輪論點,然后作出最終判決。

4. 法庭書記員代理

為了創(chuàng)造更真實的法庭環(huán)境并促進代理的進化,他們設計了法庭書記員代理,負責宣布審判的開始和記錄審判的全過程。

3.jpg

這些由大模型驅動的 Agent,可以根據初始數據,自發(fā)地進行法庭的模擬,而無需任何人工的監(jiān)督。

數據集

研究人員利用中國裁判文書網的數據,編譯了一個包含 10,000 個民事判決的數據集。預處理的重點是提高數據集質量,精心清洗并選擇了 1,389 個高質量案例,這些案例同時包含原告的訴求和被告的辯護。

為了解決潛在的重復問題,他們采用了 BERT 進行「案件介紹」部分的語義向量化,并使用 K-Means 聚類對相似文檔進行分組。這產生了 1,000 個代表性文檔,用于模擬法庭訓練和測試。

數據生成與匿名化

利用 ERNIE-Speed-128K API(百度智能云文檔 2024)生成并匿名化高保真模擬文本,這些文本專門針對民事判決。這產生了一個精選的數據集,包含 1,000 個訓練樣本和 50 個測試樣本,旨在支持模擬法庭環(huán)境中強大的法律論證和判決預測,從而推進法律分析技術。

通過這些嚴格的數據處理步驟,AgentCourt 確保了模擬環(huán)境的真實性和數據的可靠性,為法律 AI 的發(fā)展奠定了堅實的基礎。

在得到數據后,各個 Agent 各司其職,根據一定的流程展開法庭的辯論。該論文的模擬過程如下:

4.jpg

在模擬完 1000 個民事案例后,原告律師和被告律師的能力都得到了很大的提升,文章中的自動評估和人工評估展示了實驗結果:

實驗基于 1,000 個真實世界的民事案件,通過自動評估和人工評估兩種方式,全面檢驗了 AgentCourt 系統的效能。自動評估采用了 LawBench 評估標準,涵蓋了法律知識的記憶、理解和應用三個層面。人工評估則由經驗豐富的法律專家進行,評估了智能體的思維敏捷性、專業(yè)知識性和邏輯嚴謹性。

實驗結果顯示,在 AgentCourt 中經歷了數千次對抗性法律案件模擬(相當于現實世界律師十年的工作經驗),律師代理在處理法律任務的能力上有了顯著提升。無論是在自動評估還是人工評估中,進化后的代理都展現出了更快的響應速度、更深的法律知識和更強的邏輯推理能力,在復雜案件分析、法律推理和辯論策略上 , 部分 AI 律師甚至超越了人類專家的表現。

5.jpg

6.jpg

就像自動評估中的 Article Recitation 任務,經過進化后的律師 Agent 可以較好的背誦出指定法律的內容。而未經進化的律師就只能「阿巴阿巴」了。

7.jpg

AgentCourt 的出現在未來可能對法律行業(yè)產生深遠影響 :

1. 法律教育革新 : 為法律院校提供高度仿真的實踐平臺 , 學生可與頂級 AI 律師對戰(zhàn) , 快速積累經驗。

2. 提高司法效率 : AI 輔助可以加速案件預審、證據分析等流程 , 減輕法官和律師的工作負擔。

3. 降低法律服務成本 : AI 律師助手可以處理大量初級工作 , 使優(yōu)質法律服務更加平價可及。

4. 推動法律研究 : 海量案例模擬為法學研究提供了前所未有的數據支持 , 助力發(fā)現新的法律模式和理論。

5. 倫理挑戰(zhàn) : AI 在法律領域的應用也帶來了一系列倫理問題 , 如決策過程的透明度、AI 偏見的控制等 , 需要社會各界共同探討。

參考資料

https://github.com/relic-yuexi/AgentCourt


Magazine.Subscription.jpg

本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。