大语言模型(LLMs)显著推动了法律领域的跨越式发展。然而,独立模型在应对法律任务时,仍面临幻觉(hallucination)、信息滞后以及**可验证性(verifiability)**不足等严峻挑战。近期,大语言模型智能体(LLM agents)因其能够利用规划、记忆和工具调用等高级能力满足法律实务的严苛标准,作为上述难题的解决方案引起了学术界的广泛关注。 本文针对法律任务中的 LLM 智能体进行了全面的综述研究,深入分析了这些架构如何弥合技术能力与特定领域需求之间的鸿沟。本文的主要贡献包括: 1. 系统分析了从标准法律 LLMs 向法律智能体演进的技术转型路径; 1. 构建了结构化的分类体系,涵盖了当前智能体在不同法律实务领域中的应用; 1. 探讨了专门针对法律智能体性能的评估方法论; 1. 识别了当前存在的开放性挑战,并为开发稳健且自主的法律助手指明了未来研究方向。

https://www.zhuanzhiai.com/paper/c2e9b940a106c9d3d09cf8196be236ec

第一章:引言 (1 Introduction)

近年来,大语言模型(LLMs)显著推动了法律领域的跨越式发展,从根本上改变了法律从业者处理复杂信息的方式。这些模型在各类专业法律任务中展现出了卓越的能力,涵盖了从常规文档处理到复杂的推理挑战。LLMs 的集成提升了多个特定应用领域的效率,包括法律判决预测 (Shu et al. [2024])、法律问答 (Louis et al. [2024]) 以及合同审查 (Liu et al. [2025]),为以往依赖人工且劳动密集型的辅助工作流带来了新的效能提升。

然而,在法律任务中部署独立大语言模型(Standalone LLMs)仍面临显著局限,主要归因于持续存在的幻觉问题 (Farquhar et al. [2024], Sriramanan et al. [2024]) 以及生成的信息滞后。鉴于法律实务属于高风险环境,对精准度有着强制性要求,任何错误都可能导致严重的后果,这些可靠性问题严重限制了标准 LLMs 在现实场景中的应用。为了应对这些关键挑战,该领域正转向 LLM 智能体(LLM Agents) 的开发 (Li et al. [2025a])。这些智能体利用规划(Planning)、**记忆(Memory)工具调用(Tool Usage)**等高级能力,旨在缓解基础 LLM 模型的缺陷,并满足法律行业严苛的标准。

本文对法律任务中的 LLM 智能体进行了全面的综述研究,旨在通过架构分析弥合技术能力与特定领域需求之间的鸿沟。我们首先通过对比智能体优势与独立模型的局限,探讨了为何 LLM 智能体在该领域具有广阔前景;随后详细回顾了当前的应用领域。此外,我们评估了现有智能体的性能,并在最后通过强调开放性挑战和未来研究方向,为法律人工智能(Legal AI)的下一阶段研究提供指引。


1.1 贡献与独特性 (1.1 Contribution and Uniqueness)

我们的贡献。 本文全面概述了法律领域中的 LLM 智能体,主要贡献包含以下四个方面: 1. 系统分析了从标准法律 LLMs 向法律智能体的技术转型过程,详细阐述了智能体特性如何解决法律应用中的关键缺陷。 1. 构建了结构化的分类体系,涵盖了当前智能体在五个不同法律实务领域中的应用。 1. 探讨了专门针对法律智能体性能(Agentic Performance)的评估方法论。 1. 识别了开放性挑战,并为开发稳健、自主的法律助手勾勒了未来研究方向。

与现有综述的区别。 虽然已有若干综述探讨了 AI 在法律中的应用 (Lai et al. [2024], Hou et al. [2025], Chen et al. [2024]),但与本文以“智能体为中心”的方法相比,它们在研究范围和侧重点上存在显著差异。例如,Lai 等人 [2024] 侧重于独立模型的能力以及司法系统中的通用伦理挑战,在很大程度上忽略了利用规划和工具来解决已知局限的智能体架构。相比之下,本综述唯一且专门聚焦于法律领域 LLM 智能体的深度研究,提供了针对法律实务的智能体原则、工作流和评估标准的详细分析。

成为VIP会员查看完整内容
1
微信扫码咨询专知VIP会员