LawThinker: A Deep Research Legal Agent in Dynamic Environments - 专知论文

会员服务 ·

0

法律 · 知识 · 动态环境 · 基准 · 基准测试 ·

LawThinker: A Deep Research Legal Agent in Dynamic Environments

翻译：LawThinker：动态环境中的深度研究型法律智能体

Xinyu Yang,Chenlong Deng,Tongyu Wen,Binyu Xie,Zhicheng Dou

Legal reasoning requires not only correct outcomes but also procedurally compliant reasoning processes. However, existing methods lack mechanisms to verify intermediate reasoning steps, allowing errors such as inapplicable statute citations to propagate undetected through the reasoning chain. To address this, we propose LawThinker, an autonomous legal research agent that adopts an Explore-Verify-Memorize strategy for dynamic judicial environments. The core idea is to enforce verification as an atomic operation after every knowledge exploration step. A DeepVerifier module examines each retrieval result along three dimensions of knowledge accuracy, fact-law relevance, and procedural compliance, with a memory module for cross-round knowledge reuse in long-horizon tasks. Experiments on the dynamic benchmark J1-EVAL show that LawThinker achieves a 24% improvement over direct reasoning and an 11% gain over workflow-based methods, with particularly strong improvements on process-oriented metrics. Evaluations on three static benchmarks further confirm its generalization capability. The code is available at https://github.com/yxy-919/LawThinker-agent .

翻译：法律推理不仅要求得出正确结论，还需遵循合规的推理流程。然而，现有方法缺乏对中间推理步骤的验证机制，导致诸如法条引用不当等错误可能在推理链中未被察觉地传播。为解决这一问题，我们提出LawThinker——一种采用"探索-验证-记忆"策略的自主法律研究智能体，适用于动态司法环境。其核心思想是在每个知识探索步骤后强制执行原子化的验证操作。DeepVerifier模块从知识准确性、事实-法律关联性以及程序合规性三个维度审查每个检索结果，并配备记忆模块以实现长周期任务中的跨轮次知识复用。在动态基准测试集J1-EVAL上的实验表明，LawThinker相比直接推理方法提升24%，较基于工作流的方法提升11%，且在流程导向的评估指标上表现尤为突出。在三个静态基准测试集上的评估进一步证实了其泛化能力。代码已开源：https://github.com/yxy-919/LawThinker-agent。

0

相关内容

法律是国家制定或认可的，由国家强制力保证实施的，以规定权利和义务为内容的具有普遍约束力的社会规范。

大语言模型的智能体化推理

大语言模型的智能体化推理

专知会员服务

35+阅读 · 1月21日

法律领域中的大语言模型智能体：分类体系、应用场景与挑战

法律领域中的大语言模型智能体：分类体系、应用场景与挑战

专知会员服务

17+阅读 · 1月14日

【AI与法律 - 博士论文】《用于分析和搜索法律数据的知识图谱》维也纳经济大学

【AI与法律 - 博士论文】《用于分析和搜索法律数据的知识图谱》维也纳经济大学

专知会员服务

36+阅读 · 2022年9月6日

【AI+ 法律】2022最新博士论文《改进法律文本处理中的注意力神经网络》日本科学技术高等研究院

【AI+ 法律】2022最新博士论文《改进法律文本处理中的注意力神经网络》日本科学技术高等研究院

专知会员服务

19+阅读 · 2022年5月4日

AI如何用于法律？里斯本等学者最新《人工智能法律应用》全面阐述深度法律文本分析

AI如何用于法律？里斯本等学者最新《人工智能法律应用》全面阐述深度法律文本分析

专知会员服务

64+阅读 · 2022年4月25日

牛津大学等《多智能体系统的博弈论验证》最新论文，Rational verification: game-theoretic verification of multi-agent systems

牛津大学等《多智能体系统的博弈论验证》最新论文，Rational verification: game-theoretic verification of multi-agent systems

专知会员服务

43+阅读 · 2022年4月4日

推荐！牛津大学《AI增强律师职业》Augmented Lawyering，82页PDF

推荐！牛津大学《AI增强律师职业》Augmented Lawyering，82页PDF

专知会员服务

22+阅读 · 2022年4月1日

《关于人工智能法律系统的思考》31页PPT，中国政法大学张保生教授

《关于人工智能法律系统的思考》31页PPT，中国政法大学张保生教授

专知会员服务

17+阅读 · 2022年4月1日

【AI+法律】《智能刑事司法：探索算法在瑞士刑事司法系统中的使用》2022圣加仑大学法学院最新综述论文，25页PDF

【AI+法律】《智能刑事司法：探索算法在瑞士刑事司法系统中的使用》2022圣加仑大学法学院最新综述论文，25页PDF

专知会员服务

22+阅读 · 2022年3月31日

人工智能与法律结合的现状及发展趋势

专知会员服务

64+阅读 · 2021年4月16日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

“猜心思”的Hard模式：问答系统在智能法律场景的实践与优化

“猜心思”的Hard模式：问答系统在智能法律场景的实践与优化

AINLP

15+阅读 · 2019年2月2日

实录分享 | 计算未来轻沙龙：“法律+AI”前沿研讨会（PPT下载）

实录分享 | 计算未来轻沙龙：“法律+AI”前沿研讨会（PPT下载）

PaperWeekly

16+阅读 · 2019年1月6日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

为机器学习插上因果推理的翅膀：这是一本系统的因果推理开源书

为机器学习插上因果推理的翅膀：这是一本系统的因果推理开源书

机器之心

34+阅读 · 2019年1月4日

法小飞：智能法律咨询助手

法小飞：智能法律咨询助手

哈工大SCIR

33+阅读 · 2018年10月20日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

物联网安全搜索技术研究

国家自然科学基金

3+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂公共环境下群体行为尺度自适应建模与特定异常行为识别算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于智能手机的个体活动链信息获取及挖掘方法

国家自然科学基金

1+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

基于博弈论的信息安全理论与方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

AgentIR: Reasoning-Aware Retrieval for Deep Research Agents

Arxiv

0+阅读 · 3月5日

AgentIR: Reasoning-Aware Retrival for Deep Research Agents

Arxiv

0+阅读 · 3月4日

Adaptive Collaboration of Arena-Based Argumentative LLMs for Explainable and Contestable Legal Reasoning

Arxiv

0+阅读 · 2月21日

RuleReasoner: Reinforced Rule-based Reasoning via Domain-aware Dynamic Sampling

Arxiv

0+阅读 · 2月15日

Legal$Δ$: Enhancing Legal Reasoning in LLMs via Reinforcement Learning with Chain-of-Thought Guided Information Gain

Arxiv

0+阅读 · 2月9日

SRR-Judge: Step-Level Rating and Refinement for Enhancing Search-Integrated Reasoning in Search Agents

Arxiv

0+阅读 · 2月8日

Weaver: End-to-End Agentic System Training for Video Interleaved Reasoning

Arxiv

0+阅读 · 2月5日

DeepAgent: A General Reasoning Agent with Scalable Toolsets

Arxiv

0+阅读 · 2月5日

interwhen: A Generalizable Framework for Verifiable Reasoning with Test-time Monitors

Arxiv

0+阅读 · 2月5日

ReThinker: Scientific Reasoning by Rethinking with Guided Reflection and Confidence Control

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | SARDI：扩散语言模型的自增强检索

ICML 2026 | SARDI：扩散语言模型的自增强检索

专知会员服务

4+阅读 · 6月6日

长时程具身智能安全综述：机器人操作的跨层分析

长时程具身智能安全综述：机器人操作的跨层分析

专知会员服务

4+阅读 · 6月6日

从“杀伤链”到“杀伤网”：新时代防空反导体系的真正需求

从“杀伤链”到“杀伤网”：新时代防空反导体系的真正需求

专知会员服务

9+阅读 · 6月6日

《锻造军官能力：军官发展的军事训练、学术教育及设计思维导向创新的多维度研究》最新300页

《锻造军官能力：军官发展的军事训练、学术教育及设计思维导向创新的多维度研究》最新300页

专知会员服务

5+阅读 · 6月6日

《国防领域安全采用大语言模型的战略蓝图》

《国防领域安全采用大语言模型的战略蓝图》

专知会员服务

6+阅读 · 6月6日

《对抗性电磁环境下远程巡飞弹作战的保密指挥控制数据链》

《对抗性电磁环境下远程巡飞弹作战的保密指挥控制数据链》

专知会员服务

5+阅读 · 6月6日

CVPR2026奖项公布，谷歌D4RT最佳论文获奖，何恺明ResNet、YOLO获时间检验奖！

CVPR2026奖项公布，谷歌D4RT最佳论文获奖，何恺明ResNet、YOLO获时间检验奖！

专知会员服务

5+阅读 · 6月6日

ICML 2026 | 演化选择的因果建模

ICML 2026 | 演化选择的因果建模

专知会员服务

7+阅读 · 6月5日

综述｜学习式3D表征最新进展与趋势

综述｜学习式3D表征最新进展与趋势

专知会员服务

7+阅读 · 6月5日

《武器作战效能分析：基于虚拟构造仿真大数据与深度学习的初步见解》

《武器作战效能分析：基于虚拟构造仿真大数据与深度学习的初步见解》

专知会员服务

7+阅读 · 6月5日

《自主巡飞弹药系统量子逻辑框架：一种基于不确定模糊集的方法》

《自主巡飞弹药系统量子逻辑框架：一种基于不确定模糊集的方法》

专知会员服务

7+阅读 · 6月5日

人工智能重塑威慑：算法优势的兴起

人工智能重塑威慑：算法优势的兴起

专知会员服务

7+阅读 · 6月5日

【博士论文】基于物理结构与贝叶斯不确定性的可靠神经网络

【博士论文】基于物理结构与贝叶斯不确定性的可靠神经网络

专知会员服务

14+阅读 · 6月4日

AgentOps综述：智能体系统运维框架

AgentOps综述：智能体系统运维框架

专知会员服务

17+阅读 · 6月4日

《美陆军最新条令：兵力防护》

《美陆军最新条令：兵力防护》

专知会员服务

14+阅读 · 6月4日

相关VIP内容

大语言模型的智能体化推理

大语言模型的智能体化推理

专知会员服务

35+阅读 · 1月21日

法律领域中的大语言模型智能体：分类体系、应用场景与挑战

法律领域中的大语言模型智能体：分类体系、应用场景与挑战

专知会员服务

17+阅读 · 1月14日

【AI与法律 - 博士论文】《用于分析和搜索法律数据的知识图谱》维也纳经济大学

【AI与法律 - 博士论文】《用于分析和搜索法律数据的知识图谱》维也纳经济大学

专知会员服务

36+阅读 · 2022年9月6日

【AI+ 法律】2022最新博士论文《改进法律文本处理中的注意力神经网络》日本科学技术高等研究院

【AI+ 法律】2022最新博士论文《改进法律文本处理中的注意力神经网络》日本科学技术高等研究院

专知会员服务

19+阅读 · 2022年5月4日

AI如何用于法律？里斯本等学者最新《人工智能法律应用》全面阐述深度法律文本分析

AI如何用于法律？里斯本等学者最新《人工智能法律应用》全面阐述深度法律文本分析

专知会员服务

64+阅读 · 2022年4月25日

牛津大学等《多智能体系统的博弈论验证》最新论文，Rational verification: game-theoretic verification of multi-agent systems

牛津大学等《多智能体系统的博弈论验证》最新论文，Rational verification: game-theoretic verification of multi-agent systems

专知会员服务

43+阅读 · 2022年4月4日

推荐！牛津大学《AI增强律师职业》Augmented Lawyering，82页PDF

推荐！牛津大学《AI增强律师职业》Augmented Lawyering，82页PDF

专知会员服务

22+阅读 · 2022年4月1日

《关于人工智能法律系统的思考》31页PPT，中国政法大学张保生教授

《关于人工智能法律系统的思考》31页PPT，中国政法大学张保生教授

专知会员服务

17+阅读 · 2022年4月1日

【AI+法律】《智能刑事司法：探索算法在瑞士刑事司法系统中的使用》2022圣加仑大学法学院最新综述论文，25页PDF

【AI+法律】《智能刑事司法：探索算法在瑞士刑事司法系统中的使用》2022圣加仑大学法学院最新综述论文，25页PDF

专知会员服务

22+阅读 · 2022年3月31日

人工智能与法律结合的现状及发展趋势

专知会员服务

64+阅读 · 2021年4月16日

热门VIP内容

开通专知VIP会员享更多权益服务

长时程具身智能安全综述：机器人操作的跨层分析

《锻造军官能力：军官发展的军事训练、学术教育及设计思维导向创新的多维度研究》最新300页

ICML 2026 | SARDI：扩散语言模型的自增强检索

从“杀伤链”到“杀伤网”：新时代防空反导体系的真正需求

相关资讯

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

“猜心思”的Hard模式：问答系统在智能法律场景的实践与优化

“猜心思”的Hard模式：问答系统在智能法律场景的实践与优化

AINLP

15+阅读 · 2019年2月2日

实录分享 | 计算未来轻沙龙：“法律+AI”前沿研讨会（PPT下载）

实录分享 | 计算未来轻沙龙：“法律+AI”前沿研讨会（PPT下载）

PaperWeekly

16+阅读 · 2019年1月6日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

为机器学习插上因果推理的翅膀：这是一本系统的因果推理开源书

为机器学习插上因果推理的翅膀：这是一本系统的因果推理开源书

机器之心

34+阅读 · 2019年1月4日

法小飞：智能法律咨询助手

法小飞：智能法律咨询助手

哈工大SCIR

33+阅读 · 2018年10月20日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

相关论文

AgentIR: Reasoning-Aware Retrieval for Deep Research Agents

Arxiv

0+阅读 · 3月5日

AgentIR: Reasoning-Aware Retrival for Deep Research Agents

Arxiv

0+阅读 · 3月4日

Adaptive Collaboration of Arena-Based Argumentative LLMs for Explainable and Contestable Legal Reasoning

Arxiv

0+阅读 · 2月21日

RuleReasoner: Reinforced Rule-based Reasoning via Domain-aware Dynamic Sampling

Arxiv

0+阅读 · 2月15日

Legal$Δ$: Enhancing Legal Reasoning in LLMs via Reinforcement Learning with Chain-of-Thought Guided Information Gain

Arxiv

0+阅读 · 2月9日

SRR-Judge: Step-Level Rating and Refinement for Enhancing Search-Integrated Reasoning in Search Agents

Arxiv

0+阅读 · 2月8日

Weaver: End-to-End Agentic System Training for Video Interleaved Reasoning

Arxiv

0+阅读 · 2月5日

DeepAgent: A General Reasoning Agent with Scalable Toolsets

Arxiv

0+阅读 · 2月5日

interwhen: A Generalizable Framework for Verifiable Reasoning with Test-time Monitors

Arxiv

0+阅读 · 2月5日

ReThinker: Scientific Reasoning by Rethinking with Guided Reflection and Confidence Control

Arxiv

0+阅读 · 2月4日

相关基金

物联网安全搜索技术研究

国家自然科学基金

3+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂公共环境下群体行为尺度自适应建模与特定异常行为识别算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于智能手机的个体活动链信息获取及挖掘方法

国家自然科学基金

1+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

基于博弈论的信息安全理论与方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员