Learning to Reason with Insight for Informal Theorem Proving - 专知论文

会员服务 ·

0

定理证明 · 识别 · 结构 · 结构化 · 数学 ·

Learning to Reason with Insight for Informal Theorem Proving

翻译：以洞察力推理为例的非形式定理证明学习

Yunhe Li,Hao Shi,Bowen Deng,Wei Wang,Mengzhe Ruan,Hanxu Hou,Zhongxiang Dai,Siyang Gao,Chao Wang,Shuang Qiu,Linqi Song

Although most of the automated theorem-proving approaches depend on formal proof systems, informal theorem proving can align better with large language models' (LLMs) strength in natural language processing. In this work, we identify a primary bottleneck in informal theorem proving as a lack of insight, namely the difficulty of recognizing the core techniques required to solve complex problems. To address this, we propose $\texttt{DeepInsight}$, a unified training framework designed to cultivate this essential reasoning skill and enable LLMs to perform insightful reasoning. Our framework consists of three components: (1) $\texttt{DeepInsightTheorem}$, a hierarchical dataset that structures informal proofs by explicitly extracting core techniques and proof sketches alongside the final proof; (2) a Progressive Multi-Stage SFT strategy that mimics the human learning process, teaching the model proof writing, planning, and insight identification; and (3) $\texttt{InsightPO}$, a policy optimization method that assigns structured rewards over this insight hierarchy. Our experiments on challenging mathematical benchmarks demonstrate that this insight-aware generation strategy significantly outperforms baselines. These results demonstrate that teaching models to identify and apply core techniques can substantially improve their mathematical reasoning.

翻译：尽管大多数自动定理证明方法依赖于形式化证明系统，但非形式定理证明能更好地契合大语言模型在自然语言处理中的优势。本工作发现非形式定理证明的主要瓶颈在于缺乏洞察力，即难以识别解决复杂问题所需的核心技术。为此，我们提出$\texttt{DeepInsight}$，一个统一的训练框架，旨在培养这种关键的推理能力，使大语言模型能够进行基于洞察的推理。该框架包含三个组件：（1）$\texttt{DeepInsightTheorem}$，一个层次化数据集，通过显式提取核心技术、证明草图及最终证明来结构化非形式证明；（2）渐进式多阶段监督微调策略，模拟人类学习过程，教模型掌握证明撰写、规划与洞察识别；（3）$\texttt{InsightPO}$，一种策略优化方法，在该洞察层次结构上分配结构化奖励。我们在具有挑战性的数学基准上的实验表明，这种感知洞察的生成策略显著优于基线方法。结果表明，教模型识别并应用核心技术能大幅提升其数学推理能力。

0

相关内容

定理证明

【博士论文】《用于可验证数学自动化的语言模型：交互、集成与自动形式化》

【博士论文】《用于可验证数学自动化的语言模型：交互、集成与自动形式化》

专知会员服务

19+阅读 · 2025年3月14日

如何提升大模型通用推理能力？DeepSeek最新论文《CODEI/O：通过代码输入输出预测凝练推理模式》

如何提升大模型通用推理能力？DeepSeek最新论文《CODEI/O：通过代码输入输出预测凝练推理模式》

专知会员服务

42+阅读 · 2025年2月16日

大模型数学推理数据合成相关方法

大模型数学推理数据合成相关方法

专知会员服务

36+阅读 · 2025年1月19日

【博士论文】推理的表示学习：跨多样结构的泛化

【博士论文】推理的表示学习：跨多样结构的泛化

专知会员服务

27+阅读 · 2024年10月20日

【普林斯顿博士论文】深度学习在自动定理证明中的应用, 95页pdf

【普林斯顿博士论文】深度学习在自动定理证明中的应用, 95页pdf

专知会员服务

36+阅读 · 2024年2月28日

《通过数学演绎推理产生形式智能，并作为从数据模式中归纳推理产生知识的补充》2022最新论文，加拿大国防研究与发展部

《通过数学演绎推理产生形式智能，并作为从数据模式中归纳推理产生知识的补充》2022最新论文，加拿大国防研究与发展部

专知会员服务

29+阅读 · 2023年1月11日

集大成者！经典书《知识表示学习》，1035页pdf系统性讲解人工智能知识表示与推理基础、算法与应用

集大成者！经典书《知识表示学习》，1035页pdf系统性讲解人工智能知识表示与推理基础、算法与应用

专知会员服务

156+阅读 · 2020年11月20日

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

专知会员服务

140+阅读 · 2020年7月10日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

133+阅读 · 2020年5月14日

【IBM】在视觉和关系推理中迁移学习，Transfer Learning in Visual and Relational Reasoning

【IBM】在视觉和关系推理中迁移学习，Transfer Learning in Visual and Relational Reasoning

专知会员服务

45+阅读 · 2020年1月15日

解读自监督学习(Self-Supervised Learning)几篇相关paper

解读自监督学习(Self-Supervised Learning)几篇相关paper

CVer

25+阅读 · 2020年2月21日

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

专知

16+阅读 · 2020年1月3日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【CVPR2018】如何增强Attention Model的推理能力

【CVPR2018】如何增强Attention Model的推理能力

专知

15+阅读 · 2018年7月2日

【深度学习】深度学习的几何观点：流形分布定律、学习能力的上限、概率变换的几何观点

【深度学习】深度学习的几何观点：流形分布定律、学习能力的上限、概率变换的几何观点

产业智能官

10+阅读 · 2018年6月23日

论强化学习和概率推断的等价性：一种全新概率模型

论强化学习和概率推断的等价性：一种全新概率模型

机器之心

26+阅读 · 2018年5月5日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

数据驱动的非刚体几何模型注册新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

非线性分析方法与奇异摄动理论在力学中的若干应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

奇异线性方程组和具有特定结构的非线性问题的研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

一类非线性发展方程的定性理论

国家自然科学基金

0+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

Learning-Infused Formal Reasoning: From Contract Synthesis to Artifact Reuse and Formal Semantics

Arxiv

0+阅读 · 6月16日

Towards Advanced Mathematical Reasoning for LLMs via First-Order Logic Theorem Proving

Arxiv

0+阅读 · 6月15日

Learning When to Sample: Confidence-Aware Selective Sampling for Efficient Chain-of-Thought Reasoning

Arxiv

0+阅读 · 6月12日

Compile to Compress: Boosting Formal Theorem Provers by Compiler Outputs

Arxiv

0+阅读 · 5月29日

Automating Formal Verification with Reinforcement Learning and Recursive Inference

Arxiv

0+阅读 · 5月29日

Lean Meets Theoretical Computer Science: Scalable Synthesis of Theorem Proving Challenges in Formal-Informal Pairs

Arxiv

0+阅读 · 5月18日

Grounded Reinforcement Learning for Visual Reasoning

Arxiv

0+阅读 · 5月15日

Abductive Reasoning with Probabilistic Commonsense

Arxiv

0+阅读 · 5月8日

Discovering New Theorems via LLMs with In-Context Proof Learning in Lean

Arxiv

0+阅读 · 5月6日

DRIFT: Decompose, Retrieve, Illustrate, then Formalize Theorems

Arxiv

0+阅读 · 4月6日

VIP会员

文章信息

相关主题

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 今天4:35

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

3+阅读 · 今天4:24

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 今天4:18

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 今天4:15

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 今天4:08

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

【博士论文】《用于可验证数学自动化的语言模型：交互、集成与自动形式化》

【博士论文】《用于可验证数学自动化的语言模型：交互、集成与自动形式化》

专知会员服务

19+阅读 · 2025年3月14日

如何提升大模型通用推理能力？DeepSeek最新论文《CODEI/O：通过代码输入输出预测凝练推理模式》

如何提升大模型通用推理能力？DeepSeek最新论文《CODEI/O：通过代码输入输出预测凝练推理模式》

专知会员服务

42+阅读 · 2025年2月16日

大模型数学推理数据合成相关方法

大模型数学推理数据合成相关方法

专知会员服务

36+阅读 · 2025年1月19日

【博士论文】推理的表示学习：跨多样结构的泛化

【博士论文】推理的表示学习：跨多样结构的泛化

专知会员服务

27+阅读 · 2024年10月20日

【普林斯顿博士论文】深度学习在自动定理证明中的应用, 95页pdf

【普林斯顿博士论文】深度学习在自动定理证明中的应用, 95页pdf

专知会员服务

36+阅读 · 2024年2月28日

《通过数学演绎推理产生形式智能，并作为从数据模式中归纳推理产生知识的补充》2022最新论文，加拿大国防研究与发展部

《通过数学演绎推理产生形式智能，并作为从数据模式中归纳推理产生知识的补充》2022最新论文，加拿大国防研究与发展部

专知会员服务

29+阅读 · 2023年1月11日

集大成者！经典书《知识表示学习》，1035页pdf系统性讲解人工智能知识表示与推理基础、算法与应用

集大成者！经典书《知识表示学习》，1035页pdf系统性讲解人工智能知识表示与推理基础、算法与应用

专知会员服务

156+阅读 · 2020年11月20日

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

专知会员服务

140+阅读 · 2020年7月10日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

133+阅读 · 2020年5月14日

【IBM】在视觉和关系推理中迁移学习，Transfer Learning in Visual and Relational Reasoning

【IBM】在视觉和关系推理中迁移学习，Transfer Learning in Visual and Relational Reasoning

专知会员服务

45+阅读 · 2020年1月15日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

解读自监督学习(Self-Supervised Learning)几篇相关paper

解读自监督学习(Self-Supervised Learning)几篇相关paper

CVer

25+阅读 · 2020年2月21日

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

专知

16+阅读 · 2020年1月3日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【CVPR2018】如何增强Attention Model的推理能力

【CVPR2018】如何增强Attention Model的推理能力

专知

15+阅读 · 2018年7月2日

【深度学习】深度学习的几何观点：流形分布定律、学习能力的上限、概率变换的几何观点

【深度学习】深度学习的几何观点：流形分布定律、学习能力的上限、概率变换的几何观点

产业智能官

10+阅读 · 2018年6月23日

论强化学习和概率推断的等价性：一种全新概率模型

论强化学习和概率推断的等价性：一种全新概率模型

机器之心

26+阅读 · 2018年5月5日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

相关论文

Learning-Infused Formal Reasoning: From Contract Synthesis to Artifact Reuse and Formal Semantics

Arxiv

0+阅读 · 6月16日

Towards Advanced Mathematical Reasoning for LLMs via First-Order Logic Theorem Proving

Arxiv

0+阅读 · 6月15日

Learning When to Sample: Confidence-Aware Selective Sampling for Efficient Chain-of-Thought Reasoning

Arxiv

0+阅读 · 6月12日

Compile to Compress: Boosting Formal Theorem Provers by Compiler Outputs

Arxiv

0+阅读 · 5月29日

Automating Formal Verification with Reinforcement Learning and Recursive Inference

Arxiv

0+阅读 · 5月29日

Lean Meets Theoretical Computer Science: Scalable Synthesis of Theorem Proving Challenges in Formal-Informal Pairs

Arxiv

0+阅读 · 5月18日

Grounded Reinforcement Learning for Visual Reasoning

Arxiv

0+阅读 · 5月15日

Abductive Reasoning with Probabilistic Commonsense

Arxiv

0+阅读 · 5月8日

Discovering New Theorems via LLMs with In-Context Proof Learning in Lean

Arxiv

0+阅读 · 5月6日

DRIFT: Decompose, Retrieve, Illustrate, then Formalize Theorems

Arxiv

0+阅读 · 4月6日

相关基金

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

数据驱动的非刚体几何模型注册新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

非线性分析方法与奇异摄动理论在力学中的若干应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

奇异线性方程组和具有特定结构的非线性问题的研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

一类非线性发展方程的定性理论

国家自然科学基金

0+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员