Agentic theorem provers often introduce intermediate lemmas, proof sketches, or subgoal decompositions before returning to tactic-level search. This can look like an expensive detour: if proving lemmas is itself hard, why should a learned prover spend effort there? We give a statistical learning answer. Instead of worst-case proof complexity over all formulas, we study the biased data distribution produced by a teacher prover: initial theorem states together with successful verified proof traces. We model proof search as a deterministic finite-horizon MDP and analyze offline imitation learning from those traces. The success bounds depend on the average length of teacher proofs, how predictable the teacher's next action is, and how accurately the student learns that local prediction problem. A flat student learns from fully inlined traces, so repeated subproofs appear many times in its training and test-time certificate. A hierarchical student instead predicts a reusable proof DAG and solves each shared block once. When flattening duplicates the same hard local argument exponentially many times, the sufficient-sample certificate produced by our bounds can be exponentially smaller for the hierarchical learner. This gives a concrete statistical mechanism by which reusable proof structure helps verifier-based theorem proving.


翻译:智能体定理证明器在返回策略级搜索之前,通常会引入中间引理、证明草图或子目标分解。这看似是昂贵的绕路:如果证明引理本身就很困难,为何学习型证明器要在此处投入精力?我们从统计学习角度给出答案。我们研究的是教师证明器产生的有偏数据分布(初始定理状态与经验证的成功证明轨迹),而非所有公式的最坏情况证明复杂度。我们将证明搜索建模为确定性的有限时域马尔可夫决策过程,并分析从这些轨迹中进行的离线模仿学习。成功界限取决于教师证明的平均长度、教师下一步动作的可预测性,以及学生从局部预测问题中学习的准确度。平面学生学习完全内联展开的轨迹,因此重复的子证明会在其训练和测试时的证书中多次出现。层次化学生则预测可复用的证明有向无环图,并对每个共享模块仅求解一次。当扁平化操作将相同的困难局部论证重复指数级次数时,我们通过界限生成的充分样本证书对层次化学习者而言可能呈指数级减小。这给出了一种具体的统计机制,解释了可复用的证明结构如何为基于验证器的定理证明提供帮助。

0
下载
关闭预览

相关内容

《分布式多智能体强化学习策略的可解释性研究》
专知会员服务
29+阅读 · 2025年11月17日
AI智能体与代理式AI:概念分类、应用与挑战
专知会员服务
30+阅读 · 2025年5月17日
专知会员服务
122+阅读 · 2021年1月31日
小样本学习(Few-shot Learning)综述
机器之心
18+阅读 · 2019年4月1日
第二章 机器学习中的数学基础
Datartisan数据工匠
12+阅读 · 2018年4月5日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 5月27日
Arxiv
0+阅读 · 4月6日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关基金
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员