While the ecosystem of Lean and Mathlib has enjoyed celebrated success in formal mathematical reasoning with the help of large language models (LLMs), the absence of many folklore lemmas in Mathlib remains a persistent barrier that limits Lean's usability as an everyday tool for mathematicians like \LaTeX{} or Maple. To address this, we introduce MathlibLemma, a modular LLM-based pipeline for automated folklore-lemma mining: the discovery, formalization, and proving of reusable intermediate facts that mathematicians often take for granted but that are not always present in formal libraries. At its core, MathlibLemma proactively mines the missing connective tissue of mathematics. The pipeline produces a verified library of folklore-style lemmas, including 1,506 Lean-checked proofs that pass a proof-bypass screen; a small curated pilot subset has also been merged into Mathlib, providing external evidence that selected outputs can meet expert library standards. Leveraging this pipeline, we further construct the MathlibLemma benchmark, a suite of 4,028 non-trivial type-checked Lean statements spanning a broad range of mathematical domains. By transforming the role of LLMs from passive consumers to active contributors, this work takes a step toward AI-assisted expansion of formal mathematical libraries.


翻译:尽管基于大语言模型的Lean与Mathlib生态系统在形式化数学推理领域取得了令人瞩目的成功,但Mathlib中大量民间引理的缺失仍是一个持续存在的障碍,限制了Lean像LaTeX或Maple那样成为数学家日常工具的可能性。为解决这一问题,我们提出MathlibLemma——一个基于大语言模型的模块化流水线,用于自动挖掘民间引理:发现、形式化并证明数学家通常视为理所当然却常未收录于形式化库中的可复用中间事实。其核心在于主动挖掘数学中缺失的"连接组织"。该流水线生成一个经验证的民间引理库,包含1,506个通过证明旁路筛选的Lean验证证明;其中一个小型精选子集已被合并至Mathlib,这为选定输出能够达到专家级库标准提供了外部证据。基于该流水线,我们进一步构建了MathlibLemma基准测试套件,包含4,028个跨越广泛数学领域的非平凡类型检查Lean语句。通过将大语言模型从被动消费者转变为主动贡献者,这项工作向人工智能辅助扩展形式化数学库迈出了关键一步。

0
下载
关闭预览

相关内容

数学是关于数量、结构、变化等主题的探索。
OlymMATH: 奥林匹克级双语数学基准,R1 正确率仅为 21.2%
专知会员服务
11+阅读 · 2025年4月17日
【新书】数学的本质——通过基础问题探究,400页pdf
专知会员服务
91+阅读 · 2025年1月31日
大模型数学推理数据合成相关方法
专知会员服务
36+阅读 · 2025年1月19日
【干货书】无穷维统计模型的数学基础,705页pdf
专知会员服务
73+阅读 · 2023年10月23日
关系推理:基于表示学习和语义要素
计算机研究与发展
19+阅读 · 2017年8月22日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
5+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
2+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
9+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
11+阅读 · 6月17日
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员