成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
定理证明
关注
0
综合
百科
VIP
热门
动态
论文
精华
s2n-bignum-bench: A practical benchmark for evaluating low-level code reasoning of LLMs
Arxiv
0+阅读 · 3月15日
LeanCat: A Benchmark Suite for Formal Category Theory in Lean (Part I: 1-Categories)
Arxiv
0+阅读 · 2月25日
When Agda met Vampire
Arxiv
0+阅读 · 2月21日
Premise Selection for a Lean Hammer
Arxiv
0+阅读 · 2月25日
A Minimal Agent for Automated Theorem Proving
Arxiv
0+阅读 · 2月27日
Nazrin: Atomic Tactics for Graph Neural Networks for Theorem Proving in Lean 4
Arxiv
0+阅读 · 2月21日
Case Study: Saturations as Explicit Models in Equational Theories
Arxiv
0+阅读 · 2月18日
Formalising the Bruhat-Tits Tree
Arxiv
0+阅读 · 2月17日
Towards Real-World Industrial-Scale Verification: LLM-Driven Theorem Proving on seL4
Arxiv
0+阅读 · 2月9日
A Finer View of the Parameterized Landscape of Labeled Graph Contractions
Arxiv
0+阅读 · 2月11日
A Weakest Precondition Calculus for Programs and Linear Temporal Specifications
Arxiv
0+阅读 · 2月11日
Don't Eliminate Cut: Exponential Separations in LLM-Based Theorem Proving
Arxiv
0+阅读 · 2月11日
Why Agentic Theorem Prover Works: A Statistical Provability Theory of Mathematical Reasoning Models
Arxiv
0+阅读 · 2月11日
Why Agentic Theorem Prover Works: A Statistical Provability Theory of Mathematical Reasoning Models
Arxiv
0+阅读 · 2月12日
Construction-Verification: A Benchmark for Applied Mathematics in Lean 4
Arxiv
0+阅读 · 2月1日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top