IsabeLLM: Automated Theorem Proving Applied to Formally Verifying Consensus - 专知论文

会员服务 ·

0

系统 · 定理证明 · 形式化 · 形式化验证 · 自动化 ·

IsabeLLM: Automated Theorem Proving Applied to Formally Verifying Consensus

翻译：IsabeLLM：定理证明自动化在共识协议形式化验证中的应用

Elliot Jones,William Knottenbelt

Advances in Artificial Intelligence (AI) have led AI for Theorem Proving to become a promising means of formally verifying computer systems. Whilst formal verification is traditionally reserved for safety-critical systems due to the required amount of expertise and effort, AI can help to automate a large amount of this workload and make it far more accessible. Blockchain-based systems are becoming increasingly popular and are frequently targeted by malicious actors, often resulting in huge financial losses, highlighting the need to better verify these systems and mitigate vulnerabilities. Arguably the most important component of these systems is the consensus protocol, which allows nodes to agree on decisions in a potentially adversarial environment. In this paper, we improve upon IsabeLLM, the automated theorem proving tool in Isabelle. Namely, we implement a Retrieval-Augmented Generation framework, Error tracing and counterexample generation for improved context supplied to the Large Language Model. Compatibility with the latest version of Isabelle and Sledgehammer is also implemented for improved efficiency. We compare the performance of the two versions of IsabeLLM in their ability to complete the verification of Bitcoin's Proof of Work consensus.

翻译：人工智能的进步使面向定理证明的AI成为形式化验证计算机系统的有效手段。传统上，由于形式化验证所需的专业知识和投入巨大，其应用主要局限于安全关键系统，而AI能够自动化处理大量工作并显著降低使用门槛。基于区块链的系统日益普及，却频繁遭受恶意攻击，导致巨额经济损失，凸显了加强系统验证与漏洞缓解的必要性。共识协议作为此类系统最关键的组成部分，使节点能在潜在对抗环境中达成一致决策。本文对IsabeLLM——基于Isabelle的自动化定理证明工具进行了改进：具体实现了检索增强生成框架、错误追踪与反例生成机制，以提升提供给大语言模型的上下文质量；同时适配最新版Isabelle和Sledgehammer以提高效率。我们通过比较两个版本IsabeLLM完成比特币工作量证明共识验证的能力，评估了其性能差异。

0

相关内容

工程可信赖的机器学习运维——基于零知识证明

工程可信赖的机器学习运维——基于零知识证明

专知会员服务

10+阅读 · 2025年5月27日

【博士论文】《用于可验证数学自动化的语言模型：交互、集成与自动形式化》

【博士论文】《用于可验证数学自动化的语言模型：交互、集成与自动形式化》

专知会员服务

19+阅读 · 2025年3月14日

【CMU博士论文】可验证数学自动化的语言模型交互、集成与自动形式化

【CMU博士论文】可验证数学自动化的语言模型交互、集成与自动形式化

专知会员服务

21+阅读 · 2025年2月14日

【ETHZ博士论文】人工智能稳健性和公平性的形式化与统计认证

【ETHZ博士论文】人工智能稳健性和公平性的形式化与统计认证

专知会员服务

20+阅读 · 2024年8月14日

【普林斯顿博士论文】深度学习在自动定理证明中的应用, 95页pdf

【普林斯顿博士论文】深度学习在自动定理证明中的应用, 95页pdf

专知会员服务

36+阅读 · 2024年2月28日

ChatGPT |《自动常识推理的基准：综述》纽约大学2023年71页长综述论文

ChatGPT |《自动常识推理的基准：综述》纽约大学2023年71页长综述论文

专知会员服务

67+阅读 · 2023年2月24日

【AAAI2022教程】深度神经网络的形式化验证:理论与实践，80页ppt与视频

【AAAI2022教程】深度神经网络的形式化验证:理论与实践，80页ppt与视频

专知会员服务

20+阅读 · 2022年2月25日

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

专知会员服务

108+阅读 · 2021年10月6日

智能合约的形式化验证方法研究综述

专知会员服务

34+阅读 · 2021年5月8日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

133+阅读 · 2020年5月14日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

10+阅读 · 2022年10月29日

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

103+阅读 · 2022年10月17日

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

37+阅读 · 2022年7月31日

智能合约的形式化验证方法研究综述

智能合约的形式化验证方法研究综述

专知

16+阅读 · 2021年5月8日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

【强化学习】叶志豪：介绍强化学习及其在 NLP 上的应用｜分享总结

【强化学习】叶志豪：介绍强化学习及其在 NLP 上的应用｜分享总结

产业智能官

20+阅读 · 2018年7月24日

NLP中自动生产文摘（auto text summarization）

NLP中自动生产文摘（auto text summarization）

机器学习研究会

14+阅读 · 2017年10月10日

天元数学交流项目图像处理中的数学理论及方法研讨会

国家自然科学基金

9+阅读 · 2017年12月31日

理性安全两方计算协议设计与安全性证明

国家自然科学基金

0+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

可证明安全的确定性公钥加密体制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习和马尔科夫逻辑网络的特殊视频识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

Mask-Proof: An LLM-based Automated Data Curation Pipeline on Mathematical Proofs

Arxiv

0+阅读 · 6月13日

Learning to Reason with Insight for Informal Theorem Proving

Arxiv

0+阅读 · 5月29日

Automating Formal Verification with Reinforcement Learning and Recursive Inference

Arxiv

0+阅读 · 5月29日

Automating Formal Verification with Agent-Guided Tree Search

Arxiv

0+阅读 · 5月26日

ReasonOps: A Unified Operational Paradigm for Trustworthy Verified LLM Reasoning

Arxiv

0+阅读 · 5月26日

Verus-SpecGym: An Agentic Environment for Evaluating Specification Autoformalization

Arxiv

0+阅读 · 5月26日

Inductive Deductive Synthesis: Enabling AI to Generate Formally Verified Systems

Arxiv

0+阅读 · 5月22日

Pseudo-Formalization for Automatic Proof Verification

Arxiv

0+阅读 · 5月19日

Lean Meets Theoretical Computer Science: Scalable Synthesis of Theorem Proving Challenges in Formal-Informal Pairs

Arxiv

0+阅读 · 5月18日

KVerus: Scalable and Resilient Formal Verification Proof Generation for Rust Code

Arxiv

0+阅读 · 5月5日

VIP会员

文章信息

相关主题

形式化验证

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

工程可信赖的机器学习运维——基于零知识证明

工程可信赖的机器学习运维——基于零知识证明

专知会员服务

10+阅读 · 2025年5月27日

【博士论文】《用于可验证数学自动化的语言模型：交互、集成与自动形式化》

【博士论文】《用于可验证数学自动化的语言模型：交互、集成与自动形式化》

专知会员服务

19+阅读 · 2025年3月14日

【CMU博士论文】可验证数学自动化的语言模型交互、集成与自动形式化

【CMU博士论文】可验证数学自动化的语言模型交互、集成与自动形式化

专知会员服务

21+阅读 · 2025年2月14日

【ETHZ博士论文】人工智能稳健性和公平性的形式化与统计认证

【ETHZ博士论文】人工智能稳健性和公平性的形式化与统计认证

专知会员服务

20+阅读 · 2024年8月14日

【普林斯顿博士论文】深度学习在自动定理证明中的应用, 95页pdf

【普林斯顿博士论文】深度学习在自动定理证明中的应用, 95页pdf

专知会员服务

36+阅读 · 2024年2月28日

ChatGPT |《自动常识推理的基准：综述》纽约大学2023年71页长综述论文

ChatGPT |《自动常识推理的基准：综述》纽约大学2023年71页长综述论文

专知会员服务

67+阅读 · 2023年2月24日

【AAAI2022教程】深度神经网络的形式化验证:理论与实践，80页ppt与视频

【AAAI2022教程】深度神经网络的形式化验证:理论与实践，80页ppt与视频

专知会员服务

20+阅读 · 2022年2月25日

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

专知会员服务

108+阅读 · 2021年10月6日

智能合约的形式化验证方法研究综述

专知会员服务

34+阅读 · 2021年5月8日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

133+阅读 · 2020年5月14日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

10+阅读 · 2022年10月29日

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

103+阅读 · 2022年10月17日

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

37+阅读 · 2022年7月31日

智能合约的形式化验证方法研究综述

智能合约的形式化验证方法研究综述

专知

16+阅读 · 2021年5月8日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

【强化学习】叶志豪：介绍强化学习及其在 NLP 上的应用｜分享总结

【强化学习】叶志豪：介绍强化学习及其在 NLP 上的应用｜分享总结

产业智能官

20+阅读 · 2018年7月24日

NLP中自动生产文摘（auto text summarization）

NLP中自动生产文摘（auto text summarization）

机器学习研究会

14+阅读 · 2017年10月10日

相关论文

Mask-Proof: An LLM-based Automated Data Curation Pipeline on Mathematical Proofs

Arxiv

0+阅读 · 6月13日

Learning to Reason with Insight for Informal Theorem Proving

Arxiv

0+阅读 · 5月29日

Automating Formal Verification with Reinforcement Learning and Recursive Inference

Arxiv

0+阅读 · 5月29日

Automating Formal Verification with Agent-Guided Tree Search

Arxiv

0+阅读 · 5月26日

ReasonOps: A Unified Operational Paradigm for Trustworthy Verified LLM Reasoning

Arxiv

0+阅读 · 5月26日

Verus-SpecGym: An Agentic Environment for Evaluating Specification Autoformalization

Arxiv

0+阅读 · 5月26日

Inductive Deductive Synthesis: Enabling AI to Generate Formally Verified Systems

Arxiv

0+阅读 · 5月22日

Pseudo-Formalization for Automatic Proof Verification

Arxiv

0+阅读 · 5月19日

Lean Meets Theoretical Computer Science: Scalable Synthesis of Theorem Proving Challenges in Formal-Informal Pairs

Arxiv

0+阅读 · 5月18日

KVerus: Scalable and Resilient Formal Verification Proof Generation for Rust Code

Arxiv

0+阅读 · 5月5日

相关基金

天元数学交流项目图像处理中的数学理论及方法研讨会

国家自然科学基金

9+阅读 · 2017年12月31日

理性安全两方计算协议设计与安全性证明

国家自然科学基金

0+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

可证明安全的确定性公钥加密体制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习和马尔科夫逻辑网络的特殊视频识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员