Machine-Generated, Machine-Checked Proofs for a Verified Compiler (Experience Report) - 专知论文

会员服务 ·

0

编译器 · 构建 · 报告 · 代码 · 变换 ·

Machine-Generated, Machine-Checked Proofs for a Verified Compiler (Experience Report)

翻译：机器生成、机器验证的证明在验证编译器中的应用（经验报告）

Zoe Paraskevopoulou

We report on using an agentic coding assistant (Claude Code, powered by Claude Opus 4.6) to mechanize a substantial Rocq correctness proof from scratch, with human guidance but without human proof writing. The proof establishes semantic preservation for the administrative normal form (ANF) transformation in the CertiCoq verified compiler for Rocq. The closely related continuation-passing style (CPS) transformation in CertiCoq was previously proved correct by human experts over several months. We use this proof as a template and instruct the LLM to adapt the proof technique to the ANF setting, which differs in important technical ways. The resulting ANF proof comprises approximately 7,800 lines of Rocq (larger than the 5,300-line CPS proof) and was developed in approximately 96 hours. We describe the proof technique and report on the experience of developing it with an LLM, discussing both the strengths and limitations of the approach and its implications for verified compiler construction.

翻译：我们报告了使用智能编码助手（Claude Code，基于Claude Opus 4.6构建）在人工指导下（但无需人工撰写证明）从头开始机械化构建一个大规模Rocq正确性证明的过程。该证明确立了CertiCoq验证编译器中管理范式（ANF）变换的语义保持性。CertiCoq中密切相关的延续传递风格（CPS）变换先前由人类专家耗时数月完成正确性证明。我们以此证明为模板，指导大语言模型将证明技术适配到存在重要技术差异的ANF场景。最终生成的ANF证明包含约7,800行Rocq代码（超过CPS证明的5,300行），开发耗时约96小时。我们详细阐述了该证明技术，并报告了使用大语言模型开发该证明的经验，同时讨论了该方法的优势与局限性及其对验证编译器构建的启示。

0

相关内容

编译器

编译器（Compiler），是一种计算机程序，它会将用某种编程语言写成的源代码（原始语言），转换成另一种编程语言（目标语言）。

构建面向终端的 AI 编程智能体：脚手架、测试环境、上下文工程及实践经验

构建面向终端的 AI 编程智能体：脚手架、测试环境、上下文工程及实践经验

专知会员服务

25+阅读 · 3月8日

《软件定义网络元素与机器代码的形式化验证》

《软件定义网络元素与机器代码的形式化验证》

专知会员服务

14+阅读 · 2025年11月18日

《结合机器人行为以实现安全、智能的执行》

《结合机器人行为以实现安全、智能的执行》

专知会员服务

17+阅读 · 2023年7月4日

【2023新书】程序证明，Program Proofs，642页pdf

【2023新书】程序证明，Program Proofs，642页pdf

专知会员服务

67+阅读 · 2023年3月29日

《实施机器伦理：使用机器学习培养有道德的机器》2022年180页博士论文，科克大学

《实施机器伦理：使用机器学习培养有道德的机器》2022年180页博士论文，科克大学

专知会员服务

23+阅读 · 2023年1月28日

最新【关于机器翻译评测研究的综述性报告 An Overview on Machine Translation Evaluation】Lifeng Han

最新【关于机器翻译评测研究的综述性报告 An Overview on Machine Translation Evaluation】Lifeng Han

专知会员服务

17+阅读 · 2022年2月25日

自编码器及其应用综述

专知会员服务

37+阅读 · 2021年10月16日

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

专知会员服务

48+阅读 · 2020年8月8日

【重磅】迈向可信赖的人工智能，59位作者，80页pdf阐述Trustworthy AI可验证声明的支持机制

【重磅】迈向可信赖的人工智能，59位作者，80页pdf阐述Trustworthy AI可验证声明的支持机制

专知会员服务

63+阅读 · 2020年4月16日

【ACL2020】生成事实验证解释，Generating Fact Checking Explanations

【ACL2020】生成事实验证解释，Generating Fact Checking Explanations

专知会员服务

17+阅读 · 2020年4月15日

推荐！【中文版】美国海军研究实验室《将机器学习异常检测技术应用于美国海军空间系统运行》43页技术报告

推荐！【中文版】美国海军研究实验室《将机器学习异常检测技术应用于美国海军空间系统运行》43页技术报告

专知

33+阅读 · 2022年7月13日

《智能制造机器视觉在线检测测试方法》国家标准意见稿

《智能制造机器视觉在线检测测试方法》国家标准意见稿

专知

13+阅读 · 2022年2月22日

智能合约的形式化验证方法研究综述

智能合约的形式化验证方法研究综述

专知

16+阅读 · 2021年5月8日

文本生成公开数据集/开源工具/经典论文详细列表分享

文本生成公开数据集/开源工具/经典论文详细列表分享

深度学习与NLP

30+阅读 · 2019年9月22日

机器翻译学术论文写作方法和技巧

机器翻译学术论文写作方法和技巧

清华大学研究生教育

11+阅读 · 2018年12月23日

Forge：如何管理你的机器学习实验

Forge：如何管理你的机器学习实验

专知

11+阅读 · 2018年12月1日

中文NLP用什么？中文自然语言处理的完整机器处理流程

中文NLP用什么？中文自然语言处理的完整机器处理流程

人工智能头条

61+阅读 · 2018年9月5日

【论文推荐】最新六篇对抗自编码器相关论文—多尺度网络节点表示、生成对抗自编码、逆映射、Wasserstein、条件对抗、去噪

【论文推荐】最新六篇对抗自编码器相关论文—多尺度网络节点表示、生成对抗自编码、逆映射、Wasserstein、条件对抗、去噪

专知

20+阅读 · 2018年4月7日

视频 | 论文最爱的变分自编码器（ VAE），不了解一下？

视频 | 论文最爱的变分自编码器（ VAE），不了解一下？

AI科技评论

13+阅读 · 2018年3月17日

【论文推荐】最新7篇变分自编码器（VAE）相关论文—汉语诗歌、生成模型、跨模态、MR图像重建、机器翻译、推断、合成人脸

【论文推荐】最新7篇变分自编码器（VAE）相关论文—汉语诗歌、生成模型、跨模态、MR图像重建、机器翻译、推断、合成人脸

专知

11+阅读 · 2018年2月12日

面向网络虚拟化的网络层可信身份验证机制研究

国家自然科学基金

0+阅读 · 2017年12月31日

小规模量子混成系统的验证

国家自然科学基金

0+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

在线检测工件表面质量的“透明窗”方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

云存储中无证书可证明数据持有方案关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

多元数据与函数型数据的序贯检验方法与控制图研究

国家自然科学基金

0+阅读 · 2014年12月31日

可重构的环境自适应RS码软判决译码器研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

Testing, Credible Compilation, and Verification in the Axon Verified Compiler in Lean and Claude Code

Arxiv

0+阅读 · 5月3日

Practical Formal Verification for MLIR Programs

Arxiv

0+阅读 · 5月1日

A Multi-Agent Approach for Claim Verification from Tabular Data Documents

Arxiv

0+阅读 · 4月19日

Making AI Compliance Evidence Machine-Readable

Arxiv

0+阅读 · 4月15日

Broken by Default: A Formal Verification Study of Security Vulnerabilities in AI-Generated Code

Arxiv

0+阅读 · 4月8日

Cobblestone: A Divide-and-Conquer Approach for Automating Formal Verification

Arxiv

0+阅读 · 4月6日

AutoVerifier: An Agentic Automated Verification Framework Using Large Language Models

Arxiv

0+阅读 · 4月3日

Denotation-based Compositional Compiler Verification

Arxiv

0+阅读 · 3月29日

VeriStruct: AI-assisted Automated Verification of Data-Structure Modules in Verus

Arxiv

0+阅读 · 3月3日

Delegation and Verification Under AI

Arxiv

0+阅读 · 3月3日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

9+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

构建面向终端的 AI 编程智能体：脚手架、测试环境、上下文工程及实践经验

构建面向终端的 AI 编程智能体：脚手架、测试环境、上下文工程及实践经验

专知会员服务

25+阅读 · 3月8日

《软件定义网络元素与机器代码的形式化验证》

《软件定义网络元素与机器代码的形式化验证》

专知会员服务

14+阅读 · 2025年11月18日

《结合机器人行为以实现安全、智能的执行》

《结合机器人行为以实现安全、智能的执行》

专知会员服务

17+阅读 · 2023年7月4日

【2023新书】程序证明，Program Proofs，642页pdf

【2023新书】程序证明，Program Proofs，642页pdf

专知会员服务

67+阅读 · 2023年3月29日

《实施机器伦理：使用机器学习培养有道德的机器》2022年180页博士论文，科克大学

《实施机器伦理：使用机器学习培养有道德的机器》2022年180页博士论文，科克大学

专知会员服务

23+阅读 · 2023年1月28日

最新【关于机器翻译评测研究的综述性报告 An Overview on Machine Translation Evaluation】Lifeng Han

最新【关于机器翻译评测研究的综述性报告 An Overview on Machine Translation Evaluation】Lifeng Han

专知会员服务

17+阅读 · 2022年2月25日

自编码器及其应用综述

专知会员服务

37+阅读 · 2021年10月16日

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

专知会员服务

48+阅读 · 2020年8月8日

【重磅】迈向可信赖的人工智能，59位作者，80页pdf阐述Trustworthy AI可验证声明的支持机制

【重磅】迈向可信赖的人工智能，59位作者，80页pdf阐述Trustworthy AI可验证声明的支持机制

专知会员服务

63+阅读 · 2020年4月16日

【ACL2020】生成事实验证解释，Generating Fact Checking Explanations

【ACL2020】生成事实验证解释，Generating Fact Checking Explanations

专知会员服务

17+阅读 · 2020年4月15日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

推荐！【中文版】美国海军研究实验室《将机器学习异常检测技术应用于美国海军空间系统运行》43页技术报告

推荐！【中文版】美国海军研究实验室《将机器学习异常检测技术应用于美国海军空间系统运行》43页技术报告

专知

33+阅读 · 2022年7月13日

《智能制造机器视觉在线检测测试方法》国家标准意见稿

《智能制造机器视觉在线检测测试方法》国家标准意见稿

专知

13+阅读 · 2022年2月22日

智能合约的形式化验证方法研究综述

智能合约的形式化验证方法研究综述

专知

16+阅读 · 2021年5月8日

文本生成公开数据集/开源工具/经典论文详细列表分享

文本生成公开数据集/开源工具/经典论文详细列表分享

深度学习与NLP

30+阅读 · 2019年9月22日

机器翻译学术论文写作方法和技巧

机器翻译学术论文写作方法和技巧

清华大学研究生教育

11+阅读 · 2018年12月23日

Forge：如何管理你的机器学习实验

Forge：如何管理你的机器学习实验

专知

11+阅读 · 2018年12月1日

中文NLP用什么？中文自然语言处理的完整机器处理流程

中文NLP用什么？中文自然语言处理的完整机器处理流程

人工智能头条

61+阅读 · 2018年9月5日

【论文推荐】最新六篇对抗自编码器相关论文—多尺度网络节点表示、生成对抗自编码、逆映射、Wasserstein、条件对抗、去噪

【论文推荐】最新六篇对抗自编码器相关论文—多尺度网络节点表示、生成对抗自编码、逆映射、Wasserstein、条件对抗、去噪

专知

20+阅读 · 2018年4月7日

视频 | 论文最爱的变分自编码器（ VAE），不了解一下？

视频 | 论文最爱的变分自编码器（ VAE），不了解一下？

AI科技评论

13+阅读 · 2018年3月17日

【论文推荐】最新7篇变分自编码器（VAE）相关论文—汉语诗歌、生成模型、跨模态、MR图像重建、机器翻译、推断、合成人脸

【论文推荐】最新7篇变分自编码器（VAE）相关论文—汉语诗歌、生成模型、跨模态、MR图像重建、机器翻译、推断、合成人脸

专知

11+阅读 · 2018年2月12日

相关论文

Testing, Credible Compilation, and Verification in the Axon Verified Compiler in Lean and Claude Code

Arxiv

0+阅读 · 5月3日

Practical Formal Verification for MLIR Programs

Arxiv

0+阅读 · 5月1日

A Multi-Agent Approach for Claim Verification from Tabular Data Documents

Arxiv

0+阅读 · 4月19日

Making AI Compliance Evidence Machine-Readable

Arxiv

0+阅读 · 4月15日

Broken by Default: A Formal Verification Study of Security Vulnerabilities in AI-Generated Code

Arxiv

0+阅读 · 4月8日

Cobblestone: A Divide-and-Conquer Approach for Automating Formal Verification

Arxiv

0+阅读 · 4月6日

AutoVerifier: An Agentic Automated Verification Framework Using Large Language Models

Arxiv

0+阅读 · 4月3日

Denotation-based Compositional Compiler Verification

Arxiv

0+阅读 · 3月29日

VeriStruct: AI-assisted Automated Verification of Data-Structure Modules in Verus

Arxiv

0+阅读 · 3月3日

Delegation and Verification Under AI

Arxiv

0+阅读 · 3月3日

相关基金

面向网络虚拟化的网络层可信身份验证机制研究

国家自然科学基金

0+阅读 · 2017年12月31日

小规模量子混成系统的验证

国家自然科学基金

0+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

在线检测工件表面质量的“透明窗”方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

云存储中无证书可证明数据持有方案关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

多元数据与函数型数据的序贯检验方法与控制图研究

国家自然科学基金

0+阅读 · 2014年12月31日

可重构的环境自适应RS码软判决译码器研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员