Code-driven auditing fails when correctness depends on what the specification requires rather than how the code is written. Production blockchain networks expose this directly: byzantine consensus runs many independent clients of a shared specification, so a specification-divergence defect in one client can fork the network or halt finality. Existing tools reason one repository at a time, with no shared baseline held constant across implementations. We present SPECA, an LLM-driven audit framework that derives explicit, categorized security properties (invariants, pre/postconditions, trust assumptions) from natural-language specifications and reuses them across implementations. SPECA enables controlled cross-implementation comparison, detections grounded in specification invariants no code pattern encodes, and false positives traceable to a specific pipeline phase rather than opaque model errors. On the Sherlock Ethereum Fusaka Audit Contest (10 targets, 366 submissions), SPECA recovers all 15 in-scope H/M/L vulnerabilities expert-augmented (8/15 automated-only) and surfaces 4 fix-confirmed bugs, including a cryptographic-invariant violation missed by every adjudicated finding. On the RepoAudit C/C++ benchmark, SPECA reaches 88.9% precision at 100% recall (F1=0.94) and surfaces 12 author-validated bugs beyond ground truth, two externally validated. SPECA also flags 5 of RepoAudit's 40 published bugs as defensive-coding fixes with no reachable exploit path. False positives trace to three pipeline-pinned root causes; a multi-model study identifies property-generation quality as the binding constraint. End-to-end cost is ~$30 per H/M/L bug (~42 min wall-clock under parallel execution).


翻译:当正确性取决于规格要求的内容而非代码编写方式时,基于代码驱动的审计就会失效。生产级区块链网络直接暴露了这一问题:拜占庭式共识需要运行独立实现同一规格的多个客户端,因此单个客户端中的规格偏差缺陷可能导致网络分叉或终结性停滞。现有工具一次只推理一个代码仓库,无法跨实现保持恒定基准。我们提出SPECA——一种基于LLM的审计框架,能从自然语言规格中派生出显式、分类的安全属性(不变条件、前置/后置条件、信任假设),并在多个实现中重复使用。SPECA支持受控的跨实现比较、基于规格不变条件(无代码模式编码)的检测,以及可追溯至特定流水线阶段(而非不透明模型错误)的假阳性。在Sherlock以太坊Fusaka审计竞赛(10个目标,366份提交)中,SPECA恢复了所有15个经专家增强的H/M/L级别漏洞(8/15仅通过自动化发现),并呈现了4个经修复确认的缺陷,包括每个裁定结果都遗漏的密码学不变条件违反。在RepoAudit C/C++基准测试中,SPECA在100%召回率下达到88.9%精确率(F1=0.94),并发现了超越真实标注的12个经作者验证的缺陷(其中两个经外部验证)。SPECA还将RepoAudit的40个已发布缺陷中的5个标记为防御性编码修复(无可达利用路径)。假阳性可追溯至三个流水线固定的根本原因;一项多模型研究将属性生成质量确定为瓶颈约束。端到端成本约为每个H/M/L漏洞30美元(并行执行下约42分钟墙钟时间)。

0
下载
关闭预览

相关内容

代码(Code)是专知网的一个重要知识资料文档板块,旨在整理收录论文源代码、复现代码,经典工程代码等,便于用户查阅下载使用。
Meta-Transformer:多模态学习的统一框架
专知会员服务
59+阅读 · 2023年7月21日
编码计算研究综述
专知会员服务
22+阅读 · 2021年10月26日
【AAAI2021】对比聚类,Contrastive Clustering
专知
26+阅读 · 2021年1月30日
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
半监督多任务学习:Semisupervised Multitask Learning
我爱读PAMI
18+阅读 · 2018年4月29日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关VIP内容
Meta-Transformer:多模态学习的统一框架
专知会员服务
59+阅读 · 2023年7月21日
编码计算研究综述
专知会员服务
22+阅读 · 2021年10月26日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员