S$^2$F: Principled Hybrid Testing With Fuzzing, Symbolic Execution, and Sampling - 专知论文

会员服务 ·

0

混合 · 工具 · 融合 · 测试方法 · 采样技术 ·

S$^2$F: Principled Hybrid Testing With Fuzzing, Symbolic Execution, and Sampling

翻译：S$^2$F：融合模糊测试、符号执行与采样的原则性混合测试方法

Lianjing Wang,Yufeng Zhang,Kenli Li,Zhenbang Chen,Xu Zhou,Pengfei Wang,Guangning Song,Ji Wang

Hybrid testing that integrates fuzzing, symbolic execution, and sampling has demonstrated superior testing efficiency compared to individual techniques. However, the state-of-the-art (SOTA) hybrid testing tools do not fully exploit the capabilities of symbolic execution and sampling in two key aspects. First, the SOTA hybrid testing tools employ tailored symbolic execution engines that tend to over-prune branches, leading to considerable time wasted waiting for seeds from the fuzzer and missing opportunities to discover crashes. Second, existing methods do not apply sampling to the appropriate branches and therefore cannot utilize the full capability of sampling. To address these two limitations, we propose a novel hybrid testing architecture that combines the precision of conventional symbolic execution with the scalability of tailored symbolic execution engines. Based on this architecture, we propose several principles for combining fuzzing, symbolic execution, and sampling. We implement our method in a hybrid testing tool S$^2$F. To evaluate its effectiveness, we conduct extensive experiments on 15 real-world programs. Experimental results demonstrate that S$^2$F outperforms the SOTA tool, achieving an average improvement of 6.14% in edge coverage and 32.6% in discovered crashes. Notably, our tool uncovers three previously unknown crashes in real-world programs.

翻译：混合测试通过集成模糊测试、符号执行与采样技术，已展现出相较于单一技术更优的测试效率。然而，当前最先进的混合测试工具在两个方面未能充分发挥符号执行与采样的潜力。首先，现有工具采用的定制化符号执行引擎倾向于过度剪枝分支，导致大量时间浪费于等待模糊测试生成的种子，并错失发现程序崩溃的机会。其次，现有方法未能将采样技术应用于合适的分支，因而无法充分利用采样的全部能力。为克服这两点局限，我们提出一种新型混合测试架构，该架构融合了传统符号执行的精确性与定制化符号执行引擎的可扩展性。基于此架构，我们提出了若干融合模糊测试、符号执行与采样的指导原则。我们将该方法实现为混合测试工具S$^2$F。为评估其有效性，我们在15个真实世界程序上进行了广泛实验。实验结果表明，S$^2$F优于当前最先进工具，在边覆盖率和发现的崩溃数量上分别平均提升了6.14%和32.6%。值得注意的是，我们的工具在真实世界程序中发现了三个此前未知的崩溃。

0

相关内容

【NeurIPS2024】面向视觉-语言模型测试时泛化的双原型演化

【NeurIPS2024】面向视觉-语言模型测试时泛化的双原型演化

专知会员服务

18+阅读 · 2024年10月17日

机载电子战管理系统（EWMS）开发《加强测试和评估流程：实施敏捷开发、测试自动化和基于模型的系统工程概念》180页

机载电子战管理系统（EWMS）开发《加强测试和评估流程：实施敏捷开发、测试自动化和基于模型的系统工程概念》180页

专知会员服务

59+阅读 · 2024年3月17日

【ETHZ博士论文】生成模型用于可控合成与在二维和三维中的操作，171页pdf

【ETHZ博士论文】生成模型用于可控合成与在二维和三维中的操作，171页pdf

专知会员服务

23+阅读 · 2024年2月9日

深度学习和基础模型在时间序列预测中的综述

深度学习和基础模型在时间序列预测中的综述

专知会员服务

50+阅读 · 2024年1月26日

博士论文《用于自动驾驶虚拟测试的雷达模拟验证方法》2023最新135页，斯图加特大学

博士论文《用于自动驾驶虚拟测试的雷达模拟验证方法》2023最新135页，斯图加特大学

专知会员服务

24+阅读 · 2023年3月22日

基于深度学习的图像融合方法综述

基于深度学习的图像融合方法综述

专知会员服务

57+阅读 · 2023年1月25日

【AI+军事】附论文《连接点-增强信息处理链，为支持东道国和领土作战的混合威胁检测》

【AI+军事】附论文《连接点-增强信息处理链，为支持东道国和领土作战的混合威胁检测》

专知会员服务

25+阅读 · 2022年5月5日

【AI+军事】附论文《全社会混合冲突的评估：活动信号与分析家洞察力的融合》

【AI+军事】附论文《全社会混合冲突的评估：活动信号与分析家洞察力的融合》

专知会员服务

31+阅读 · 2022年4月28日

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

专知会员服务

31+阅读 · 2020年12月20日

规则就够用？还是必须上机器学习？这46页ppt教你如何把规则引擎和机器学习融会贯通

规则就够用？还是必须上机器学习？这46页ppt教你如何把规则引擎和机器学习融会贯通

专知会员服务

57+阅读 · 2020年3月22日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

干货 | 基于深度学习的目标检测算法综述（二）

干货 | 基于深度学习的目标检测算法综述（二）

AI科技评论

21+阅读 · 2018年8月20日

国内外混合式教学研究现状述评——基于混合式教学的分析框架

国内外混合式教学研究现状述评——基于混合式教学的分析框架

MOOC

53+阅读 · 2018年6月2日

【深度学习】增加检测类别？这是一份目标检测的一般指南

【深度学习】增加检测类别？这是一份目标检测的一般指南

产业智能官

13+阅读 · 2018年5月27日

综述：深度学习时代的目标检测算法

综述：深度学习时代的目标检测算法

极市平台

27+阅读 · 2018年3月17日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于随机不可靠量测的事件触发多传感器系统融合估计方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

9+阅读 · 2015年12月31日

正则双极值模糊推理的理论与方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

整数关系探测的误差可控算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向二进制程序的静态结构化符号执行与动态组合方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据驱动的被动协议测试方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合目标感知与对比度的图像和视频显著性检测技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

Evaluating Numerical Accuracy in Mixed-Precision Computing by Dual-Delta Testing

Arxiv

0+阅读 · 2月11日

SAFuzz: Semantic-Guided Adaptive Fuzzing for LLM-Generated Code

Arxiv

0+阅读 · 2月11日

Does Programming Language Matter? An Empirical Study of Fuzzing Bug Detection

Arxiv

0+阅读 · 2月5日

SysFuSS: System-Level Firmware Fuzzing with Selective Symbolic Execution

Arxiv

0+阅读 · 2月2日

Hybrid Approach to Directed Fuzzing

Arxiv

0+阅读 · 1月30日

Dynamic Welfare-Maximizing Pooled Testing

Arxiv

0+阅读 · 1月30日

Investigating Test Overfitting on SWE-bench

Arxiv

0+阅读 · 1月27日

A Survey of Fuzzing Open-Source Operating Systems

Arxiv

0+阅读 · 1月19日

Hybrid Concolic Testing with Large Language Models for Guided Path Exploration

Arxiv

0+阅读 · 1月18日

Enhancing Fuzz Testing Efficiency through Automated Fuzz Target Generation

Arxiv

0+阅读 · 1月17日

VIP会员

文章信息

相关主题

最新内容

《面向国防应用的无人机选型：一种对比性多模糊多准则决策框架》

《面向国防应用的无人机选型：一种对比性多模糊多准则决策框架》

专知会员服务

8+阅读 · 今天7:05

无人机战争：从乌克兰到中东战场的沙希德（Shahed）无人机分析

无人机战争：从乌克兰到中东战场的沙希德（Shahed）无人机分析

专知会员服务

4+阅读 · 今天6:51

为初级军官战术训练设计生成式人工智能平台

为初级军官战术训练设计生成式人工智能平台

专知会员服务

4+阅读 · 今天6:43

《美空军条令出版物 3-40，反大规模杀伤性武器作战》

《美空军条令出版物 3-40，反大规模杀伤性武器作战》

专知会员服务

3+阅读 · 今天6:40

《美军条令：作战伤员后送保障》

《美军条令：作战伤员后送保障》

专知会员服务

4+阅读 · 今天6:38

《美空军条令出版物 4-0，维持》

《美空军条令出版物 4-0，维持》

专知会员服务

3+阅读 · 今天6:32

《通过自然语言与强化学习奖励机制将军事条令与目标融入AI智能体》

《通过自然语言与强化学习奖励机制将军事条令与目标融入AI智能体》

专知会员服务

6+阅读 · 今天6:30

《基于DIJKSTRA最短路径算法在AFSIM框架中实现高效动态威胁规避路径规划》

《基于DIJKSTRA最短路径算法在AFSIM框架中实现高效动态威胁规避路径规划》

专知会员服务

3+阅读 · 今天6:25

《修正错误与改进设计：运用数据耕耘支持基于智能体的军事仿真模型验证与确认》

《修正错误与改进设计：运用数据耕耘支持基于智能体的军事仿真模型验证与确认》

专知会员服务

3+阅读 · 今天6:24

《基于仿真的空军任务规划优化》

《基于仿真的空军任务规划优化》

专知会员服务

3+阅读 · 今天6:21

《基于离散事件仿真的航空母舰舰载机出动架次生成分析》

《基于离散事件仿真的航空母舰舰载机出动架次生成分析》

专知会员服务

3+阅读 · 今天6:17

《基于语义分割与深度强化学习的战场环境战术路径规划》

《基于语义分割与深度强化学习的战场环境战术路径规划》

专知会员服务

5+阅读 · 今天6:14

ICML 2026 Oral｜大模型为何难被提示纠正？内部先验限制标注适应性

ICML 2026 Oral｜大模型为何难被提示纠正？内部先验限制标注适应性

专知会员服务

4+阅读 · 6月8日

CVPR 2026教程：统一多模态模型走向收敛之路

CVPR 2026教程：统一多模态模型走向收敛之路

专知会员服务

7+阅读 · 6月8日

《人工智能在网络防御中的机遇》

《人工智能在网络防御中的机遇》

专知会员服务

6+阅读 · 6月8日

相关VIP内容

【NeurIPS2024】面向视觉-语言模型测试时泛化的双原型演化

【NeurIPS2024】面向视觉-语言模型测试时泛化的双原型演化

专知会员服务

18+阅读 · 2024年10月17日

机载电子战管理系统（EWMS）开发《加强测试和评估流程：实施敏捷开发、测试自动化和基于模型的系统工程概念》180页

机载电子战管理系统（EWMS）开发《加强测试和评估流程：实施敏捷开发、测试自动化和基于模型的系统工程概念》180页

专知会员服务

59+阅读 · 2024年3月17日

【ETHZ博士论文】生成模型用于可控合成与在二维和三维中的操作，171页pdf

【ETHZ博士论文】生成模型用于可控合成与在二维和三维中的操作，171页pdf

专知会员服务

23+阅读 · 2024年2月9日

深度学习和基础模型在时间序列预测中的综述

深度学习和基础模型在时间序列预测中的综述

专知会员服务

50+阅读 · 2024年1月26日

博士论文《用于自动驾驶虚拟测试的雷达模拟验证方法》2023最新135页，斯图加特大学

博士论文《用于自动驾驶虚拟测试的雷达模拟验证方法》2023最新135页，斯图加特大学

专知会员服务

24+阅读 · 2023年3月22日

基于深度学习的图像融合方法综述

基于深度学习的图像融合方法综述

专知会员服务

57+阅读 · 2023年1月25日

【AI+军事】附论文《连接点-增强信息处理链，为支持东道国和领土作战的混合威胁检测》

【AI+军事】附论文《连接点-增强信息处理链，为支持东道国和领土作战的混合威胁检测》

专知会员服务

25+阅读 · 2022年5月5日

【AI+军事】附论文《全社会混合冲突的评估：活动信号与分析家洞察力的融合》

【AI+军事】附论文《全社会混合冲突的评估：活动信号与分析家洞察力的融合》

专知会员服务

31+阅读 · 2022年4月28日

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

专知会员服务

31+阅读 · 2020年12月20日

规则就够用？还是必须上机器学习？这46页ppt教你如何把规则引擎和机器学习融会贯通

规则就够用？还是必须上机器学习？这46页ppt教你如何把规则引擎和机器学习融会贯通

专知会员服务

57+阅读 · 2020年3月22日

热门VIP内容

开通专知VIP会员享更多权益服务

无人机战争：从乌克兰到中东战场的沙希德（Shahed）无人机分析

《美空军条令出版物 3-40，反大规模杀伤性武器作战》

《面向国防应用的无人机选型：一种对比性多模糊多准则决策框架》

为初级军官战术训练设计生成式人工智能平台

相关资讯

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

干货 | 基于深度学习的目标检测算法综述（二）

干货 | 基于深度学习的目标检测算法综述（二）

AI科技评论

21+阅读 · 2018年8月20日

国内外混合式教学研究现状述评——基于混合式教学的分析框架

国内外混合式教学研究现状述评——基于混合式教学的分析框架

MOOC

53+阅读 · 2018年6月2日

【深度学习】增加检测类别？这是一份目标检测的一般指南

【深度学习】增加检测类别？这是一份目标检测的一般指南

产业智能官

13+阅读 · 2018年5月27日

综述：深度学习时代的目标检测算法

综述：深度学习时代的目标检测算法

极市平台

27+阅读 · 2018年3月17日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

相关论文

Evaluating Numerical Accuracy in Mixed-Precision Computing by Dual-Delta Testing

Arxiv

0+阅读 · 2月11日

SAFuzz: Semantic-Guided Adaptive Fuzzing for LLM-Generated Code

Arxiv

0+阅读 · 2月11日

Does Programming Language Matter? An Empirical Study of Fuzzing Bug Detection

Arxiv

0+阅读 · 2月5日

SysFuSS: System-Level Firmware Fuzzing with Selective Symbolic Execution

Arxiv

0+阅读 · 2月2日

Hybrid Approach to Directed Fuzzing

Arxiv

0+阅读 · 1月30日

Dynamic Welfare-Maximizing Pooled Testing

Arxiv

0+阅读 · 1月30日

Investigating Test Overfitting on SWE-bench

Arxiv

0+阅读 · 1月27日

A Survey of Fuzzing Open-Source Operating Systems

Arxiv

0+阅读 · 1月19日

Hybrid Concolic Testing with Large Language Models for Guided Path Exploration

Arxiv

0+阅读 · 1月18日

Enhancing Fuzz Testing Efficiency through Automated Fuzz Target Generation

Arxiv

0+阅读 · 1月17日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于随机不可靠量测的事件触发多传感器系统融合估计方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

9+阅读 · 2015年12月31日

正则双极值模糊推理的理论与方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

整数关系探测的误差可控算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向二进制程序的静态结构化符号执行与动态组合方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据驱动的被动协议测试方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合目标感知与对比度的图像和视频显著性检测技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员