Modern software systems are increasingly developed within rapid continuous integration and deployment (CI/CD) pipelines, where ensuring security prior to release presents significant technical and organizational challenges. Traditional static and dynamic analysis tools provide valuable structural and behavioral insights, yet they often operate in non-adaptive workflows and produce large volumes of warnings requiring manual triage. Feedback-driven fuzzing and search-based testing approaches have demonstrated the power of iterative input refinement guided by execution signals, while large language models (LLMs) have shown promise in automated test generation but frequently lack semantic grounding in program structure. This paper presents a systematic survey of adaptive and AI-augmented security testing research across five domains: (1) structural program analysis for vulnerability detection, (2) DevSecOps and continuous security testing, (3) feedback-driven fuzzing and search-based testing, (4) LLM-based automated test generation, and (5) emerging hybrid systems integrating program analysis with adaptive learning. We analyze fifty-five peer-reviewed studies drawn from a systematic search of four major databases yielding 22,088 raw records. Our analysis reveals a persistent disconnect between structural program representations (ASTs, CFGs, and CPGs) and adaptive testing mechanisms. We characterize this as structural-adaptive fragmentation: a systematic separation that neither paradigm individually addresses. No existing system incorporates human triage signals as feedback for refining structural models. We conclude by identifying five open research challenges and outlining a unified agenda for semantically grounded, feedback-driven, polyglot security testing frameworks.


翻译:现代软件系统日益在快速持续集成与持续部署(CI/CD)流水线中开发,确保发布前的安全面临显著的技术与组织挑战。传统静态与动态分析工具能提供有价值的结构与行为洞察,但它们往往在非自适应工作流中运行,并产生大量需人工分诊的告警。反馈驱动模糊测试与基于搜索的测试方法展示了通过执行信号引导迭代输入优化的能力,而大型语言模型(LLM)在自动化测试生成方面展现出潜力,但常缺乏程序结构的语义基础。本文从五个领域对自适应与AI增强的安全性测试研究进行系统综述:(1)面向漏洞检测的结构化程序分析,(2)DevSecOps与持续安全测试,(3)反馈驱动模糊测试与基于搜索的测试,(4)基于LLM的自动化测试生成,以及(5)融合程序分析与自适应学习的新兴混合系统。我们从四大数据库的系统搜索中筛选出55篇经过同行评审的研究,原始记录总数达22,088条。分析揭示,结构化程序表示(抽象语法树、控制流图、程序依赖图)与自适应测试机制之间存在持续脱节。我们将此特征化为结构-自适应碎片化:一种两种范式均无法单独解决的系统性分离。现有系统均未将人工分诊信号作为反馈用于改进结构模型。最后,我们识别出五大开放研究挑战,并提出了一个面向语义基础、反馈驱动、多语言安全测试框架的统一议程。

0
下载
关闭预览

相关内容

用于自动驾驶系统测试的生成式人工智能:综述
专知会员服务
17+阅读 · 2025年8月28日
《综述:测试与评估中应用的人工智能工具》
专知会员服务
75+阅读 · 2024年1月22日
《学习型系统的测试与评估》
专知会员服务
61+阅读 · 2023年3月12日
专知会员服务
98+阅读 · 2021年1月24日
《人工智能安全测评白皮书》,99页pdf
专知
36+阅读 · 2022年2月26日
深度学习在推荐系统中的应用综述(最全)
七月在线实验室
17+阅读 · 2018年5月5日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员