Log-based detection rules remain central to modern security operations, encoding domain expertise that analysts iteratively refine to balance detection coverage against alert volume. Yet while prior work has examined the evolution of network intrusion detection signatures, the longitudinal behavior of log-based detection rules has received little empirical study. We present the first longitudinal analysis of detection rule evolution across two widely used repositories: the community-driven Sigma project and the curated Splunk Security Content (SSC). To compare rule versions based on detection logic rather than surface syntax, we introduce a predicate graph intermediate representation that canonicalizes the logical structure of a rule, together with a tree alignment procedure for analyzing changes across revisions. We apply this method to 6,859 rule histories from Sigma and SSC and find that roughly 56% of rules undergo at least one revision on detection logic. Across rule lifetimes, evolution is predominantly non-monotonic, with over half of rules both adding and removing clauses over time. We further observe recurring reversions, indicating that changes are often revisited rather than strictly accumulated. Combining structural analysis with LLM-based inference and human validation of operational intent shows that roughly a quarter to a third of rules alternate between expanding coverage and reducing false positives, rather than converging toward a stable form. Together, these results reveal that detection rule evolution in public repositories reflects ongoing operational trade-offs rather than steady convergence. Our study raises questions about why rules change the way they do and supports research towards better processes for devising and deploying security rules.


翻译:基于日志的检测规则仍是现代安全运维的核心,编码了分析人员通过迭代优化以平衡检测覆盖率与告警量的领域专业知识。尽管已有研究探索了网络入侵检测签名的演化规律,但针对日志型检测规则纵向行为的大规模实证研究尚属空白。本文首次对两大广泛使用的知识库——社区驱动的Sigma项目与专业策划的Splunk安全内容(SSC)——中的检测规则演化进行了纵向分析。为基于检测逻辑而非表面语法比较规则版本,我们引入了一种谓词图中间表示,该表示能规范化规则的逻辑结构,并配套提出树对齐程序用于分析不同修订版本间的变更。我们将该方法应用于Sigma和SSC的6,859条规则历史记录,发现约56%的规则经历了至少一次检测逻辑修订。在规则生命周期内,演化呈现显著的非单调特征:超过半数的规则随时间推移既增加又删减子句。我们还观察到频繁的回归现象,表明变更往往被反复调整而非严格累积。通过将结构分析与基于大语言模型的推理及人工验证操作意图相结合,我们发现大约四分之一至三分之一的规则在扩大覆盖范围与减少误报之间交替切换,而非收敛至稳定形态。这些结果共同揭示了公共仓库中检测规则的演化反映了持续的操作权衡,而非逐步收敛。本研究提出的问题——规则为何以当前方式变化——为改进安全规则设计与部署流程的研究提供了支撑。

0
下载
关闭预览

相关内容

基于深度学习的入侵检测系统:综述
专知会员服务
15+阅读 · 2025年4月11日
基于扩散模型的异常检测综述
专知会员服务
30+阅读 · 2025年1月23日
基于博弈论的入侵检测与响应优化综述
专知会员服务
41+阅读 · 2023年7月23日
《基于高斯混合流和入包的异常检测》2023最新57页论文
专知会员服务
29+阅读 · 2023年5月15日
麦克瑞大学最新「深度学习社区检测」综述论文,28页pdf
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
从锚点到关键点:目标检测方法最新进展(2019)
GAN生成式对抗网络
14+阅读 · 2019年8月22日
从锚点到关键点,最新的目标检测方法发展趋势
计算机视觉life
17+阅读 · 2019年8月20日
异常检测论文大列表:方法、应用、综述
专知
126+阅读 · 2019年7月15日
使用SSD进行目标检测:目标检测第二篇
专知
29+阅读 · 2018年1月28日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
0+阅读 · 6月5日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员