Security teams routinely simulate attacks against their own systems to check whether their monitoring would catch a real intruder. These Breach-and-Attack-Simulation (BAS) tools surface findings, but the security information and event management (SIEM) systems that watch production need detection rules -- and today a human bridges that gap by hand, reading each finding and writing the corresponding Sigma rule (a vendor-neutral detection format). We show this translation can be partially automated when probes are drawn from a locked corpus, so each finding carries a stable identifier back to the originating probe. We describe a deterministic synthesis function that maps each finding to a starter Sigma rule through a small template library (N=23, indexed by categories from the OWASP LLM and Web Top 10), with a back-reference to the originating finding and its MITRE ATT&CK technique. On two locked corpora (17-probe LLM, 23-probe Web), every bypassed-probe finding yields a starter rule, and all 17/17 emitted rules parse and convert to Splunk and Elasticsearch backends. Replayed through a live OpenSearch SIEM, the LLM rules fire on 30% of a held-out AdvBench subset and 14% of HarmBench at 7.7% false positives on a benign baseline; the Web side is validated structurally, not against a held-out attack set. The contribution is a verifiable, byte-stable path from BAS finding to operator-deployable starter rule, re-derivable from the published corpus and template library alone -- trading the breadth of LLM-generative methods for exact reproducibility and a typed traceback from any fired alert to the originating probe.


翻译:安全团队通常会对其自身系统进行模拟攻击,以检验监控能否捕获真实入侵者。这类攻防模拟(BAS)工具能输出检测发现,但负责监控生产环境的SIEM系统需要检测规则——目前,这一差距依赖人工弥合:分析师需手动阅读每条发现并编写对应的Sigma规则(一种厂商中立的检测格式)。我们证明,当探针来源于封闭语料库时,该翻译过程可实现部分自动化,从而使每条发现都带有可回溯至原始探针的稳定标识。我们描述了一种确定性合成函数,通过小型模板库(N=23,基于OWASP LLM与Web Top 10类别索引),将每条发现映射为初始Sigma规则,并附带回溯至原始发现及其MITRE ATT&CK技术的引用。在两个封闭语料库(17探针LLM与23探针Web)上,所有绕过探针的发现均生成初始规则,且17/17条已解析规则能成功转换至Splunk与Elasticsearch后端。通过实时OpenSearch SIEM重放测试,LLM规则在保留测试集AdvBench子集上触发30%的攻击样本,在HarmBench上触发14%的攻击样本,同时良性基线误报率为7.7%;Web侧规则仅通过结构验证,未使用保留攻击集测试。本研究的贡献在于构建了一条从BAS发现到可部署初始规则的可验证、字节稳定路径,仅依赖已发布的语料库与模板库即可复现——以牺牲LLM生成方法的广泛性为代价,换取了精确的可复现性,以及从任何触发警报到原始探针的类型化回溯能力。

0
下载
关闭预览

相关内容

《用于建模系统攻击路径的强化学习环境》
专知会员服务
22+阅读 · 3月5日
专知会员服务
48+阅读 · 2021年5月17日
专知会员服务
56+阅读 · 2020年12月28日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
【泡泡图灵智库】Detect-SLAM:目标检测和SLAM相互收益
泡泡机器人SLAM
14+阅读 · 2019年6月28日
深度学习时代的目标检测算法
炼数成金订阅号
40+阅读 · 2018年3月19日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 6月8日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员