Reproducibility in Event-Log Research: A Parametrised Generator and Benchmark for Event-based Signatures - 专知论文

会员服务 ·

0

事件 · 数据集 · 基准 · 基准测试 · 参数化 ·

Reproducibility in Event-Log Research: A Parametrised Generator and Benchmark for Event-based Signatures

翻译：事件日志研究中的可复现性：一种基于事件签名的参数化生成器与基准测试

Saad Khan,Simon Parkinson,Monika Roopak

Event-based datasets are crucial for cybersecurity analysis. A key use case is detecting event-based signatures, which represent attacks spanning multiple events and can only be understood once the relevant events are identified and linked. Analysing event datasets is essential for monitoring system security, but their growing volume and frequency create significant scalability and processing difficulties. Researchers rely on these datasets to develop and test techniques for automatically identifying signatures. However, because real datasets are security-sensitive and rarely shared, it becomes difficult to perform meaningful comparative evaluation between different approaches. This work addresses this evaluation limitation by offering a systematic method for generating event logs with known ground truth, enabling reproducible and comparable research. We present a novel parametrised generation technique capable of producing synthetic event datasets that contain event-based signatures for discovery. To demonstrate the capabilities of the technique, we provide a benchmark in signature detection. Our benchmarking demonstrated the suitability of DBSCAN, achieving a score greater than 0.95 Adjusted Rand Index on most generated datasets. This work enhances the ability of researchers to develop and benchmark new cybersecurity techniques, ultimately contributing to more robust and effective cybersecurity measures.

翻译：基于事件的数据集对网络安全分析至关重要。其核心应用场景之一是检测基于事件的签名，这类签名代表跨越多个事件的攻击模式，只有在识别并关联相关事件后才能被理解。分析事件数据集对于监控系统安全至关重要，但这些数据集不断增长的规模和频率带来了显著的扩展性与处理难题。研究人员依赖这些数据集来开发和测试自动识别签名的技术。然而，由于真实数据集涉及安全敏感性且极少被共享，在不同方法之间进行有意义的比较评估变得十分困难。本研究通过提供一种生成具有已知真实标注事件日志的系统性方法，解决了这一评估局限，从而支持可复现与可比较的研究。我们提出了一种新颖的参数化生成技术，能够生成包含待发现事件签名的合成事件数据集。为展示该技术的性能，我们提供了签名检测领域的基准测试。我们的基准测试证明了DBSCAN的适用性，在大多数生成数据集上取得了大于0.95的调整兰德指数得分。这项工作提升了研究人员开发和评估新型网络安全技术的能力，最终有助于建立更稳健有效的网络安全措施。

0

相关内容

面向研究问题的深度学习事件抽取综述

面向研究问题的深度学习事件抽取综述

专知会员服务

26+阅读 · 2024年12月9日

【KDD2024】LogParser-LLM：利用大型语言模型推动高效日志解析

【KDD2024】LogParser-LLM：利用大型语言模型推动高效日志解析

专知会员服务

27+阅读 · 2024年9月5日

事件抽取的再评价:过去、现在和未来的挑战

事件抽取的再评价:过去、现在和未来的挑战

专知会员服务

25+阅读 · 2023年11月28日

什么是事件知识图谱？中科院计算所发布《事件知识图谱综述》论文，阐述从历史、本体、实例和应用视角定义EKG

什么是事件知识图谱？中科院计算所发布《事件知识图谱综述》论文，阐述从历史、本体、实例和应用视角定义EKG

专知会员服务

102+阅读 · 2022年1月5日

埃默里大学最新「大数据时代事件预测」综述论文，37页pdf

埃默里大学最新「大数据时代事件预测」综述论文，37页pdf

专知会员服务

29+阅读 · 2021年7月20日

北航《深度学习事件抽取》文献综述和当前趋势

北航《深度学习事件抽取》文献综述和当前趋势

专知会员服务

87+阅读 · 2021年7月6日

ACL2021 | OntoED：利用本体表示学习实现低资源的事件抽取

专知会员服务

24+阅读 · 2021年6月19日

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

专知会员服务

68+阅读 · 2020年7月21日

基于深度学习的多标签生成研究进展

基于深度学习的多标签生成研究进展

专知会员服务

147+阅读 · 2020年4月25日

【元学习 | 论文】元学习与动态记忆为基础的原型网络的小样本突发事件检测，浙江大学，阿里巴巴

【元学习 | 论文】元学习与动态记忆为基础的原型网络的小样本突发事件检测，浙江大学，阿里巴巴

专知会员服务

57+阅读 · 2019年11月21日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【KDD2020】动态知识图谱的多事件预测

【KDD2020】动态知识图谱的多事件预测

专知

88+阅读 · 2020年8月31日

事件知识图谱构建研究进展与趋势

事件知识图谱构建研究进展与趋势

THU数据派

99+阅读 · 2019年12月11日

论文浅尝 | 基于事理图谱的脚本事件预测

论文浅尝 | 基于事理图谱的脚本事件预测

开放知识图谱

10+阅读 · 2019年12月10日

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

开放知识图谱

26+阅读 · 2019年11月8日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

开放知识图谱

26+阅读 · 2018年11月1日

免费 | 从文本匹配到图文匹配:所见所想所找 - 基于生成模型的多模态检索

免费 | 从文本匹配到图文匹配:所见所想所找 - 基于生成模型的多模态检索

AI研习社

44+阅读 · 2018年3月23日

赛尔原创 | 搭建基于依存句法和短语结构句法结合的金融领域事件元素抽取系统实践

赛尔原创 | 搭建基于依存句法和短语结构句法结合的金融领域事件元素抽取系统实践

哈工大SCIR

19+阅读 · 2017年12月22日

复杂运动场景视频大数据中异常事件检测研究

国家自然科学基金

2+阅读 · 2015年12月31日

社会化多媒体中的事件分析研究

国家自然科学基金

2+阅读 · 2015年12月31日

支持可扩展事务处理的数据库日志机制及其实现

国家自然科学基金

0+阅读 · 2015年12月31日

基于格的高效签名方案的设计与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

面向微博数据的位置相关事件检测和时空异常聚类模式挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

支持软件可信演化的故障定位研究

国家自然科学基金

0+阅读 · 2014年12月31日

Scalable Durational Event Models: Application to Physical and Digital Interactions

Arxiv

0+阅读 · 2月4日

ContraLog: Log File Anomaly Detection with Contrastive Learning and Masked Language Modeling

Arxiv

0+阅读 · 2月3日

From Label Error Detection to Correction: A Modular Framework and Benchmark for Object Detection Datasets

Arxiv

0+阅读 · 1月30日

Trackly: A Unified SaaS Platform for User Behavior Analytics and Real Time Rule Based Anomaly Detection

Arxiv

0+阅读 · 1月30日

VERSA: Verified Event Data Format for Reliable Soccer Analytics

Arxiv

0+阅读 · 1月29日

FusionLog: Cross-System Log-based Anomaly Detection via Fusion of General and Proprietary Knowledge

Arxiv

0+阅读 · 1月28日

CanaryBench: Stress Testing Privacy Leakage in Cluster-Level Conversation Summaries

Arxiv

0+阅读 · 1月25日

A Scalable Predictive Modelling Approach to Identifying Duplicate Adverse Event Reports for Drugs and Vaccines

Arxiv

0+阅读 · 1月22日

RiskCueBench: Benchmarking Anticipatory Reasoning from Early Risk Cues in Video-Language Models

Arxiv

0+阅读 · 1月21日

Data-Driven Feature Tracking for Event Cameras With and Without Frames

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

最新内容

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

2+阅读 · 今天11:43

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

2+阅读 · 今天11:41

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

5+阅读 · 今天6:30

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

5+阅读 · 今天6:18

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

6+阅读 · 今天6:08

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

6+阅读 · 今天5:54

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

7+阅读 · 今天5:22

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

7+阅读 · 今天5:15

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

7+阅读 · 今天3:42

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

5+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

7+阅读 · 6月24日

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

10+阅读 · 6月24日

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

9+阅读 · 6月24日

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

7+阅读 · 6月24日

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

9+阅读 · 6月24日

相关VIP内容

面向研究问题的深度学习事件抽取综述

面向研究问题的深度学习事件抽取综述

专知会员服务

26+阅读 · 2024年12月9日

【KDD2024】LogParser-LLM：利用大型语言模型推动高效日志解析

【KDD2024】LogParser-LLM：利用大型语言模型推动高效日志解析

专知会员服务

27+阅读 · 2024年9月5日

事件抽取的再评价:过去、现在和未来的挑战

事件抽取的再评价:过去、现在和未来的挑战

专知会员服务

25+阅读 · 2023年11月28日

什么是事件知识图谱？中科院计算所发布《事件知识图谱综述》论文，阐述从历史、本体、实例和应用视角定义EKG

什么是事件知识图谱？中科院计算所发布《事件知识图谱综述》论文，阐述从历史、本体、实例和应用视角定义EKG

专知会员服务

102+阅读 · 2022年1月5日

埃默里大学最新「大数据时代事件预测」综述论文，37页pdf

埃默里大学最新「大数据时代事件预测」综述论文，37页pdf

专知会员服务

29+阅读 · 2021年7月20日

北航《深度学习事件抽取》文献综述和当前趋势

北航《深度学习事件抽取》文献综述和当前趋势

专知会员服务

87+阅读 · 2021年7月6日

ACL2021 | OntoED：利用本体表示学习实现低资源的事件抽取

专知会员服务

24+阅读 · 2021年6月19日

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

专知会员服务

68+阅读 · 2020年7月21日

基于深度学习的多标签生成研究进展

基于深度学习的多标签生成研究进展

专知会员服务

147+阅读 · 2020年4月25日

【元学习 | 论文】元学习与动态记忆为基础的原型网络的小样本突发事件检测，浙江大学，阿里巴巴

【元学习 | 论文】元学习与动态记忆为基础的原型网络的小样本突发事件检测，浙江大学，阿里巴巴

专知会员服务

57+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

网状网络及其在军事领域的运用

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

相关资讯

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【KDD2020】动态知识图谱的多事件预测

【KDD2020】动态知识图谱的多事件预测

专知

88+阅读 · 2020年8月31日

事件知识图谱构建研究进展与趋势

事件知识图谱构建研究进展与趋势

THU数据派

99+阅读 · 2019年12月11日

论文浅尝 | 基于事理图谱的脚本事件预测

论文浅尝 | 基于事理图谱的脚本事件预测

开放知识图谱

10+阅读 · 2019年12月10日

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

开放知识图谱

26+阅读 · 2019年11月8日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

开放知识图谱

26+阅读 · 2018年11月1日

免费 | 从文本匹配到图文匹配:所见所想所找 - 基于生成模型的多模态检索

免费 | 从文本匹配到图文匹配:所见所想所找 - 基于生成模型的多模态检索

AI研习社

44+阅读 · 2018年3月23日

赛尔原创 | 搭建基于依存句法和短语结构句法结合的金融领域事件元素抽取系统实践

赛尔原创 | 搭建基于依存句法和短语结构句法结合的金融领域事件元素抽取系统实践

哈工大SCIR

19+阅读 · 2017年12月22日

相关论文

Scalable Durational Event Models: Application to Physical and Digital Interactions

Arxiv

0+阅读 · 2月4日

ContraLog: Log File Anomaly Detection with Contrastive Learning and Masked Language Modeling

Arxiv

0+阅读 · 2月3日

From Label Error Detection to Correction: A Modular Framework and Benchmark for Object Detection Datasets

Arxiv

0+阅读 · 1月30日

Trackly: A Unified SaaS Platform for User Behavior Analytics and Real Time Rule Based Anomaly Detection

Arxiv

0+阅读 · 1月30日

VERSA: Verified Event Data Format for Reliable Soccer Analytics

Arxiv

0+阅读 · 1月29日

FusionLog: Cross-System Log-based Anomaly Detection via Fusion of General and Proprietary Knowledge

Arxiv

0+阅读 · 1月28日

CanaryBench: Stress Testing Privacy Leakage in Cluster-Level Conversation Summaries

Arxiv

0+阅读 · 1月25日

A Scalable Predictive Modelling Approach to Identifying Duplicate Adverse Event Reports for Drugs and Vaccines

Arxiv

0+阅读 · 1月22日

RiskCueBench: Benchmarking Anticipatory Reasoning from Early Risk Cues in Video-Language Models

Arxiv

0+阅读 · 1月21日

Data-Driven Feature Tracking for Event Cameras With and Without Frames

Arxiv

0+阅读 · 1月15日

相关基金

复杂运动场景视频大数据中异常事件检测研究

国家自然科学基金

2+阅读 · 2015年12月31日

社会化多媒体中的事件分析研究

国家自然科学基金

2+阅读 · 2015年12月31日

支持可扩展事务处理的数据库日志机制及其实现

国家自然科学基金

0+阅读 · 2015年12月31日

基于格的高效签名方案的设计与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

面向微博数据的位置相关事件检测和时空异常聚类模式挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

支持软件可信演化的故障定位研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员