This work proposes a structural approach to concept drift detection in malware classification using decision tree rulesets. Classifiers are trained across temporal windows on the EMBER2024 dataset, and drift is quantified by comparing extracted rule representations using feature importance, prediction agreement, activation stability, and coverage metrics. These metrics are correlated with both accuracy degradation and data distribution shift as complementary drift indicators. The approach is evaluated across six malware families using fixed-interval and clustering-based windowing in family-vs-benign and family-vs-family settings, and compared against RIPPER and Transcendent baselines. Results show that fixed two-month windowing with feature-level Pearson correlation is the most reliable configuration, being the only one where all family pairs produce positive drift-accuracy correlations. The methods are complementary - no single approach dominates across all pairs.


翻译:本文提出一种基于决策树规则集的结构化方法,用于检测恶意软件分类中的概念漂移。利用EMBER2024数据集,在时间窗口上训练分类器,并通过特征重要性、预测一致性、激活稳定性及覆盖率指标对提取的规则表示进行比较,从而量化漂移程度。这些指标与准确率下降及数据分布偏移均具有相关性,可作为互补的漂移指示因子。在六种恶意软件家族上,采用固定间隔与基于聚类的窗口划分方法,分别在家族vs良性软件和家族vs家族场景下评估该方法,并与RIPPER和Transcendent基线进行对比。结果表明,固定双月窗口结合特征级皮尔逊相关性是最可靠的配置——它是唯一使所有家族对均产生正漂移-准确率相关性的方案。各方法具有互补性,无单一方法在所有家族对上占优。

0
下载
关闭预览

相关内容

软件(中国大陆及香港用语,台湾作软体,英文:Software)是一系列按照特定顺序组织的计算机数据和指令的集合。一般来讲软件被划分为编程语言、系统软件、应用软件和介于这两者之间的中间件。软件就是程序加文档的集合体。
《数据安全技术 数据分类分级规则》发布
专知会员服务
32+阅读 · 2024年3月22日
【AAAI 2022】基于数据分布生成的可预测概念漂移适应
专知会员服务
34+阅读 · 2022年1月12日
专知会员服务
24+阅读 · 2021年1月30日
干货 :基于用户画像的聚类分析
数据分析
22+阅读 · 2018年5月17日
【迁移学习】迁移学习在图像分类中的简单应用策略
侦测欺诈交易(异常点检测)
GBASE数据工程部数据团队
20+阅读 · 2017年5月10日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
4+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
4+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
《数据安全技术 数据分类分级规则》发布
专知会员服务
32+阅读 · 2024年3月22日
【AAAI 2022】基于数据分布生成的可预测概念漂移适应
专知会员服务
34+阅读 · 2022年1月12日
专知会员服务
24+阅读 · 2021年1月30日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员