Malware classification models often face performance degradation due to concept drift, arising from evolving threat landscapes and the emergence of novel malware families. This paper presents FARM (Few-shot Adaptive Recognition of Malware), a framework designed to detect and adapt to both covariate and label drift in Windows Portable Executable (PE) malware classification. FARM leverages a triplet autoencoder to project samples into a discriminative latent space, enabling unsupervised drift detection via DBSCAN clustering and dynamic thresholding. For rapid adaptation, it employs few-shot learning using prototype-based classification, requiring only a handful of labeled samples. FARM also supports full retraining when enough drifted samples accumulate, updating the latent space for long-term integration. Experiments on the BenchMFC dataset demonstrate that FARM improves classification performance under covariate drift by 5.6\%, and achieves an average F1 score of 0.85 on unseen malware families using only few-shot adaptation, which further increases to 0.94 after retraining. These results highlight FARM's robustness and adaptability in dynamic malware detection environments under limited supervision.


翻译:恶意软件分类模型常因威胁环境演变及新型恶意软件家族出现导致的概念漂移而面临性能退化。本文提出FARM(恶意软件少样本自适应识别)框架,旨在检测并适应Windows可移植可执行(PE)恶意软件分类中的协变量漂移与标签漂移。FARM利用三元组自编码器将样本映射至判别性潜在空间,通过DBSCAN聚类与动态阈值实现无监督漂移检测。为快速适应,该框架采用基于原型分类的少样本学习,仅需少量标注样本。当积累足够漂移样本时,FARM支持通过全量重训练更新潜在空间以实现长期整合。在BenchMFC数据集上的实验表明,FARM将协变量漂移下的分类性能提升5.6%,仅通过少样本适应即在未见恶意软件家族上获得0.85的平均F1分数,重训练后进一步提升至0.94。这些结果凸显了FARM在有限监督条件下动态恶意软件检测环境中的鲁棒性与自适应能力。

0
下载
关闭预览

相关内容

专知会员服务
38+阅读 · 2021年9月15日
专知会员服务
19+阅读 · 2021年6月10日
【Mila】通用表示Transformer少样本图像分类
专知会员服务
33+阅读 · 2020年9月7日
浅析Faiss在推荐系统中的应用及原理
凡人机器学习
11+阅读 · 2020年5月5日
推荐系统之矩阵分解家族
图与推荐
13+阅读 · 2020年3月28日
TheFatRat 一款简易后门工具
黑白之道
35+阅读 · 2019年10月23日
【资源】领域自适应相关论文、代码分享
专知
32+阅读 · 2019年10月12日
通过Termux打造免root安卓渗透工具
黑客技术与网络安全
16+阅读 · 2019年8月16日
小样本学习(Few-shot Learning)综述
云栖社区
22+阅读 · 2019年4月6日
Spooftooph - 用于欺骗或克隆蓝牙设备的自动工具
黑白之道
17+阅读 · 2019年2月27日
React Native 分包哪家强?看这文就够了!
程序人生
13+阅读 · 2019年1月16日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
专知会员服务
38+阅读 · 2021年9月15日
专知会员服务
19+阅读 · 2021年6月10日
【Mila】通用表示Transformer少样本图像分类
专知会员服务
33+阅读 · 2020年9月7日
相关资讯
浅析Faiss在推荐系统中的应用及原理
凡人机器学习
11+阅读 · 2020年5月5日
推荐系统之矩阵分解家族
图与推荐
13+阅读 · 2020年3月28日
TheFatRat 一款简易后门工具
黑白之道
35+阅读 · 2019年10月23日
【资源】领域自适应相关论文、代码分享
专知
32+阅读 · 2019年10月12日
通过Termux打造免root安卓渗透工具
黑客技术与网络安全
16+阅读 · 2019年8月16日
小样本学习(Few-shot Learning)综述
云栖社区
22+阅读 · 2019年4月6日
Spooftooph - 用于欺骗或克隆蓝牙设备的自动工具
黑白之道
17+阅读 · 2019年2月27日
React Native 分包哪家强?看这文就够了!
程序人生
13+阅读 · 2019年1月16日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员