As malware continues to become increasingly sophisticated, threatening, and evasive, malware detection systems must keep pace and become equally intelligent, powerful, and transparent. In this paper, we propose Assembly Flow Graph (AFG) to comprehensively represent the assembly flow of a binary executable as graph data. Importantly, AFG can be used to extract granular explanations needed to increase transparency for malware detection using Graph Neural Networks (GNNs). However, since AFGs may be large in practice, we also propose a Meta-Coarsening approach to improve computational tractability via graph reduction. To evaluate our proposed approach we consider several novel and existing metrics to quantify the granularity and quality of explanations. Lastly, we also consider several hyperparameters in our proposed Meta-Coarsening approach that can be used to control the final explanation size. We evaluate our proposed approach using the CIC-DGG-2025 dataset. Our results indicate that our proposed AFG and Meta-Coarsening approach can provide both increased explainability and inference performance at certain coarsening levels. However, most importantly, to the best of our knowledge, we are the first to consider granular explainability in malware detection using GNNs.


翻译:随着恶意软件日益复杂化、威胁化和规避化,恶意软件检测系统必须同步发展,具备同等的智能性、强大性和透明度。本文提出汇编流图(AFG),以图数据形式全面表征二进制可执行文件的汇编流程。重要的是,AFG可用于提取细粒度解释,从而提升基于图神经网络(GNNs)的恶意软件检测的透明度。然而,由于AFG在实际应用中可能规模较大,本文同时提出元粗化方法,通过图约简提升计算可处理性。为评估所提方法,我们采用若干新颖及现有指标来量化解释的细粒度性与质量。最后,我们还探讨了所提元粗化方法中可用于控制最终解释规模的若干超参数。我们在CIC-DGG-2025数据集上对所提方法进行评估。结果表明,所提出的AFG与元粗化方法在特定粗化层级下能同时提升可解释性与推理性能。但最重要的是,据我们所知,本研究首次在基于GNNs的恶意软件检测中实现了细粒度可解释性。

0
下载
关闭预览

相关内容

软件(中国大陆及香港用语,台湾作软体,英文:Software)是一系列按照特定顺序组织的计算机数据和指令的集合。一般来讲软件被划分为编程语言、系统软件、应用软件和介于这两者之间的中间件。软件就是程序加文档的集合体。
《基于动态图神经网络的恶意软件检测》
专知会员服务
14+阅读 · 1月28日
基于深度学习的伪装目标检测研究进展
专知会员服务
30+阅读 · 2025年4月12日
图神经网络在金融欺诈检测中的应用综述
专知会员服务
28+阅读 · 2024年11月22日
【ICML2023】图神经网络可以仅从图结构中恢复隐藏特征
专知会员服务
32+阅读 · 2023年4月27日
专知会员服务
19+阅读 · 2021年6月10日
深度学习赋能的恶意代码攻防研究进展
专知会员服务
30+阅读 · 2021年4月11日
深度学习可解释性研究进展
专知
19+阅读 · 2020年6月26日
基于素描图的细粒度图像检索【附PPT与视频资料】
人工智能前沿讲习班
13+阅读 · 2018年12月27日
神经网络可解释性最新进展
专知
18+阅读 · 2018年3月10日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员