Open-source software (OSS) is a critical component of modern software systems, yet supply chain security remains challenging in practice due to unavailable or obfuscated source code. Consequently, security teams often rely on runtime observations collected from sandboxed executions to investigate suspicious third-party components. We present HeteroGAT-Rank, an industry-oriented runtime behavior mining system that supports analyst-in-the-loop supply chain threat investigation. The system models execution-time behaviors of OSS packages as lightweight heterogeneous graphs and applies attention-based graph learning to rank behavioral patterns that are most relevant for security analysis. Rather than aiming for fully automated detection, HeteroGAT-Rank surfaces actionable runtime signals - such as file, network, and command activities - to guide manual investigation and threat hunting. To operate at ecosystem scale, the system decouples offline behavior mining from online analysis and integrates parallel graph construction for efficient processing across multiple ecosystems. An evaluation on a large-scale OSS execution dataset shows that HeteroGAT-Rank effectively highlights meaningful and interpretable behavioral indicators aligned with real-world vulnerability and attack trends, supporting practical security workflows under realistic operational constraints.


翻译:开源软件是现代软件系统的关键组成部分,但由于源代码不可用或经过混淆,供应链安全在实践中仍面临挑战。因此,安全团队通常依赖从沙箱执行环境中收集的运行时观测数据来调查可疑的第三方组件。本文提出HeteroGAT-Rank,一个面向工业应用的运行时行为挖掘系统,支持分析师在环的供应链威胁调查。该系统将开源软件包在运行时的行为建模为轻量级异质图,并应用基于注意力的图学习技术对与安全分析最相关的行为模式进行排序。HeteroGAT-Rank并非追求完全自动化检测,而是呈现可操作的运行时信号——如文件、网络和命令活动——以指导人工调查和威胁狩猎。为了在生态系统规模上运行,该系统将离线行为挖掘与在线分析解耦,并集成并行图构建机制,以实现跨多个生态系统的高效处理。基于大规模开源软件执行数据集的评估表明,HeteroGAT-Rank能有效突出与真实世界漏洞及攻击趋势相符、具有意义且可解释的行为指标,在实际操作约束下支持实用的安全工作流程。

0
下载
关闭预览

相关内容

生成技术在时空数据挖掘中的应用
专知会员服务
39+阅读 · 2024年6月5日
《21世纪开源情报和执法应用》2023最新113页论文
专知会员服务
62+阅读 · 2023年5月9日
时空数据挖掘:综述
专知会员服务
103+阅读 · 2022年6月30日
【电子书】大数据挖掘,Mining of Massive Datasets,附513页PDF
专知会员服务
105+阅读 · 2020年3月22日
流程/过程挖掘(Process Mining)最新综述
PaperWeekly
23+阅读 · 2022年9月19日
时空数据挖掘:综述
专知
36+阅读 · 2022年6月30日
OpenNRE 2.0:可一键运行的开源关系抽取工具包
PaperWeekly
22+阅读 · 2019年10月30日
suricata下的挖矿行为检测
FreeBuf
14+阅读 · 2019年2月7日
资源 | 清华大学开源OpenKE:知识表示学习平台
机器之心
10+阅读 · 2017年11月4日
关于数据挖掘,有几本书推荐给你......
图灵教育
16+阅读 · 2017年10月11日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
14+阅读 · 2008年12月31日
VIP会员
最新内容
(译文)认知战:以士兵为目标,塑造战略
专知会员服务
2+阅读 · 今天3:12
(中文)认知战的本体论基础(2026报告)
专知会员服务
17+阅读 · 今天1:45
美空军条令(2026):外国对内防御
专知会员服务
3+阅读 · 今天1:32
美国与以色列如何在攻击伊朗中使用人工智能
专知会员服务
7+阅读 · 4月16日
《自动化战略情报管控》
专知会员服务
3+阅读 · 4月16日
得失评估:审视对伊朗战争的轨迹(简报)
专知会员服务
3+阅读 · 4月16日
【CMU博士论文】迈向可解释机器学习的理论基础
相关VIP内容
生成技术在时空数据挖掘中的应用
专知会员服务
39+阅读 · 2024年6月5日
《21世纪开源情报和执法应用》2023最新113页论文
专知会员服务
62+阅读 · 2023年5月9日
时空数据挖掘:综述
专知会员服务
103+阅读 · 2022年6月30日
【电子书】大数据挖掘,Mining of Massive Datasets,附513页PDF
专知会员服务
105+阅读 · 2020年3月22日
相关资讯
流程/过程挖掘(Process Mining)最新综述
PaperWeekly
23+阅读 · 2022年9月19日
时空数据挖掘:综述
专知
36+阅读 · 2022年6月30日
OpenNRE 2.0:可一键运行的开源关系抽取工具包
PaperWeekly
22+阅读 · 2019年10月30日
suricata下的挖矿行为检测
FreeBuf
14+阅读 · 2019年2月7日
资源 | 清华大学开源OpenKE:知识表示学习平台
机器之心
10+阅读 · 2017年11月4日
关于数据挖掘,有几本书推荐给你......
图灵教育
16+阅读 · 2017年10月11日
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
14+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员