《H4rm0ny：用于规避恶意软件生成和检测的多智能体学习的竞争性两人零和马尔可夫博弈》2022最新12页论文，加拿大国防研究与发展部 - 专知VIP

会员服务 ·

16

军事防务 · 多智能体学习 · 恶意软件 · 两人零和马尔可夫博弈 · 博弈论 ·

2022 年 10 月 26 日

《H4rm0ny：用于规避恶意软件生成和检测的多智能体学习的竞争性两人零和马尔可夫博弈》2022最新12页论文，加拿大国防研究与发展部

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

为了打击日益多变和易变的现代恶意软件，机器学习（ML）现在是对现有基于签名的恶意软件分流和识别技术的一种流行和有效的补充。然而，ML也是对手的一个现成的工具。最近的研究表明，恶意软件可以通过深度强化学习（RL）技术进行修改，以绕过基于人工智能和基于签名的反病毒系统，而不改变其原有的恶意功能。这些研究只专注于生成规避样本，并假设静态检测系统为敌人。

恶意软件检测和回避本质上形成了一个双方的猫鼠游戏。在本文中，我们模拟现实生活中的场景，按照零和多智能体强化学习（MARL）的范式，提出了第一个用于规避恶意软件检测和生成的双人竞争博弈。我们对最近的恶意软件进行的实验表明，所产生的恶意软件检测智能体对对抗性攻击更加强大。此外，所产生的恶意软件修改智能体能够产生更多的规避样本，骗过基于人工智能和其他反恶意软件技术。

关键词：对抗性学习，恶意软件分析，神经网络，强化学习，马尔科夫决策过程

图1：单次的H4rm0ny训练过程。还显示了所有系统配置的结果。从我们的数据集中选择一个恶意软件的样本。然后，它被送到一个修改的过程中。如果任何修改产生了一个恶意软件的回避样本，该样本将被训练成检测智能体。一旦样本被训练成检测智能体，修改智能体的策略就会随着对恶意软件样本和检测智能体的状态所采取的一系列行动而更新。

成为VIP会员查看完整内容

27

相关内容

军事防务

军事防务数据板块介绍：系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块，其核心在于整合全球新兴国防技术（军事人工智能、无人系统等）、热点案例（俄乌战争、美以伊战争）等方面的最新时讯、研究报告/论文、条令法规、案例分析，为战略研判、情报分析、决策支持等提供知识支撑。

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知会员服务

102+阅读 · 2022年11月24日

《网络安全异常和异常值检测验证》美国陆军2022最新73页技术总结报告

《网络安全异常和异常值检测验证》美国陆军2022最新73页技术总结报告

专知会员服务

53+阅读 · 2022年11月3日

【博士论文】《基于博弈论方法的智能审计》2022最新161页论文

【博士论文】《基于博弈论方法的智能审计》2022最新161页论文

专知会员服务

29+阅读 · 2022年9月26日

《有人与无人系统组队作战的感知和规避要求》加拿大国防研究与发展部

《有人与无人系统组队作战的感知和规避要求》加拿大国防研究与发展部

专知会员服务

104+阅读 · 2022年7月20日

《在深度神经网络分类器中防御对抗性样本》美国海军研究生院67页报告

《在深度神经网络分类器中防御对抗性样本》美国海军研究生院67页报告

专知会员服务

55+阅读 · 2022年5月19日

【AI+军事】附论文《对抗人工智能: 通过基于ai战略游戏，在攻防游戏中开发对抗攻击的鲁棒性》

【AI+军事】附论文《对抗人工智能: 通过基于ai战略游戏，在攻防游戏中开发对抗攻击的鲁棒性》

专知会员服务

74+阅读 · 2022年4月29日

【AI+军事】附论文《敏感还是不敏感？如何攻击和捍卫文件安全分类模型》

【AI+军事】附论文《敏感还是不敏感？如何攻击和捍卫文件安全分类模型》

专知会员服务

19+阅读 · 2022年4月26日

机器学习的 7 个关键军事应用

机器学习的 7 个关键军事应用

专知会员服务

345+阅读 · 2022年4月24日

【AI+军事】附论文+PPT 《用于战术分析、训练和优化的深度自我优化人工智能》

【AI+军事】附论文+PPT 《用于战术分析、训练和优化的深度自我优化人工智能》

专知会员服务

84+阅读 · 2022年4月17日

【AI+军事】美国海军研究实验室最新论文《“示范学习”(LfD)——从对抗性专家演示中鲁棒地学习》

【AI+军事】美国海军研究实验室最新论文《“示范学习”(LfD)——从对抗性专家演示中鲁棒地学习》

专知会员服务

86+阅读 · 2022年4月9日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

《网络安全异常和异常值检测验证》美国陆军2022最新73页技术总结报告

《网络安全异常和异常值检测验证》美国陆军2022最新73页技术总结报告

专知

4+阅读 · 2022年11月5日

《重新设计反无人机系统架构》2022最新160页论文，美国海军研究生院

《重新设计反无人机系统架构》2022最新160页论文，美国海军研究生院

专知

62+阅读 · 2022年10月26日

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

专知

9+阅读 · 2022年10月9日

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

专知

8+阅读 · 2022年9月22日

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

专知

43+阅读 · 2022年7月27日

安全隐患：神经网络可以隐藏恶意软件

安全隐患：神经网络可以隐藏恶意软件

THU数据派

0+阅读 · 2022年3月16日

我的杀毒软件直接扫描电磁波，查木马准确率99.82%

我的杀毒软件直接扫描电磁波，查木马准确率99.82%

机器之心

0+阅读 · 2022年1月14日

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

AI前线

21+阅读 · 2019年10月28日

一文概览用于数据集增强的对抗生成网络架构

一文概览用于数据集增强的对抗生成网络架构

论智

357+阅读 · 2018年3月16日

面向应用商店的移动智能终端恶意软件检测关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

恶意软件静态分析与检测关键技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

抑制性神经元及抑制性神经网络在脑中风时的自我保护机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向犯罪预防的监视目标规避行为模式识别与分析

国家自然科学基金

4+阅读 · 2013年12月31日

新型网络环境下的身份相关安全问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

支持笔交互的数字纸张生成与墨水表达

国家自然科学基金

0+阅读 · 2009年12月31日

可编程嵌入式系统形式化建模与自动验证技术的研究

国家自然科学基金

0+阅读 · 2009年12月31日

多Agent对抗环境中联盟形成问题的研究

国家自然科学基金

8+阅读 · 2008年12月31日

Text Mining-Based Patent Analysis for Automated Rule Checking in AEC

Arxiv

0+阅读 · 2022年12月12日

3D LiDAR Aided GNSS NLOS Mitigation for Reliable GNSS-RTK Positioning in Urban Canyons

Arxiv

0+阅读 · 2022年12月11日

Stream processors and comodels

Arxiv

0+阅读 · 2022年12月9日

PKDGA: A Partial Knowledge-based Domain Generation Algorithm for Botnets

Arxiv

0+阅读 · 2022年12月8日

The Ordered Matrix Dirichlet for Modeling Ordinal Dynamics

Arxiv

0+阅读 · 2022年12月8日

VeriX: Towards Verified Explainability of Deep Neural Networks

Arxiv

21+阅读 · 2022年12月2日

A Survey of Decision Making in Adversarial Games

Arxiv

85+阅读 · 2022年7月16日

Unmanned Aerial Vehicle Swarm-Enabled Edge Computing: Potentials, Promising Technologies, and Challenges

Arxiv

48+阅读 · 2022年1月21日

Image Manipulation Detection by Multi-View Multi-Scale Supervision

Arxiv

13+阅读 · 2021年7月25日

Unsupervised Cipher Cracking Using Discrete GANs

Arxiv

11+阅读 · 2018年1月15日

VIP会员

相关主题

多智能体学习

两人零和马尔可夫博弈

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

3+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

5+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

7+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

10+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

11+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

15+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

10+阅读 · 6月17日

相关VIP内容

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知会员服务

102+阅读 · 2022年11月24日

《网络安全异常和异常值检测验证》美国陆军2022最新73页技术总结报告

《网络安全异常和异常值检测验证》美国陆军2022最新73页技术总结报告

专知会员服务

53+阅读 · 2022年11月3日

【博士论文】《基于博弈论方法的智能审计》2022最新161页论文

【博士论文】《基于博弈论方法的智能审计》2022最新161页论文

专知会员服务

29+阅读 · 2022年9月26日

《有人与无人系统组队作战的感知和规避要求》加拿大国防研究与发展部

《有人与无人系统组队作战的感知和规避要求》加拿大国防研究与发展部

专知会员服务

104+阅读 · 2022年7月20日

《在深度神经网络分类器中防御对抗性样本》美国海军研究生院67页报告

《在深度神经网络分类器中防御对抗性样本》美国海军研究生院67页报告

专知会员服务

55+阅读 · 2022年5月19日

【AI+军事】附论文《对抗人工智能: 通过基于ai战略游戏，在攻防游戏中开发对抗攻击的鲁棒性》

【AI+军事】附论文《对抗人工智能: 通过基于ai战略游戏，在攻防游戏中开发对抗攻击的鲁棒性》

专知会员服务

74+阅读 · 2022年4月29日

【AI+军事】附论文《敏感还是不敏感？如何攻击和捍卫文件安全分类模型》

【AI+军事】附论文《敏感还是不敏感？如何攻击和捍卫文件安全分类模型》

专知会员服务

19+阅读 · 2022年4月26日

机器学习的 7 个关键军事应用

机器学习的 7 个关键军事应用

专知会员服务

345+阅读 · 2022年4月24日

【AI+军事】附论文+PPT 《用于战术分析、训练和优化的深度自我优化人工智能》

【AI+军事】附论文+PPT 《用于战术分析、训练和优化的深度自我优化人工智能》

专知会员服务

84+阅读 · 2022年4月17日

【AI+军事】美国海军研究实验室最新论文《“示范学习”(LfD)——从对抗性专家演示中鲁棒地学习》

【AI+军事】美国海军研究实验室最新论文《“示范学习”(LfD)——从对抗性专家演示中鲁棒地学习》

专知会员服务

86+阅读 · 2022年4月9日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

《网络安全异常和异常值检测验证》美国陆军2022最新73页技术总结报告

《网络安全异常和异常值检测验证》美国陆军2022最新73页技术总结报告

专知

4+阅读 · 2022年11月5日

《重新设计反无人机系统架构》2022最新160页论文，美国海军研究生院

《重新设计反无人机系统架构》2022最新160页论文，美国海军研究生院

专知

62+阅读 · 2022年10月26日

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

专知

9+阅读 · 2022年10月9日

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

专知

8+阅读 · 2022年9月22日

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

专知

43+阅读 · 2022年7月27日

安全隐患：神经网络可以隐藏恶意软件

安全隐患：神经网络可以隐藏恶意软件

THU数据派

0+阅读 · 2022年3月16日

我的杀毒软件直接扫描电磁波，查木马准确率99.82%

我的杀毒软件直接扫描电磁波，查木马准确率99.82%

机器之心

0+阅读 · 2022年1月14日

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

AI前线

21+阅读 · 2019年10月28日

一文概览用于数据集增强的对抗生成网络架构

一文概览用于数据集增强的对抗生成网络架构

论智

357+阅读 · 2018年3月16日

相关基金

面向应用商店的移动智能终端恶意软件检测关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

恶意软件静态分析与检测关键技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

抑制性神经元及抑制性神经网络在脑中风时的自我保护机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向犯罪预防的监视目标规避行为模式识别与分析

国家自然科学基金

4+阅读 · 2013年12月31日

新型网络环境下的身份相关安全问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

支持笔交互的数字纸张生成与墨水表达

国家自然科学基金

0+阅读 · 2009年12月31日

可编程嵌入式系统形式化建模与自动验证技术的研究

国家自然科学基金

0+阅读 · 2009年12月31日

多Agent对抗环境中联盟形成问题的研究

国家自然科学基金

8+阅读 · 2008年12月31日

相关论文

Text Mining-Based Patent Analysis for Automated Rule Checking in AEC

Arxiv

0+阅读 · 2022年12月12日

3D LiDAR Aided GNSS NLOS Mitigation for Reliable GNSS-RTK Positioning in Urban Canyons

Arxiv

0+阅读 · 2022年12月11日

Stream processors and comodels

Arxiv

0+阅读 · 2022年12月9日

PKDGA: A Partial Knowledge-based Domain Generation Algorithm for Botnets

Arxiv

0+阅读 · 2022年12月8日

The Ordered Matrix Dirichlet for Modeling Ordinal Dynamics

Arxiv

0+阅读 · 2022年12月8日

VeriX: Towards Verified Explainability of Deep Neural Networks

Arxiv

21+阅读 · 2022年12月2日

A Survey of Decision Making in Adversarial Games

Arxiv

85+阅读 · 2022年7月16日

Unmanned Aerial Vehicle Swarm-Enabled Edge Computing: Potentials, Promising Technologies, and Challenges

Arxiv

48+阅读 · 2022年1月21日

Image Manipulation Detection by Multi-View Multi-Scale Supervision

Arxiv

13+阅读 · 2021年7月25日

Unsupervised Cipher Cracking Using Discrete GANs

Arxiv

11+阅读 · 2018年1月15日

微信扫码咨询专知VIP会员