面向生产级自主网络攻防仿真的研究 (Towards Production-Worthy Simulation for Autonomous Cyber Operations) - 专知论文

会员服务 ·

0

网络攻防 · 操作 · 智能体 · 强化学习智能体 · 强化学习 ·

Towards Production-Worthy Simulation for Autonomous Cyber Operations

翻译：面向生产级自主网络攻防仿真的研究

Konur Tholl,Mariam El Mezouar,Adrian Taylor,Ranwa Al Mallah

Simulated environments have proven invaluable in Autonomous Cyber Operations (ACO) where Reinforcement Learning (RL) agents can be trained without the computational overhead of emulation. These environments must accurately represent cybersecurity scenarios while producing the necessary signals to support RL training. In this study, we present a framework where we first extend CybORG's Cage Challenge 2 environment by implementing three new actions: Patch, Isolate, and Unisolate, to better represent the capabilities available to human operators in real-world settings. We then propose a design for agent development where we modify the reward signals and the agent's feature space to enhance training performance. To validate these modifications, we train DQN and PPO agents in the updated environment. Our study demonstrates that CybORG can be extended with additional realistic functionality, while maintaining its ability to generate informative training signals for RL agents.

翻译：在自主网络攻防领域，仿真环境已被证明具有不可估量的价值，强化学习智能体可在其中接受训练，而无需承担模拟技术带来的计算开销。此类环境必须精确复现网络安全场景，同时生成支持强化学习训练的必要信号。本研究提出一个框架：首先通过实现三种新操作（补丁修复、隔离与解除隔离）来扩展CybORG的Cage Challenge 2环境，以更准确地反映实际环境中人类操作员可用的处置能力；随后提出一种智能体开发方案，通过修改奖励信号与智能体特征空间以提升训练性能。为验证这些改进，我们在更新后的环境中训练了DQN与PPO智能体。研究表明，CybORG在保持为强化学习智能体生成有效训练信号能力的同时，可通过扩展额外现实功能来增强其仿真效能。

0

相关内容

网络攻防

《面向未来战场网络：人工智能辅助的万物软件化、虚拟化与智能化以提升网络接入能力》

《面向未来战场网络：人工智能辅助的万物软件化、虚拟化与智能化以提升网络接入能力》

专知会员服务

29+阅读 · 1月15日

《将自主系统整合入军事网络空间进攻行动的政策与技术建议》2025最新82页

《将自主系统整合入军事网络空间进攻行动的政策与技术建议》2025最新82页

专知会员服务

17+阅读 · 2025年11月11日

《具备集体态势感知能力的深度强化学习智能体在超视距空战中的应用研究》最新文献

《具备集体态势感知能力的深度强化学习智能体在超视距空战中的应用研究》最新文献

专知会员服务

43+阅读 · 2025年9月23日

【新书】利用生成式人工智能进行网络防御策略

【新书】利用生成式人工智能进行网络防御策略

专知会员服务

31+阅读 · 2024年10月18日

针对自动驾驶智能模型的攻击与防御

针对自动驾驶智能模型的攻击与防御

专知会员服务

19+阅读 · 2024年6月25日

《基于对手网络基础设施发掘来实现自动威胁建模》2023最新79页论文

《基于对手网络基础设施发掘来实现自动威胁建模》2023最新79页论文

专知会员服务

32+阅读 · 2023年5月14日

面向网络空间防御的对抗机器学习研究综述

专知会员服务

35+阅读 · 2021年8月13日

针对深度学习模型的对抗性攻击与防御

专知会员服务

48+阅读 · 2021年5月17日

网络攻击模型研究综述

专知会员服务

56+阅读 · 2020年12月28日

基于生成对抗网络的模仿学习综述, 苏州大学，计算机学报

专知会员服务

47+阅读 · 2020年2月1日

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

专知

32+阅读 · 2022年11月12日

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

专知

33+阅读 · 2022年10月26日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

65+阅读 · 2022年8月25日

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

专知

40+阅读 · 2022年7月27日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

最新《生成式对抗网络GAN进展》论文

最新《生成式对抗网络GAN进展》论文

专知

95+阅读 · 2019年4月5日

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

专知

16+阅读 · 2018年5月14日

【论文推荐】最新六篇对抗自编码器相关论文—多尺度网络节点表示、生成对抗自编码、逆映射、Wasserstein、条件对抗、去噪

【论文推荐】最新六篇对抗自编码器相关论文—多尺度网络节点表示、生成对抗自编码、逆映射、Wasserstein、条件对抗、去噪

专知

20+阅读 · 2018年4月7日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

分布式中继网络中的物理层攻击检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

产学研合作创新网络演化机理、模型及政策研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

Simulating Cyberattacks through a Breach Attack Simulation (BAS) Platform empowered by Security Chaos Engineering (SCE)

Arxiv

0+阅读 · 2月15日

Large Language Model Integration with Reinforcement Learning to Augment Decision-Making in Autonomous Cyber Operations

Arxiv

0+阅读 · 2月13日

In-Context Autonomous Network Incident Response: An End-to-End Large Language Model Agent Approach

Arxiv

0+阅读 · 2月13日

Beyond Rewards in Reinforcement Learning for Cyber Defence

Arxiv

0+阅读 · 2月12日

Agentic AI for Cybersecurity: A Meta-Cognitive Architecture for Governable Autonomy

Arxiv

0+阅读 · 2月12日

From Sands to Mansions: Towards Automated Cyberattack Emulation with Classical Planning and Large Language Models

Arxiv

0+阅读 · 2月5日

Beware Untrusted Simulators -- Reward-Free Backdoor Attacks in Reinforcement Learning

Arxiv

0+阅读 · 2月4日

Beyond Rewards in Reinforcement Learning for Cyber Defence

Arxiv

0+阅读 · 2月4日

TempoNet: Learning Realistic Communication and Timing Patterns for Network Traffic Simulation

Arxiv

0+阅读 · 1月22日

AttackMate: Realistic Emulation and Automation of Cyber Attack Scenarios Across the Kill Chain

Arxiv

0+阅读 · 1月20日

VIP会员

文章信息

相关主题

强化学习智能体

相关VIP内容

《面向未来战场网络：人工智能辅助的万物软件化、虚拟化与智能化以提升网络接入能力》

《面向未来战场网络：人工智能辅助的万物软件化、虚拟化与智能化以提升网络接入能力》

专知会员服务

29+阅读 · 1月15日

《将自主系统整合入军事网络空间进攻行动的政策与技术建议》2025最新82页

《将自主系统整合入军事网络空间进攻行动的政策与技术建议》2025最新82页

专知会员服务

17+阅读 · 2025年11月11日

《具备集体态势感知能力的深度强化学习智能体在超视距空战中的应用研究》最新文献

《具备集体态势感知能力的深度强化学习智能体在超视距空战中的应用研究》最新文献

专知会员服务

43+阅读 · 2025年9月23日

【新书】利用生成式人工智能进行网络防御策略

【新书】利用生成式人工智能进行网络防御策略

专知会员服务

31+阅读 · 2024年10月18日

针对自动驾驶智能模型的攻击与防御

针对自动驾驶智能模型的攻击与防御

专知会员服务

19+阅读 · 2024年6月25日

《基于对手网络基础设施发掘来实现自动威胁建模》2023最新79页论文

《基于对手网络基础设施发掘来实现自动威胁建模》2023最新79页论文

专知会员服务

32+阅读 · 2023年5月14日

面向网络空间防御的对抗机器学习研究综述

专知会员服务

35+阅读 · 2021年8月13日

针对深度学习模型的对抗性攻击与防御

专知会员服务

48+阅读 · 2021年5月17日

网络攻击模型研究综述

专知会员服务

56+阅读 · 2020年12月28日

基于生成对抗网络的模仿学习综述, 苏州大学，计算机学报

专知会员服务

47+阅读 · 2020年2月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

专知

32+阅读 · 2022年11月12日

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

专知

33+阅读 · 2022年10月26日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

65+阅读 · 2022年8月25日

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

专知

40+阅读 · 2022年7月27日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

最新《生成式对抗网络GAN进展》论文

最新《生成式对抗网络GAN进展》论文

专知

95+阅读 · 2019年4月5日

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

专知

16+阅读 · 2018年5月14日

【论文推荐】最新六篇对抗自编码器相关论文—多尺度网络节点表示、生成对抗自编码、逆映射、Wasserstein、条件对抗、去噪

【论文推荐】最新六篇对抗自编码器相关论文—多尺度网络节点表示、生成对抗自编码、逆映射、Wasserstein、条件对抗、去噪

专知

20+阅读 · 2018年4月7日

相关论文

Simulating Cyberattacks through a Breach Attack Simulation (BAS) Platform empowered by Security Chaos Engineering (SCE)

Arxiv

0+阅读 · 2月15日

Large Language Model Integration with Reinforcement Learning to Augment Decision-Making in Autonomous Cyber Operations

Arxiv

0+阅读 · 2月13日

In-Context Autonomous Network Incident Response: An End-to-End Large Language Model Agent Approach

Arxiv

0+阅读 · 2月13日

Beyond Rewards in Reinforcement Learning for Cyber Defence

Arxiv

0+阅读 · 2月12日

Agentic AI for Cybersecurity: A Meta-Cognitive Architecture for Governable Autonomy

Arxiv

0+阅读 · 2月12日

From Sands to Mansions: Towards Automated Cyberattack Emulation with Classical Planning and Large Language Models

Arxiv

0+阅读 · 2月5日

Beware Untrusted Simulators -- Reward-Free Backdoor Attacks in Reinforcement Learning

Arxiv

0+阅读 · 2月4日

Beyond Rewards in Reinforcement Learning for Cyber Defence

Arxiv

0+阅读 · 2月4日

TempoNet: Learning Realistic Communication and Timing Patterns for Network Traffic Simulation

Arxiv

0+阅读 · 1月22日

AttackMate: Realistic Emulation and Automation of Cyber Attack Scenarios Across the Kill Chain

Arxiv

0+阅读 · 1月20日

相关基金

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

分布式中继网络中的物理层攻击检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

产学研合作创新网络演化机理、模型及政策研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员