Automated cyber defense (ACD) seeks to protect computer networks with minimal or no human intervention, reacting to intrusions by taking corrective actions such as isolating hosts, resetting services, deploying decoys, or updating access controls. However, existing approaches for ACD, such as deep reinforcement learning (RL), often face difficult exploration in complex networks with large decision/state spaces and thus require an expensive amount of samples. Inspired by the need to learn sample-efficient defense policies, we frame ACD in CAGE Challenge 4 (CAGE-4 / CC4) as a context-based partially observable Markov decision problem and propose a planning-centric defense policy based on Monte Carlo Tree Search (MCTS). It explicitly models the exploration-exploitation tradeoff in ACD and uses statistical sampling to guide exploration and decision making. We make novel use of graph neural networks (GNNs) to embed observations from the network as attributed graphs, to enable permutation-invariant reasoning over hosts and their relationships. To make our solution practical in complex search spaces, we guide MCTS with learned graph embeddings and priors over graph-edit actions, combining model-free generalization and policy distillation with look-ahead planning. We evaluate the resulting agent on CC4 scenarios involving diverse network structures and adversary behaviors, and show that our search-guided, graph-embedding-based planning improves defense reward and robustness relative to state-of-the-art RL baselines.


翻译:自动化网络防御(ACD)旨在以最少或无需人工干预的方式保护计算机网络,通过采取隔离主机、重置服务、部署诱饵或更新访问控制等纠正措施来应对入侵。然而,现有ACD方法(如深度强化学习)在决策/状态空间庞大的复杂网络中常面临探索困难,因而需要大量昂贵的样本。受对样本高效防御策略需求的启发,我们将CAGE Challenge 4(CAGE-4/CC4)中的ACD问题建模为基于情境的部分可观测马尔可夫决策问题,并提出一种以规划为核心的蒙特卡洛树搜索防御策略。该方法显式建模ACD中的探索-利用权衡,并利用统计抽样指导探索与决策。我们创新性地使用图神经网络将网络观测嵌入为属性图,实现对主机及其关系的置换不变推理。为使解决方案适应复杂搜索空间,我们利用学习到的图嵌入和图编辑动作先验引导MCTS,将无模型泛化、策略蒸馏与前向规划相结合。通过在CC4中涉及不同网络结构和对抗行为的场景进行评估,结果表明:相较于最先进的强化学习基线方法,我们基于搜索引导与图嵌入的规划策略显著提升了防御收益与鲁棒性。

0
下载
关闭预览

相关内容

《军事领域人工智能网络安全的数字主权控制框架》
专知会员服务
16+阅读 · 2025年9月20日
【新书】利用生成式人工智能进行网络防御策略
专知会员服务
31+阅读 · 2024年10月18日
针对自动驾驶智能模型的攻击与防御
专知会员服务
19+阅读 · 2024年6月25日
AI Agent:基于大模型的自主智能体
专知会员服务
248+阅读 · 2023年9月9日
《自动化的网络防御:综述》2023最新32页长综述
专知会员服务
33+阅读 · 2023年6月19日
【2023新书】人工智能在网络安全中的应用,215页pdf
专知会员服务
103+阅读 · 2023年5月5日
对抗机器学习在网络入侵检测领域的应用
专知会员服务
35+阅读 · 2022年1月4日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
VIP会员
相关VIP内容
《军事领域人工智能网络安全的数字主权控制框架》
专知会员服务
16+阅读 · 2025年9月20日
【新书】利用生成式人工智能进行网络防御策略
专知会员服务
31+阅读 · 2024年10月18日
针对自动驾驶智能模型的攻击与防御
专知会员服务
19+阅读 · 2024年6月25日
AI Agent:基于大模型的自主智能体
专知会员服务
248+阅读 · 2023年9月9日
《自动化的网络防御:综述》2023最新32页长综述
专知会员服务
33+阅读 · 2023年6月19日
【2023新书】人工智能在网络安全中的应用,215页pdf
专知会员服务
103+阅读 · 2023年5月5日
对抗机器学习在网络入侵检测领域的应用
专知会员服务
35+阅读 · 2022年1月4日
相关资讯
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员