Automated cyber defense (ACD) seeks to protect computer networks with minimal or no human intervention, reacting to intrusions by taking corrective actions such as isolating hosts, resetting services, deploying decoys, or updating access controls. However, existing approaches for ACD, such as deep reinforcement learning (RL), often face difficult exploration in complex networks with large decision/state spaces and thus require an expensive amount of samples. Inspired by the need to learn sample-efficient defense policies, we frame ACD in CAGE Challenge 4 (CAGE-4 / CC4) as a context-based partially observable Markov decision problem and propose a planning-centric defense policy based on Monte Carlo Tree Search (MCTS). It explicitly models the exploration-exploitation tradeoff in ACD and uses statistical sampling to guide exploration and decision making. We make novel use of graph neural networks (GNNs) to embed observations from the network as attributed graphs, to enable permutation-invariant reasoning over hosts and their relationships. To make our solution practical in complex search spaces, we guide MCTS with learned graph embeddings and priors over graph-edit actions, combining model-free generalization and policy distillation with look-ahead planning. We evaluate the resulting agent on CC4 scenarios involving diverse network structures and adversary behaviors, and show that our search-guided, graph-embedding-based planning improves defense reward and robustness relative to state-of-the-art RL baselines.


翻译:自动化网络防御(ACD)旨在以最少或无需人工干预的方式保护计算机网络,通过采取隔离主机、重置服务、部署诱饵或更新访问控制等纠正措施来应对入侵。然而,现有ACD方法(如深度强化学习)在决策/状态空间庞大的复杂网络中常面临探索困难,因而需要大量昂贵的样本。受对样本高效防御策略需求的启发,我们将CAGE Challenge 4(CAGE-4/CC4)中的ACD问题建模为基于情境的部分可观测马尔可夫决策问题,并提出一种以规划为核心的蒙特卡洛树搜索防御策略。该方法显式建模ACD中的探索-利用权衡,并利用统计抽样指导探索与决策。我们创新性地使用图神经网络将网络观测嵌入为属性图,实现对主机及其关系的置换不变推理。为使解决方案适应复杂搜索空间,我们利用学习到的图嵌入和图编辑动作先验引导MCTS,将无模型泛化、策略蒸馏与前向规划相结合。通过在CC4中涉及不同网络结构和对抗行为的场景进行评估,结果表明:相较于最先进的强化学习基线方法,我们基于搜索引导与图嵌入的规划策略显著提升了防御收益与鲁棒性。

0
下载
关闭预览

相关内容

【AAAI2021】“可瘦身”的生成式对抗网络
专知会员服务
13+阅读 · 2020年12月12日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员