ACDZero：基于MCTS的自动化网络防御智能体 (ACDZero: MCTS Agent for Mastering Automated Cyber Defense) - 专知论文

会员服务 ·

0

嵌入 · 自动化 · 搜索 · 样本 · 防御策略 ·

ACDZero: MCTS Agent for Mastering Automated Cyber Defense

翻译：ACDZero：基于MCTS的自动化网络防御智能体

Yu Li,Sizhe Tang,Rongqian Chen,Fei Xu Yu,Guangyu Jiang,Mahdi Imani,Nathaniel D. Bastian,Tian Lan

Automated cyber defense (ACD) seeks to protect computer networks with minimal or no human intervention, reacting to intrusions by taking corrective actions such as isolating hosts, resetting services, deploying decoys, or updating access controls. However, existing approaches for ACD, such as deep reinforcement learning (RL), often face difficult exploration in complex networks with large decision/state spaces and thus require an expensive amount of samples. Inspired by the need to learn sample-efficient defense policies, we frame ACD in CAGE Challenge 4 (CAGE-4 / CC4) as a context-based partially observable Markov decision problem and propose a planning-centric defense policy based on Monte Carlo Tree Search (MCTS). It explicitly models the exploration-exploitation tradeoff in ACD and uses statistical sampling to guide exploration and decision making. We make novel use of graph neural networks (GNNs) to embed observations from the network as attributed graphs, to enable permutation-invariant reasoning over hosts and their relationships. To make our solution practical in complex search spaces, we guide MCTS with learned graph embeddings and priors over graph-edit actions, combining model-free generalization and policy distillation with look-ahead planning. We evaluate the resulting agent on CC4 scenarios involving diverse network structures and adversary behaviors, and show that our search-guided, graph-embedding-based planning improves defense reward and robustness relative to state-of-the-art RL baselines.

翻译：自动化网络防御（ACD）旨在以最少或无需人工干预的方式保护计算机网络，通过采取隔离主机、重置服务、部署诱饵或更新访问控制等纠正措施来应对入侵。然而，现有ACD方法（如深度强化学习）在决策/状态空间庞大的复杂网络中常面临探索困难，因而需要大量昂贵的样本。受对样本高效防御策略需求的启发，我们将CAGE Challenge 4（CAGE-4/CC4）中的ACD问题建模为基于情境的部分可观测马尔可夫决策问题，并提出一种以规划为核心的蒙特卡洛树搜索防御策略。该方法显式建模ACD中的探索-利用权衡，并利用统计抽样指导探索与决策。我们创新性地使用图神经网络将网络观测嵌入为属性图，实现对主机及其关系的置换不变推理。为使解决方案适应复杂搜索空间，我们利用学习到的图嵌入和图编辑动作先验引导MCTS，将无模型泛化、策略蒸馏与前向规划相结合。通过在CC4中涉及不同网络结构和对抗行为的场景进行评估，结果表明：相较于最先进的强化学习基线方法，我们基于搜索引导与图嵌入的规划策略显著提升了防御收益与鲁棒性。

0

相关内容

《军事领域人工智能网络安全的数字主权控制框架》

《军事领域人工智能网络安全的数字主权控制框架》

专知会员服务

16+阅读 · 2025年9月20日

《主动式社会工程防御（ASED）项目》美空军24页项目报告

《主动式社会工程防御（ASED）项目》美空军24页项目报告

专知会员服务

10+阅读 · 2025年7月3日

《训练自主网络防御智能体：军事网络中的挑战与机遇》最新报告

《训练自主网络防御智能体：军事网络中的挑战与机遇》最新报告

专知会员服务

48+阅读 · 2025年2月6日

【新书】利用生成式人工智能进行网络防御策略

【新书】利用生成式人工智能进行网络防御策略

专知会员服务

31+阅读 · 2024年10月18日

针对自动驾驶智能模型的攻击与防御

针对自动驾驶智能模型的攻击与防御

专知会员服务

19+阅读 · 2024年6月25日

AI Agent：基于大模型的自主智能体

AI Agent：基于大模型的自主智能体

专知会员服务

248+阅读 · 2023年9月9日

《自动化的网络防御：综述》2023最新32页长综述

《自动化的网络防御：综述》2023最新32页长综述

专知会员服务

33+阅读 · 2023年6月19日

【2023新书】人工智能在网络安全中的应用，215页pdf

【2023新书】人工智能在网络安全中的应用，215页pdf

专知会员服务

103+阅读 · 2023年5月5日

《用于网络入侵检测的竞争学习注意机制原型》2022最新42页技术报告，美国海军学院

《用于网络入侵检测的竞争学习注意机制原型》2022最新42页技术报告，美国海军学院

专知会员服务

24+阅读 · 2022年11月4日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

67+阅读 · 2022年11月2日

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

专知

11+阅读 · 2022年10月28日

【美海军·系统顶点项目报告】《用于防空和导弹防御的自动作战管理辅助工具（AI）的安全风险评估》162页PDF

【美海军·系统顶点项目报告】《用于防空和导弹防御的自动作战管理辅助工具（AI）的安全风险评估》162页PDF

专知

37+阅读 · 2022年10月19日

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

101+阅读 · 2022年10月17日

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

专知

114+阅读 · 2022年9月1日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

97+阅读 · 2022年3月7日

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

AI前线

21+阅读 · 2019年10月28日

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

机器之心

16+阅读 · 2018年7月9日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

1+阅读 · 2017年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

基于免疫机制的无线传感器网络攻击协同检测研究与设计

国家自然科学基金

0+阅读 · 2015年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

基于复杂网络理论的Cyber体系效能仿真分析方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

Bypassing AI Control Protocols via Agent-as-a-Proxy Attacks

Arxiv

0+阅读 · 2月4日

AgentDyn: A Dynamic Open-Ended Benchmark for Evaluating Prompt Injection Attacks of Real-World Agent Security System

Arxiv

0+阅读 · 2月3日

To Defend Against Cyber Attacks, We Must Teach AI Agents to Hack

Arxiv

0+阅读 · 2月1日

WADBERT: Dual-channel Web Attack Detection Based on BERT Models

Arxiv

0+阅读 · 1月29日

SHIELD: An Auto-Healing Agentic Defense Framework for LLM Resource Exhaustion Attacks

Arxiv

0+阅读 · 1月27日

AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security

Arxiv

0+阅读 · 1月26日

Safeguard: Security Controls at the Software Defined Network Layer

Arxiv

0+阅读 · 1月24日

AttackMate: Realistic Emulation and Automation of Cyber Attack Scenarios Across the Kill Chain

Arxiv

0+阅读 · 1月20日

AgentGuardian: Learning Access Control Policies to Govern AI Agent Behavior

Arxiv

1+阅读 · 1月15日

ACDZero: Graph-Embedding-Based Tree Search for Mastering Automated Cyber Defense

Arxiv

0+阅读 · 1月5日

VIP会员

文章信息

相关主题

相关VIP内容

《军事领域人工智能网络安全的数字主权控制框架》

《军事领域人工智能网络安全的数字主权控制框架》

专知会员服务

16+阅读 · 2025年9月20日

《主动式社会工程防御（ASED）项目》美空军24页项目报告

《主动式社会工程防御（ASED）项目》美空军24页项目报告

专知会员服务

10+阅读 · 2025年7月3日

《训练自主网络防御智能体：军事网络中的挑战与机遇》最新报告

《训练自主网络防御智能体：军事网络中的挑战与机遇》最新报告

专知会员服务

48+阅读 · 2025年2月6日

【新书】利用生成式人工智能进行网络防御策略

【新书】利用生成式人工智能进行网络防御策略

专知会员服务

31+阅读 · 2024年10月18日

针对自动驾驶智能模型的攻击与防御

针对自动驾驶智能模型的攻击与防御

专知会员服务

19+阅读 · 2024年6月25日

AI Agent：基于大模型的自主智能体

AI Agent：基于大模型的自主智能体

专知会员服务

248+阅读 · 2023年9月9日

《自动化的网络防御：综述》2023最新32页长综述

《自动化的网络防御：综述》2023最新32页长综述

专知会员服务

33+阅读 · 2023年6月19日

【2023新书】人工智能在网络安全中的应用，215页pdf

【2023新书】人工智能在网络安全中的应用，215页pdf

专知会员服务

103+阅读 · 2023年5月5日

《用于网络入侵检测的竞争学习注意机制原型》2022最新42页技术报告，美国海军学院

《用于网络入侵检测的竞争学习注意机制原型》2022最新42页技术报告，美国海军学院

专知会员服务

24+阅读 · 2022年11月4日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

67+阅读 · 2022年11月2日

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

专知

11+阅读 · 2022年10月28日

【美海军·系统顶点项目报告】《用于防空和导弹防御的自动作战管理辅助工具（AI）的安全风险评估》162页PDF

【美海军·系统顶点项目报告】《用于防空和导弹防御的自动作战管理辅助工具（AI）的安全风险评估》162页PDF

专知

37+阅读 · 2022年10月19日

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

101+阅读 · 2022年10月17日

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

专知

114+阅读 · 2022年9月1日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

97+阅读 · 2022年3月7日

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

AI前线

21+阅读 · 2019年10月28日

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

机器之心

16+阅读 · 2018年7月9日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

相关论文

Bypassing AI Control Protocols via Agent-as-a-Proxy Attacks

Arxiv

0+阅读 · 2月4日

AgentDyn: A Dynamic Open-Ended Benchmark for Evaluating Prompt Injection Attacks of Real-World Agent Security System

Arxiv

0+阅读 · 2月3日

To Defend Against Cyber Attacks, We Must Teach AI Agents to Hack

Arxiv

0+阅读 · 2月1日

WADBERT: Dual-channel Web Attack Detection Based on BERT Models

Arxiv

0+阅读 · 1月29日

SHIELD: An Auto-Healing Agentic Defense Framework for LLM Resource Exhaustion Attacks

Arxiv

0+阅读 · 1月27日

AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security

Arxiv

0+阅读 · 1月26日

Safeguard: Security Controls at the Software Defined Network Layer

Arxiv

0+阅读 · 1月24日

AttackMate: Realistic Emulation and Automation of Cyber Attack Scenarios Across the Kill Chain

Arxiv

0+阅读 · 1月20日

AgentGuardian: Learning Access Control Policies to Govern AI Agent Behavior

Arxiv

1+阅读 · 1月15日

ACDZero: Graph-Embedding-Based Tree Search for Mastering Automated Cyber Defense

Arxiv

0+阅读 · 1月5日

相关基金

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

1+阅读 · 2017年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

基于免疫机制的无线传感器网络攻击协同检测研究与设计

国家自然科学基金

0+阅读 · 2015年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

基于复杂网络理论的Cyber体系效能仿真分析方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员