Cybersecurity AI: A Game-Theoretic AI for Guiding Attack and Defense - 专知论文

会员服务 ·

0

安全人工智能 · 博弈 · 网络安全 · 攻击 · 攻击图 ·

Cybersecurity AI: A Game-Theoretic AI for Guiding Attack and Defense

翻译：网络安全人工智能：一种指导攻防的博弈论人工智能

Víctor Mayoral-Vilches,María Sanz-Gómez,Francesco Balassone,Stefan Rass,Lidia Salas-Espejo,Benjamin Jablonski,Luis Javier Navarrete-Lozano,Maite del Mundo de Torres,Cristóbal R. J. Veas Chavez

AI-driven penetration testing now executes thousands of actions per hour but still lacks the strategic intuition humans apply in competitive security. To build cybersecurity superintelligence --Cybersecurity AI exceeding best human capability-such strategic intuition must be embedded into agentic reasoning processes. We present Generative Cut-the-Rope (G-CTR), a game-theoretic guidance layer that extracts attack graphs from agent's context, computes Nash equilibria with effort-aware scoring, and feeds a concise digest back into the LLM loop \emph{guiding} the agent's actions. Across five real-world exercises, G-CTR matches 70--90% of expert graph structure while running 60--245x faster and over 140x cheaper than manual analysis. In a 44-run cyber-range, adding the digest lifts success from 20.0% to 42.9%, cuts cost-per-success by 2.7x, and reduces behavioral variance by 5.2x. In Attack-and-Defense exercises, a shared digest produces the Purple agent, winning roughly 2:1 over the LLM-only baseline and 3.7:1 over independently guided teams. This closed-loop guidance is what produces the breakthrough: it reduces ambiguity, collapses the LLM's search space, suppresses hallucinations, and keeps the model anchored to the most relevant parts of the problem, yielding large gains in success rate, consistency, and reliability.

翻译：人工智能驱动的渗透测试目前每小时可执行数千次操作，但仍缺乏人类在竞争性安全环境中运用的战略直觉。为构建网络安全超级智能——即超越人类最佳能力的网络安全人工智能——必须将此类战略直觉嵌入智能体推理过程。我们提出生成式剪绳算法，这是一种博弈论引导层，能够从智能体上下文中提取攻击图，通过工作量感知评分计算纳什均衡，并将精炼摘要反馈至大语言模型循环中，从而引导智能体的行动。在五项真实场景演练中，G-CTR在保持专家攻击图结构70-90%匹配度的同时，运行速度比人工分析快60-245倍，成本降低140倍以上。在44轮网络靶场测试中，引入摘要使成功率从20.0%提升至42.9%，单次成功成本降低2.7倍，行为方差减少5.2倍。在攻防对抗演练中，共享摘要催生的紫色智能体，以约2:1的优势战胜纯大语言模型基线，以3.7:1的优势战胜独立引导的团队。这种闭环引导机制实现了关键突破：它有效降低决策模糊性，压缩大语言模型的搜索空间，抑制幻觉生成，并将模型锚定在问题最相关的部分，从而在成功率、一致性和可靠性方面取得显著提升。

1

相关内容

安全人工智能

安全人工智能

保护网络物理系统中的 AI 智能体：关于环境交互、深度伪造威胁及其防御技术的综述

保护网络物理系统中的 AI 智能体：关于环境交互、深度伪造威胁及其防御技术的综述

专知会员服务

10+阅读 · 2月15日

确保国防任务中的人工智能安全：多层次方法

确保国防任务中的人工智能安全：多层次方法

专知会员服务

15+阅读 · 1月21日

《生成式人工智能及其在防御性网络安全课程中的应用》

《生成式人工智能及其在防御性网络安全课程中的应用》

专知会员服务

18+阅读 · 2025年10月30日

人工智能如何增强军事监控与边境安全

人工智能如何增强军事监控与边境安全

专知会员服务

20+阅读 · 2025年3月20日

【新书】利用生成式人工智能进行网络防御策略

【新书】利用生成式人工智能进行网络防御策略

专知会员服务

31+阅读 · 2024年10月18日

可解释人工智能中的对抗攻击和防御

可解释人工智能中的对抗攻击和防御

专知会员服务

43+阅读 · 2023年6月20日

【2023新书】人工智能在网络安全中的应用，215页pdf

【2023新书】人工智能在网络安全中的应用，215页pdf

专知会员服务

104+阅读 · 2023年5月5日

华为《AI安全白皮书》对抗性人工智能：AI攻击、AI防御典型方式

华为《AI安全白皮书》对抗性人工智能：AI攻击、AI防御典型方式

专知会员服务

89+阅读 · 2022年4月29日

人工智能安全框架

专知会员服务

63+阅读 · 2021年7月5日

人工智能赋能网络攻击的安全威胁及应对策略

专知会员服务

46+阅读 · 2021年6月25日

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

102+阅读 · 2022年10月17日

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

专知

116+阅读 · 2022年9月1日

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

专知

73+阅读 · 2022年6月30日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

105+阅读 · 2022年4月28日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

98+阅读 · 2022年3月7日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

产业智能官

15+阅读 · 2019年1月8日

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

机器之心

16+阅读 · 2018年7月9日

人工智能对网络空间安全的影响

人工智能对网络空间安全的影响

走向智能论坛

21+阅读 · 2018年6月7日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

物联网安全搜索技术研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

网络化控制系统安全理论与关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

基于博弈论的信息安全理论与方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

Towards Cybersecurity Superintelligence: from AI-guided humans to human-guided AI

Arxiv

0+阅读 · 2月3日

Human Society-Inspired Approaches to Agentic AI Security: The 4C Framework

Arxiv

0+阅读 · 2月2日

To Defend Against Cyber Attacks, We Must Teach AI Agents to Hack

Arxiv

0+阅读 · 2月1日

Securing AI Agents in Cyber-Physical Systems: A Survey of Environmental Interactions, Deepfake Threats, and Defenses

Arxiv

0+阅读 · 1月28日

Towards Cybersecurity Superintelligence: from AI-guided humans to human-guided AI

Arxiv

0+阅读 · 1月21日

Cyber Threat Detection and Vulnerability Assessment System using Generative AI and Large Language Model

Arxiv

0+阅读 · 1月8日

A Survey of Agentic AI and Cybersecurity: Challenges, Opportunities and Use-case Prototypes

Arxiv

4+阅读 · 1月8日

AI-Driven Cybersecurity Threats: A Survey of Emerging Risks and Defensive Strategies

Arxiv

0+阅读 · 1月6日

Quantum AI for Cybersecurity: A hybrid Quantum-Classical models for attack path analysis

Arxiv

0+阅读 · 1月5日

Towards Provably Secure Generative AI: Reliable Consensus Sampling

Arxiv

0+阅读 · 2025年12月31日

VIP会员

文章信息

相关主题

安全人工智能

最新内容

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

1+阅读 · 27分钟前

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

1+阅读 · 33分钟前

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

0+阅读 · 38分钟前

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

0+阅读 · 43分钟前

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

1+阅读 · 今天14:03

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

0+阅读 · 今天13:36

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

0+阅读 · 今天13:34

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

5+阅读 · 今天6:14

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

3+阅读 · 今天5:59

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

5+阅读 · 今天5:54

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

3+阅读 · 今天5:51

《提升生成模型的安全性与保障》博士论文

《提升生成模型的安全性与保障》博士论文

专知会员服务

3+阅读 · 今天5:47

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

11+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

12+阅读 · 4月19日

相关VIP内容

保护网络物理系统中的 AI 智能体：关于环境交互、深度伪造威胁及其防御技术的综述

保护网络物理系统中的 AI 智能体：关于环境交互、深度伪造威胁及其防御技术的综述

专知会员服务

10+阅读 · 2月15日

确保国防任务中的人工智能安全：多层次方法

确保国防任务中的人工智能安全：多层次方法

专知会员服务

15+阅读 · 1月21日

《生成式人工智能及其在防御性网络安全课程中的应用》

《生成式人工智能及其在防御性网络安全课程中的应用》

专知会员服务

18+阅读 · 2025年10月30日

人工智能如何增强军事监控与边境安全

人工智能如何增强军事监控与边境安全

专知会员服务

20+阅读 · 2025年3月20日

【新书】利用生成式人工智能进行网络防御策略

【新书】利用生成式人工智能进行网络防御策略

专知会员服务

31+阅读 · 2024年10月18日

可解释人工智能中的对抗攻击和防御

可解释人工智能中的对抗攻击和防御

专知会员服务

43+阅读 · 2023年6月20日

【2023新书】人工智能在网络安全中的应用，215页pdf

【2023新书】人工智能在网络安全中的应用，215页pdf

专知会员服务

104+阅读 · 2023年5月5日

华为《AI安全白皮书》对抗性人工智能：AI攻击、AI防御典型方式

华为《AI安全白皮书》对抗性人工智能：AI攻击、AI防御典型方式

专知会员服务

89+阅读 · 2022年4月29日

人工智能安全框架

专知会员服务

63+阅读 · 2021年7月5日

人工智能赋能网络攻击的安全威胁及应对策略

专知会员服务

46+阅读 · 2021年6月25日

热门VIP内容

开通专知VIP会员享更多权益服务

《系统簇式多域作战规划范畴论框架》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

相关资讯

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

102+阅读 · 2022年10月17日

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

专知

116+阅读 · 2022年9月1日

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

专知

73+阅读 · 2022年6月30日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

105+阅读 · 2022年4月28日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

98+阅读 · 2022年3月7日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

产业智能官

15+阅读 · 2019年1月8日

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

机器之心

16+阅读 · 2018年7月9日

人工智能对网络空间安全的影响

人工智能对网络空间安全的影响

走向智能论坛

21+阅读 · 2018年6月7日

相关论文

Towards Cybersecurity Superintelligence: from AI-guided humans to human-guided AI

Arxiv

0+阅读 · 2月3日

Human Society-Inspired Approaches to Agentic AI Security: The 4C Framework

Arxiv

0+阅读 · 2月2日

To Defend Against Cyber Attacks, We Must Teach AI Agents to Hack

Arxiv

0+阅读 · 2月1日

Securing AI Agents in Cyber-Physical Systems: A Survey of Environmental Interactions, Deepfake Threats, and Defenses

Arxiv

0+阅读 · 1月28日

Towards Cybersecurity Superintelligence: from AI-guided humans to human-guided AI

Arxiv

0+阅读 · 1月21日

Cyber Threat Detection and Vulnerability Assessment System using Generative AI and Large Language Model

Arxiv

0+阅读 · 1月8日

A Survey of Agentic AI and Cybersecurity: Challenges, Opportunities and Use-case Prototypes

Arxiv

4+阅读 · 1月8日

AI-Driven Cybersecurity Threats: A Survey of Emerging Risks and Defensive Strategies

Arxiv

0+阅读 · 1月6日

Quantum AI for Cybersecurity: A hybrid Quantum-Classical models for attack path analysis

Arxiv

0+阅读 · 1月5日

Towards Provably Secure Generative AI: Reliable Consensus Sampling

Arxiv

0+阅读 · 2025年12月31日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

物联网安全搜索技术研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

网络化控制系统安全理论与关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

基于博弈论的信息安全理论与方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员