Frontier AI systems are increasingly capable of cybersecurity tasks, including codebase inspection, vulnerability detection, and exploitation. However, evaluating their offensive capabilities remains constrained by limited access to open, reproducible, multi-host cyber ranges. Existing public benchmarks capture isolated skills such as CTF solving, vulnerability reproduction, and exploit generation, but often abstract away realistic intrusion workflows: discovering exposed services, gaining a foothold, collecting internal information, and expanding compromise across hosts. This gap makes it difficult to observe emerging risks early, because frontier AI systems are rarely evaluated under realistic attack conditions. We introduce AgentCyberRange, the first open, multi-range infrastructure for measuring autonomous cyber attack capability in realistic cyber ranges. It combines 110 vulnerabilities across 15 real web applications and 8 enterprise-like cyber ranges with 156 internal hosts, plus Cage, a toolchain for execution, orchestration, result collection, and verification. The benchmark covers two core stages: web exploitation, where agents explore exposed applications and validate vulnerabilities, and post exploitation, where agents turn an initial foothold into broader internal compromise. We evaluate six frontier AI systems under matched prompts and budgets. GPT-5.5 with Codex performs best, solving 16.1% of web exploitation tasks and 31.7% of post-exploitation tasks; with more concrete hints, these rates increase to 33.0% and 46.3%. We also observe out-of-benchmark findings, including unknown vulnerabilities in popular projects, and payload mutation that bypasses host defenses. These results show that open cyber-range evaluation is necessary for observing emerging offensive capabilities under realistic and reproducible conditions.


翻译:前沿人工智能系统在网络安全任务上的能力日益增强,包括代码库审查、漏洞检测与利用。然而,由于缺乏开放、可复现的多主机网络靶场,对其攻击能力的评估仍受到限制。现有公开基准测试仅聚焦于CTF解题、漏洞复现和利用生成等孤立技能,往往忽略了真实的入侵工作流程:发现暴露的服务、获取立足点、收集内部信息以及跨主机扩展攻击范围。这一空白使得前沿AI系统很少在真实攻击条件下接受评估,从而难以早期观察新兴风险。我们提出AgentCyberRange——首个在真实网络靶场中衡量自主网络攻击能力的开放、多靶场基础设施。它整合了15个真实Web应用中的110个漏洞、8个包含156台内部主机的企业级网络靶场,以及用于执行、编排、结果收集与验证的工具链Cage。该基准测试涵盖两个核心阶段:Web利用阶段(智能体探索暴露的应用并验证漏洞)和后利用阶段(智能体将初始立足点转化为更广泛的内部入侵)。我们在匹配的提示词和预算下评估了六个前沿AI系统。GPT-5.5 with Codex表现最佳,解决了16.1%的Web利用任务和31.7%的后利用任务;在更具体的提示下,这些比率分别提升至33.0%和46.3%。我们还观察到基准测试之外的发现,包括流行项目中的未知漏洞以及绕过主机防御的载荷变异。这些结果表明,开放网络靶场评估对于在真实且可复现的条件下观察新兴攻击能力至关重要。

0
下载
关闭预览

相关内容

《人工智能在网络防御中的机遇》
专知会员服务
8+阅读 · 6月8日
前沿人工智能趋势报告(Frontier AI Trends Report)
专知会员服务
39+阅读 · 2025年12月20日
Agent视域下的人工智能赋能作战系统
专知会员服务
58+阅读 · 2024年12月15日
【新书】利用生成式人工智能进行网络防御策略
专知会员服务
31+阅读 · 2024年10月18日
对抗机器学习在网络入侵检测领域的应用
专知会员服务
35+阅读 · 2022年1月4日
《人工智能安全测评白皮书》,99页pdf
专知
36+阅读 · 2022年2月26日
AI综述专栏 | 基于深度学习的目标检测算法综述
人工智能前沿讲习班
12+阅读 · 2018年12月7日
【知识图谱】知识图谱+人工智能=新型网络信息体系
产业智能官
14+阅读 · 2018年11月18日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
从传统方法到深度学习,人脸关键点检测方法综述
机器之心
14+阅读 · 2017年12月17日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Arxiv
14+阅读 · 2023年8月7日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
1+阅读 · 57分钟前
定向能反无人机系统最新发展动态
专知会员服务
3+阅读 · 今天13:50
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
2+阅读 · 今天13:33
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员