AI agents are beginning to interact with each other directly and across internet platforms and physical environments, creating security challenges beyond traditional cybersecurity and AI safety frameworks. Free-form protocols are essential for AI's task generalization but enable new threats like secret collusion and coordinated swarm attacks. Network effects can rapidly spread privacy breaches, disinformation, jailbreaks, and data poisoning, while multi-agent dispersion and stealth optimization help adversaries evade oversight - creating novel persistent threats at a systemic level. Despite their critical importance, these security challenges remain understudied, with research fragmented across disparate fields including AI security, multi-agent learning, complex systems, cybersecurity, game theory, distributed systems, and technical AI governance. We introduce multi-agent security, a new field dedicated to securing networks of AI agents against threats that emerge or amplify through their interactions - whether direct or indirect via shared environments - with each other, humans, and institutions, and characterise fundamental security-utility and security-security trade-offs across both distributed and decentralised settings. Our preliminary work (1) taxonomizes the threat landscape arising from interacting AI agents, (2) offers applications to multi-agent security for work across diffuse subfields, and (3) proposes a unified research agenda addressing open challenges in designing secure agent systems and interaction environments. By identifying these gaps, we aim to guide research in this critical area to unlock the socioeconomic potential of large-scale agent deployment, foster public trust, and mitigate national security risks in critical infrastructure and defense contexts.


翻译:人工智能智能体正开始通过互联网平台和物理环境直接相互交互,由此产生了超越传统网络安全和人工智能安全框架的安全挑战。自由格式协议对于AI的任务泛化至关重要,但同时也催生了诸如秘密串通和协调式群体攻击等新型威胁。网络效应可能迅速传播隐私泄露、虚假信息、越狱攻击和数据投毒,而多智能体分散部署与隐蔽性优化则帮助对手规避监管——从而在系统层面形成新型持续性威胁。尽管这些安全挑战至关重要,但相关研究仍显不足,且碎片化地分布在包括AI安全、多智能体学习、复杂系统、网络安全、博弈论、分布式系统和技术性AI治理等不同领域。我们提出了"多智能体安全"这一新领域,致力于保护AI智能体网络免受通过相互交互(无论是直接交互还是通过共享环境的间接交互)、与人类及机构交互而产生或放大的威胁,并刻画了分布式和去中心化场景下的基本安全-效用权衡及安全-安全权衡。我们的初步工作:(1)对交互式AI智能体引发的威胁格局进行了分类;(2)为跨分散子领域的多智能体安全研究提供了应用框架;(3)提出了统一的研究议程,以应对设计安全智能体系统和交互环境中的开放挑战。通过识别这些研究空白,我们旨在引导这一关键领域的研究方向,从而释放大规模智能体部署的社会经济潜力、增强公众信任,并降低关键基础设施和国防领域的国家安全风险。

0
下载
关闭预览

相关内容

《人工智能在网络防御中的机遇》
专知会员服务
9+阅读 · 6月8日
AI智能体时代大模型安全风险与攻防新挑战
专知会员服务
15+阅读 · 2月27日
智能体安全综述:应用、威胁与防御
专知会员服务
43+阅读 · 2025年10月12日
《高级AI带来的多智能体风险》最新97页干活技术报告
专知会员服务
47+阅读 · 2025年3月4日
AI智能体面临的威胁:关键安全挑战与未来路径综述
专知会员服务
53+阅读 · 2024年6月7日
人工智能、模块化开放系统架构和未来无人战争
专知会员服务
87+阅读 · 2024年4月4日
专知会员服务
47+阅读 · 2021年6月25日
面向人工智能的计算机体系结构
计算机研究与发展
14+阅读 · 2019年6月6日
人工智能对网络空间安全的影响
走向智能论坛
21+阅读 · 2018年6月7日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 32分钟前
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 34分钟前
美以伊冲突:无人机与人工智能的运用
专知会员服务
2+阅读 · 46分钟前
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
《人工智能在网络防御中的机遇》
专知会员服务
9+阅读 · 6月8日
AI智能体时代大模型安全风险与攻防新挑战
专知会员服务
15+阅读 · 2月27日
智能体安全综述:应用、威胁与防御
专知会员服务
43+阅读 · 2025年10月12日
《高级AI带来的多智能体风险》最新97页干活技术报告
专知会员服务
47+阅读 · 2025年3月4日
AI智能体面临的威胁:关键安全挑战与未来路径综述
专知会员服务
53+阅读 · 2024年6月7日
人工智能、模块化开放系统架构和未来无人战争
专知会员服务
87+阅读 · 2024年4月4日
专知会员服务
47+阅读 · 2021年6月25日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员