Breaking the Secret: Economic Interventions for Combating Collusion in Embodied Multi-Agent Systems - 专知论文

会员服务 ·

0

Breaking the Secret: Economic Interventions for Combating Collusion in Embodied Multi-Agent Systems

翻译：打破秘密：抑制具身多智能体系统中合谋的经济干预手段

Qi Liu,Xiaohui Chen,Zhihui Zhao,Yaowen Zheng,Dan Yu,Zehua Zhang,Limin Sun,Yongle Chen

Collusion among autonomous agents poses a critical security threat in embodied multi-agent systems (MAS), where coordinated behaviors can deviate from global objectives and lead to real-world consequences. Existing defenses, primarily based on identity control or post-hoc behavior analysis, are insufficient to address such threats in embodied settings due to delayed feedback and noisy observations in physical environments, which make behavioral deviations difficult to detect accurately and in a timely manner. To address this challenge, we propose a mutagenic incentive intervention approach that mitigates collusion by reshaping agents' payoff structures. By rewarding agents who report collusive behavior and penalizing identified participants, the mechanism induces strategic defection and renders collusion unstable. We further design supporting mechanisms, including reporting deposits, smart contract-based reward enforcement, and encrypted communication, to ensure robustness against misuse of the incentive mechanism and retaliation from penalized agents. We implement the proposed approach in both simulated and real-world embodied environments. Experimental results show that our method effectively suppresses collusion by inducing defection, while preserving system efficiency. It achieves performance comparable to the non-collusion baseline and outperforms representative reactive defenses, thereby fulfilling the desired security objectives. These results demonstrate the effectiveness of proactive incentive design as a practical paradigm for securing embodied multi-agent systems.

翻译：自主智能体之间的合谋对具身多智能体系统构成严重安全威胁，这种协调行为可能偏离全局目标并导致现实世界中的严重后果。现有防御措施主要基于身份控制或事后行为分析，但由于物理环境中存在反馈延迟和观测噪声，行为偏差难以被准确及时地检测，因此无法有效应对具身环境中的此类威胁。为解决这一挑战，我们提出了一种诱变激励干预方法，通过重塑智能体的收益结构来抑制合谋。该机制通过奖励举报合谋行为的智能体并惩罚确认参与的个体，诱导策略性背叛，使合谋状态变得不稳定。我们进一步设计了配套机制，包括举报押金、基于智能合约的奖励执行以及加密通信，以确保该激励机制的稳健性，防止被滥用以及受罚智能体的报复。我们在仿真和真实具身环境中实现了所提出的方法。实验结果表明，该方法通过诱导背叛有效抑制了合谋，同时保持了系统效率。其性能达到了与非合谋基线相当的水平，并优于具有代表性的反应式防御方法，从而实现了预期的安全目标。这些结果证明了主动激励设计作为保障具身多智能体系统安全的实用范式的有效性。

0

相关内容

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

40+阅读 · 2月2日

《基于AI的动态任务分配策略实现多智能体系统有意义人类控制》报告

《基于AI的动态任务分配策略实现多智能体系统有意义人类控制》报告

专知会员服务

38+阅读 · 2025年12月26日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

26+阅读 · 2025年11月17日

《将自主系统整合入军事网络空间进攻行动的政策与技术建议》2025最新82页

《将自主系统整合入军事网络空间进攻行动的政策与技术建议》2025最新82页

专知会员服务

20+阅读 · 2025年11月11日

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

专知会员服务

54+阅读 · 2025年6月10日

中文版 | 多智能体系统在国防领域的应用：提升战略规划与自主作战能力

中文版 | 多智能体系统在国防领域的应用：提升战略规划与自主作战能力

专知会员服务

28+阅读 · 2025年5月8日

中文版 | 集中式与分布式多智能体AI协调策略

中文版 | 集中式与分布式多智能体AI协调策略

专知会员服务

21+阅读 · 2025年5月8日

多智能体协同决策研究全景透视：应用场景、研究方法、挑战与未来展望

多智能体协同决策研究全景透视：应用场景、研究方法、挑战与未来展望

专知会员服务

47+阅读 · 2025年3月20日

机密计算保障人工智能系统安全研究报告

机密计算保障人工智能系统安全研究报告

专知会员服务

19+阅读 · 2025年1月20日

精确打击体系智能化的发展

精确打击体系智能化的发展

专知会员服务

77+阅读 · 2024年2月3日

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

专知

28+阅读 · 2022年10月22日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

专知

42+阅读 · 2022年7月27日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

109+阅读 · 2022年4月28日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

98+阅读 · 2022年3月7日

【人工智能】有关军事混合智能的几点再再思考、深绿” 及 AlphaGo 对指挥与控制智能化的启示

【人工智能】有关军事混合智能的几点再再思考、深绿” 及 AlphaGo 对指挥与控制智能化的启示

产业智能官

44+阅读 · 2018年12月11日

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

机器之心

16+阅读 · 2018年7月9日

智能时代如何构建金融反欺诈体系？

智能时代如何构建金融反欺诈体系？

数据猿

12+阅读 · 2018年3月26日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

复杂系统中多密码算法密钥协同安全研究

国家自然科学基金

0+阅读 · 2015年12月31日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

Open Challenges in Multi-Agent Security: Towards Secure Systems of Interacting AI Agents

Arxiv

0+阅读 · 4月29日

Security Considerations for Multi-agent Systems

Arxiv

0+阅读 · 4月26日

Automation-Exploit: A Multi-Agent LLM Framework for Adaptive Offensive Security with Digital Twin-Based Risk-Mitigated Exploitation

Arxiv

0+阅读 · 4月24日

Detecting Multi-Agent Collusion Through Multi-Agent Interpretability

Arxiv

0+阅读 · 4月1日

WebWeaver: Breaking Topology Confidentiality in LLM Multi-Agent Systems with Stealthy Context-Based Inference

Arxiv

0+阅读 · 3月19日

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

Arxiv

0+阅读 · 3月9日

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Arxiv

0+阅读 · 3月6日

Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems

Arxiv

0+阅读 · 3月5日

Tracking Capabilities for Safer Agents

Arxiv

0+阅读 · 3月1日

OMNI-LEAK: Orchestrator Multi-Agent Network Induced Data Leakage

Arxiv

0+阅读 · 2月25日

VIP会员

文章信息

相关主题

最新内容

高阶网络的表示：基于图的框架综述

高阶网络的表示：基于图的框架综述

专知会员服务

1+阅读 · 今天16:46

【ICML2026】面向长上下文大语言模型的训练-推理一致性分段执行

【ICML2026】面向长上下文大语言模型的训练-推理一致性分段执行

专知会员服务

1+阅读 · 今天16:44

俄乌冲突中的高超音速武器系统及效能评估（中文版PDF下载）

俄乌冲突中的高超音速武器系统及效能评估（中文版PDF下载）

专知会员服务

18+阅读 · 今天3:27

《战略冲突的数学建模：基于变分不等式、不动点理论、间隙函数与微分博弈的美以伊冲突分析》

《战略冲突的数学建模：基于变分不等式、不动点理论、间隙函数与微分博弈的美以伊冲突分析》

专知会员服务

12+阅读 · 今天2:47

《人工智能中的多智能体自主决策》380页博士论文

《人工智能中的多智能体自主决策》380页博士论文

专知会员服务

13+阅读 · 今天2:42

《作战资源再分配的作战行动数学模型构建》

《作战资源再分配的作战行动数学模型构建》

专知会员服务

12+阅读 · 今天2:37

乌克兰作为杀伤网实验室：情报监视侦察（ISR）网络赋能自适应无人机战争——经验分析

乌克兰作为杀伤网实验室：情报监视侦察（ISR）网络赋能自适应无人机战争——经验分析

专知会员服务

10+阅读 · 今天2:17

【博士论文】面向可扩展且可信智能系统的强化学习

【博士论文】面向可扩展且可信智能系统的强化学习

专知会员服务

6+阅读 · 5月13日

世界动作模型: 具身AI的下一个前沿

世界动作模型: 具身AI的下一个前沿

专知会员服务

12+阅读 · 5月13日

全球十大防空反导系统：列表、射程与用途

全球十大防空反导系统：列表、射程与用途

专知会员服务

15+阅读 · 5月13日

俄乌战争中的乌克兰一体化防空反导实战经验教训（5000字，中文版下载）

俄乌战争中的乌克兰一体化防空反导实战经验教训（5000字，中文版下载）

专知会员服务

27+阅读 · 5月13日

集中式指挥、分布式控制、脱节训练？——统一作战管理架构是北约分布式作战与训练的关键（中文版PDF下载）

集中式指挥、分布式控制、脱节训练？——统一作战管理架构是北约分布式作战与训练的关键（中文版PDF下载）

专知会员服务

21+阅读 · 5月13日

《实现协作自主：从人机团队到多智能体系统》190页

《实现协作自主：从人机团队到多智能体系统》190页

专知会员服务

15+阅读 · 5月13日

《推进多智能体系统：面向可扩展与鲁棒的学习与控制》200页

《推进多智能体系统：面向可扩展与鲁棒的学习与控制》200页

专知会员服务

8+阅读 · 5月13日

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

专知会员服务

8+阅读 · 5月13日

相关VIP内容

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

40+阅读 · 2月2日

《基于AI的动态任务分配策略实现多智能体系统有意义人类控制》报告

《基于AI的动态任务分配策略实现多智能体系统有意义人类控制》报告

专知会员服务

38+阅读 · 2025年12月26日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

26+阅读 · 2025年11月17日

《将自主系统整合入军事网络空间进攻行动的政策与技术建议》2025最新82页

《将自主系统整合入军事网络空间进攻行动的政策与技术建议》2025最新82页

专知会员服务

20+阅读 · 2025年11月11日

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

专知会员服务

54+阅读 · 2025年6月10日

中文版 | 多智能体系统在国防领域的应用：提升战略规划与自主作战能力

中文版 | 多智能体系统在国防领域的应用：提升战略规划与自主作战能力

专知会员服务

28+阅读 · 2025年5月8日

中文版 | 集中式与分布式多智能体AI协调策略

中文版 | 集中式与分布式多智能体AI协调策略

专知会员服务

21+阅读 · 2025年5月8日

多智能体协同决策研究全景透视：应用场景、研究方法、挑战与未来展望

多智能体协同决策研究全景透视：应用场景、研究方法、挑战与未来展望

专知会员服务

47+阅读 · 2025年3月20日

机密计算保障人工智能系统安全研究报告

机密计算保障人工智能系统安全研究报告

专知会员服务

19+阅读 · 2025年1月20日

精确打击体系智能化的发展

精确打击体系智能化的发展

专知会员服务

77+阅读 · 2024年2月3日

热门VIP内容

开通专知VIP会员享更多权益服务

【ICML2026】面向长上下文大语言模型的训练-推理一致性分段执行

《战略冲突的数学建模：基于变分不等式、不动点理论、间隙函数与微分博弈的美以伊冲突分析》

高阶网络的表示：基于图的框架综述

俄乌冲突中的高超音速武器系统及效能评估（中文版PDF下载）

相关资讯

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

专知

28+阅读 · 2022年10月22日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

专知

42+阅读 · 2022年7月27日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

109+阅读 · 2022年4月28日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

98+阅读 · 2022年3月7日

【人工智能】有关军事混合智能的几点再再思考、深绿” 及 AlphaGo 对指挥与控制智能化的启示

【人工智能】有关军事混合智能的几点再再思考、深绿” 及 AlphaGo 对指挥与控制智能化的启示

产业智能官

44+阅读 · 2018年12月11日

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

机器之心

16+阅读 · 2018年7月9日

智能时代如何构建金融反欺诈体系？

智能时代如何构建金融反欺诈体系？

数据猿

12+阅读 · 2018年3月26日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

相关论文

Open Challenges in Multi-Agent Security: Towards Secure Systems of Interacting AI Agents

Arxiv

0+阅读 · 4月29日

Security Considerations for Multi-agent Systems

Arxiv

0+阅读 · 4月26日

Automation-Exploit: A Multi-Agent LLM Framework for Adaptive Offensive Security with Digital Twin-Based Risk-Mitigated Exploitation

Arxiv

0+阅读 · 4月24日

Detecting Multi-Agent Collusion Through Multi-Agent Interpretability

Arxiv

0+阅读 · 4月1日

WebWeaver: Breaking Topology Confidentiality in LLM Multi-Agent Systems with Stealthy Context-Based Inference

Arxiv

0+阅读 · 3月19日

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

Arxiv

0+阅读 · 3月9日

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Arxiv

0+阅读 · 3月6日

Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems

Arxiv

0+阅读 · 3月5日

Tracking Capabilities for Safer Agents

Arxiv

0+阅读 · 3月1日

OMNI-LEAK: Orchestrator Multi-Agent Network Induced Data Leakage

Arxiv

0+阅读 · 2月25日

相关基金

复杂系统中多密码算法密钥协同安全研究

国家自然科学基金

0+阅读 · 2015年12月31日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员