均衡博弈：多智能体系统中策略行为的实时监测 (Betting on Equilibrium: Monitoring Strategic Behavior in Multi-Agent Systems) - 专知论文

会员服务 ·

0

均衡 · 博弈 · 系统 · 智能体系统 · 多智能体系统 ·

Betting on Equilibrium: Monitoring Strategic Behavior in Multi-Agent Systems

翻译：均衡博弈：多智能体系统中策略行为的实时监测

Etienne Gauthier,Francis Bach,Michael I. Jordan

from arxiv, Code at: https://github.com/GauthierE/betting-equilibrium

In many multi-agent systems, agents interact repeatedly and are expected to settle into equilibrium behavior over time. Yet in practice, behavior often drifts, and detecting such deviations in real time remains an open challenge. We introduce a sequential testing framework that monitors whether observed play in repeated games is consistent with equilibrium, without assuming a fixed sample size. Our approach builds on the e-value framework for safe anytime-valid inference: by "betting" against equilibrium, we construct a test supermartingale that accumulates evidence whenever observed payoffs systematically violate equilibrium conditions. This yields a statistically sound, interpretable measure of departure from equilibrium that can be monitored online. We also leverage Benjamini-Hochberg-type procedures to increase detection power in large games while rigorously controlling the false discovery rate. Our framework unifies the treatment of Nash, correlated, and coarse correlated equilibria, offering finite-time guarantees and a detailed analysis of detection times. Moreover, we extend our method to stochastic games, broadening its applicability beyond repeated-play settings.

翻译：在许多多智能体系统中，智能体通过重复交互并预期随时间推移形成均衡行为。然而实践中，行为常会发生漂移，实时检测此类偏离仍是一个开放难题。本文提出一种序贯检验框架，用于监测重复博弈中观察到的行为是否与均衡一致，且无需预设固定样本量。该方法基于e值框架实现安全的任意时间有效推断：通过"博弈"对抗均衡，我们构建了一个检验上鞅，当观测收益系统性地违反均衡条件时，该鞅将持续累积证据。由此产生一个统计可靠、可解释的均衡偏离度量指标，支持在线监测。我们还利用Benjamini-Hochberg类程序来增强大型博弈中的检测效力，同时严格控制错误发现率。本框架统一处理纳什均衡、相关均衡与粗相关均衡，提供有限时间保证及检测时间的详细分析。此外，我们将该方法扩展至随机博弈场景，使其适用范围超越重复博弈框架。

0

相关内容

智能博弈对抗算法及其在情报领域中的应用*

智能博弈对抗算法及其在情报领域中的应用*

专知会员服务

39+阅读 · 2024年12月1日

智能博弈决策大模型智能体技术综述

智能博弈决策大模型智能体技术综述

专知会员服务

115+阅读 · 2024年6月29日

多智能体博弈学习研究进展

多智能体博弈学习研究进展

专知会员服务

89+阅读 · 2024年5月5日

多智能体系统带宽分配及预测云控制

多智能体系统带宽分配及预测云控制

专知会员服务

18+阅读 · 2023年7月9日

多智能体博弈、学习与控制

多智能体博弈、学习与控制

专知会员服务

127+阅读 · 2023年1月18日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知会员服务

106+阅读 · 2022年9月22日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

专知会员服务

65+阅读 · 2022年9月22日

牛津大学《多智能体影响图的均衡优化: 理论和实践》，Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

牛津大学《多智能体影响图的均衡优化: 理论和实践》，Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

专知会员服务

26+阅读 · 2022年4月10日

DARPA SI3-CMD项目支持，《网络多智能体影响博弈中的可扩展均衡计算》麻省理工、马里兰大学，Scalable Equilibrium Computation in Multi-agent Influence Games on Networks

DARPA SI3-CMD项目支持，《网络多智能体影响博弈中的可扩展均衡计算》麻省理工、马里兰大学，Scalable Equilibrium Computation in Multi-agent Influence Games on Networks

专知会员服务

24+阅读 · 2022年4月10日

牛津大学等《多智能体系统的博弈论验证》最新论文，Rational verification: game-theoretic verification of multi-agent systems

牛津大学等《多智能体系统的博弈论验证》最新论文，Rational verification: game-theoretic verification of multi-agent systems

专知会员服务

43+阅读 · 2022年4月4日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

专知

84+阅读 · 2022年9月24日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

58+阅读 · 2022年4月30日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

不对称多代理博弈中的博弈理论解读

不对称多代理博弈中的博弈理论解读

AI前线

14+阅读 · 2018年3月8日

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

新智元

13+阅读 · 2018年1月23日

侦测欺诈交易（异常点检测）

侦测欺诈交易（异常点检测）

GBASE数据工程部数据团队

20+阅读 · 2017年5月10日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

Multi-Player, Multi-Strategy Quantum Game Model for Interaction-Aware Decision-Making in Autonomous Driving

Arxiv

0+阅读 · 2月3日

Game-Theoretic and Algorithmic Analyses of Multi-Agent Routing under Crossing Costs

Arxiv

0+阅读 · 2月3日

FinEvo: From Isolated Backtests to Ecological Market Games for Multi-Agent Financial Strategy Evolution

Arxiv

0+阅读 · 2月1日

Multi-agent Adaptive Mechanism Design

Arxiv

0+阅读 · 1月30日

Strategic Tradeoffs Between Humans and AI in Multi-Agent Bargaining

Arxiv

0+阅读 · 1月24日

Game-Theoretic Lens on LLM-based Multi-Agent Systems

Arxiv

0+阅读 · 1月21日

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

Arxiv

0+阅读 · 1月21日

Betting on Equilibrium: Monitoring Strategic Behavior in Multi-Agent Systems

Arxiv

0+阅读 · 1月21日

Institutional AI: Governing LLM Collusion in Multi-Agent Cournot Markets via Public Governance Graphs

Arxiv

0+阅读 · 1月20日

Cascading multi-agent anomaly detection in surveillance systems via vision-language models and embedding-based classification

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

智能体系统

多智能体系统

相关VIP内容

智能博弈对抗算法及其在情报领域中的应用*

智能博弈对抗算法及其在情报领域中的应用*

专知会员服务

39+阅读 · 2024年12月1日

智能博弈决策大模型智能体技术综述

智能博弈决策大模型智能体技术综述

专知会员服务

115+阅读 · 2024年6月29日

多智能体博弈学习研究进展

多智能体博弈学习研究进展

专知会员服务

89+阅读 · 2024年5月5日

多智能体系统带宽分配及预测云控制

多智能体系统带宽分配及预测云控制

专知会员服务

18+阅读 · 2023年7月9日

多智能体博弈、学习与控制

多智能体博弈、学习与控制

专知会员服务

127+阅读 · 2023年1月18日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知会员服务

106+阅读 · 2022年9月22日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

专知会员服务

65+阅读 · 2022年9月22日

牛津大学《多智能体影响图的均衡优化: 理论和实践》，Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

牛津大学《多智能体影响图的均衡优化: 理论和实践》，Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

专知会员服务

26+阅读 · 2022年4月10日

DARPA SI3-CMD项目支持，《网络多智能体影响博弈中的可扩展均衡计算》麻省理工、马里兰大学，Scalable Equilibrium Computation in Multi-agent Influence Games on Networks

DARPA SI3-CMD项目支持，《网络多智能体影响博弈中的可扩展均衡计算》麻省理工、马里兰大学，Scalable Equilibrium Computation in Multi-agent Influence Games on Networks

专知会员服务

24+阅读 · 2022年4月10日

牛津大学等《多智能体系统的博弈论验证》最新论文，Rational verification: game-theoretic verification of multi-agent systems

牛津大学等《多智能体系统的博弈论验证》最新论文，Rational verification: game-theoretic verification of multi-agent systems

专知会员服务

43+阅读 · 2022年4月4日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

专知

84+阅读 · 2022年9月24日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

58+阅读 · 2022年4月30日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

不对称多代理博弈中的博弈理论解读

不对称多代理博弈中的博弈理论解读

AI前线

14+阅读 · 2018年3月8日

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

新智元

13+阅读 · 2018年1月23日

侦测欺诈交易（异常点检测）

侦测欺诈交易（异常点检测）

GBASE数据工程部数据团队

20+阅读 · 2017年5月10日

相关论文

Multi-Player, Multi-Strategy Quantum Game Model for Interaction-Aware Decision-Making in Autonomous Driving

Arxiv

0+阅读 · 2月3日

Game-Theoretic and Algorithmic Analyses of Multi-Agent Routing under Crossing Costs

Arxiv

0+阅读 · 2月3日

FinEvo: From Isolated Backtests to Ecological Market Games for Multi-Agent Financial Strategy Evolution

Arxiv

0+阅读 · 2月1日

Multi-agent Adaptive Mechanism Design

Arxiv

0+阅读 · 1月30日

Strategic Tradeoffs Between Humans and AI in Multi-Agent Bargaining

Arxiv

0+阅读 · 1月24日

Game-Theoretic Lens on LLM-based Multi-Agent Systems

Arxiv

0+阅读 · 1月21日

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

Arxiv

0+阅读 · 1月21日

Betting on Equilibrium: Monitoring Strategic Behavior in Multi-Agent Systems

Arxiv

0+阅读 · 1月21日

Institutional AI: Governing LLM Collusion in Multi-Agent Cournot Markets via Public Governance Graphs

Arxiv

0+阅读 · 1月20日

Cascading multi-agent anomaly detection in surveillance systems via vision-language models and embedding-based classification

Arxiv

0+阅读 · 1月16日

相关基金

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员