具有随机行动集的博弈中均衡计算 (Computing Equilibria in Games with Stochastic Action Sets) - 专知论文

会员服务 ·

0

博弈 · 均衡 · 表示 · 情境 · 概率分布 ·

Computing Equilibria in Games with Stochastic Action Sets

翻译：具有随机行动集的博弈中均衡计算

Thomas Schwarz,Ryann Sim,Chun Kai Ling

The study of learning in games typically assumes that each player always has access to all of their actions. However, in many practical scenarios, arbitrary restrictions induced by exogenous stochasticity might be placed on a player's action set. To model this setting, for a game $\mathcal{G}_{\mathrm{orig}}$ with action set $A_i$ for each player $i$, we introduce the corresponding Game with Stochastic Action Sets (GSAS) which is parametrized by a probability distribution over the players' set of possible action subsets $\mathcal{S}_i \subseteq 2^{\vert A_i\vert}\backslash\{\varnothing\}$. In a GSAS, players' strategies and Nash equilibria (NE) admit prohibitively large representations, thus existing algorithms for NE computation scale poorly. Under the assumption that action availabilities are independent between players, we show that NE in two-player zero-sum (2p0s) GSAS can be compactly represented by a vector of size $\vert A_i\vert$, overcoming naive exponential sized representation of equilibria. Computationally, we introduce an efficient approach based on sleeping internal regret minimization and show that it converges to approximate NE in 2p0s-GSAS at a rate $O(\sqrt{\log\vert A_i\vert/T})$ with appropriate choice of stepsizes, avoiding the exponential blow-up of game-dependent constants.

翻译：传统博弈学习研究通常假设每位参与者始终能够使用其所有可选行动。然而，在实际场景中，外生随机性可能导致参与者的行动集受到任意限制。为建模此类情境，针对每个参与者i具有行动集A_i的原始博弈G_orig，我们引入对应的具有随机行动集的博弈（GSAS），该模型通过参与者可能行动子集集合S_i ⊆ 2^{|A_i|}\{∅}上的概率分布进行参数化。在GSAS中，参与者策略与纳什均衡（NE）的表示规模呈指数级增长，导致现有NE计算算法可扩展性较差。在参与者间行动可用性相互独立的假设下，我们证明双人零和（2p0s）GSAS中的NE可通过规模为|A_i|的向量进行紧凑表示，从而克服了均衡表示规模随维度指数增长的问题。在计算层面，我们提出基于休眠内部遗憾最小化的高效方法，并证明通过合适的步长选择，该方法能以O(√(log|A_i|/T))的速率收敛至2p0s-GSAS中的近似NE，避免了博弈相关常数的指数级膨胀。

0

相关内容

《统一军事战略性兵力设计和作战：随机博弈方法》最新123页

《统一军事战略性兵力设计和作战：随机博弈方法》最新123页

专知会员服务

54+阅读 · 2024年9月20日

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

专知会员服务

140+阅读 · 2024年3月16日

【CMU博士论文】不完全信息博弈中的博弈决策学习动力学、均衡计算和复杂性，358页pdf

【CMU博士论文】不完全信息博弈中的博弈决策学习动力学、均衡计算和复杂性，358页pdf

专知会员服务

64+阅读 · 2023年6月16日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

【CMU博士论文】统计博弈理论，Statistical Game Theory，279页pdf

【CMU博士论文】统计博弈理论，Statistical Game Theory，279页pdf

专知会员服务

79+阅读 · 2022年8月17日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

86+阅读 · 2022年5月6日

DARPA SI3-CMD项目支持，《网络多智能体影响博弈中的可扩展均衡计算》麻省理工、马里兰大学，Scalable Equilibrium Computation in Multi-agent Influence Games on Networks

DARPA SI3-CMD项目支持，《网络多智能体影响博弈中的可扩展均衡计算》麻省理工、马里兰大学，Scalable Equilibrium Computation in Multi-agent Influence Games on Networks

专知会员服务

24+阅读 · 2022年4月10日

【AI+军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf

【AI+军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf

专知会员服务

318+阅读 · 2022年4月3日

斯坦福大学《博弈论基础简介》2017版，A Brief Introduction to the Basics of Game Theory，21页论文

斯坦福大学《博弈论基础简介》2017版，A Brief Introduction to the Basics of Game Theory，21页论文

专知会员服务

33+阅读 · 2022年4月1日

【ICML2021】为开放博弈中的学习建模行为多样性。

专知会员服务

37+阅读 · 2021年5月29日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

47+阅读 · 2022年11月16日

《美国国防科学委员会（DSB）关于博弈、演习、建模与仿真的国防建议最终报告》27页

《美国国防科学委员会（DSB）关于博弈、演习、建模与仿真的国防建议最终报告》27页

专知

30+阅读 · 2022年10月4日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知

54+阅读 · 2022年6月2日

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

专知

129+阅读 · 2022年4月4日

万字长文！《博弈论在国防中的应用综述》悉尼大学与澳大利亚国防科技2022最新40页pdf综述论文

万字长文！《博弈论在国防中的应用综述》悉尼大学与澳大利亚国防科技2022最新40页pdf综述论文

专知

26+阅读 · 2022年3月22日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

一文教你如何处理不平衡数据集（附代码）

一文教你如何处理不平衡数据集（附代码）

大数据文摘

11+阅读 · 2019年6月2日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

集成专家意见的在线投资组合策略设计及竞争性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

复杂动态网络上演化博弈的群体策略选择和干预机制研究

国家自然科学基金

5+阅读 · 2015年12月31日

经济学中均衡的计算及其在排序机制中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

随机对策的首达目标准则及其有限逼近

国家自然科学基金

0+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

有限范围随机最优控制系统的数值方法与均场倒向随机系统的最优控制问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

随机方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

Learning Distributed Equilibria in Linear-Quadratic Stochastic Differential Games: An $α$-Potential Approach

Arxiv

0+阅读 · 2月18日

Nash-convergence of Game Dynamics and Complexity

Arxiv

0+阅读 · 2月17日

Equilibria in Large Position-Optimization Games

Arxiv

0+阅读 · 2月16日

Verifying Equilibria in Finite-Horizon Probabilistic Concurrent Game Systems

Arxiv

0+阅读 · 2月13日

Learning in Structured Stackelberg Games

Arxiv

0+阅读 · 2月12日

Computing stable limit cycles of learning in games

Arxiv

0+阅读 · 2月11日

Statistical Equilibrium of Optimistic Beliefs

Arxiv

0+阅读 · 2月11日

Optimal Rates for Feasible Payoff Set Estimation in Games

Arxiv

0+阅读 · 2月4日

The Learning Approach to Games

Arxiv

0+阅读 · 2月3日

Actor-Dual-Critic Dynamics for Zero-sum and Identical-Interest Stochastic Games

Arxiv

0+阅读 · 1月31日

VIP会员

文章信息

相关主题

相关VIP内容

《统一军事战略性兵力设计和作战：随机博弈方法》最新123页

《统一军事战略性兵力设计和作战：随机博弈方法》最新123页

专知会员服务

54+阅读 · 2024年9月20日

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

专知会员服务

140+阅读 · 2024年3月16日

【CMU博士论文】不完全信息博弈中的博弈决策学习动力学、均衡计算和复杂性，358页pdf

【CMU博士论文】不完全信息博弈中的博弈决策学习动力学、均衡计算和复杂性，358页pdf

专知会员服务

64+阅读 · 2023年6月16日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

【CMU博士论文】统计博弈理论，Statistical Game Theory，279页pdf

【CMU博士论文】统计博弈理论，Statistical Game Theory，279页pdf

专知会员服务

79+阅读 · 2022年8月17日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

86+阅读 · 2022年5月6日

DARPA SI3-CMD项目支持，《网络多智能体影响博弈中的可扩展均衡计算》麻省理工、马里兰大学，Scalable Equilibrium Computation in Multi-agent Influence Games on Networks

DARPA SI3-CMD项目支持，《网络多智能体影响博弈中的可扩展均衡计算》麻省理工、马里兰大学，Scalable Equilibrium Computation in Multi-agent Influence Games on Networks

专知会员服务

24+阅读 · 2022年4月10日

【AI+军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf

【AI+军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf

专知会员服务

318+阅读 · 2022年4月3日

斯坦福大学《博弈论基础简介》2017版，A Brief Introduction to the Basics of Game Theory，21页论文

斯坦福大学《博弈论基础简介》2017版，A Brief Introduction to the Basics of Game Theory，21页论文

专知会员服务

33+阅读 · 2022年4月1日

【ICML2021】为开放博弈中的学习建模行为多样性。

专知会员服务

37+阅读 · 2021年5月29日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

47+阅读 · 2022年11月16日

《美国国防科学委员会（DSB）关于博弈、演习、建模与仿真的国防建议最终报告》27页

《美国国防科学委员会（DSB）关于博弈、演习、建模与仿真的国防建议最终报告》27页

专知

30+阅读 · 2022年10月4日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知

54+阅读 · 2022年6月2日

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

专知

129+阅读 · 2022年4月4日

万字长文！《博弈论在国防中的应用综述》悉尼大学与澳大利亚国防科技2022最新40页pdf综述论文

万字长文！《博弈论在国防中的应用综述》悉尼大学与澳大利亚国防科技2022最新40页pdf综述论文

专知

26+阅读 · 2022年3月22日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

一文教你如何处理不平衡数据集（附代码）

一文教你如何处理不平衡数据集（附代码）

大数据文摘

11+阅读 · 2019年6月2日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

相关论文

Learning Distributed Equilibria in Linear-Quadratic Stochastic Differential Games: An $α$-Potential Approach

Arxiv

0+阅读 · 2月18日

Nash-convergence of Game Dynamics and Complexity

Arxiv

0+阅读 · 2月17日

Equilibria in Large Position-Optimization Games

Arxiv

0+阅读 · 2月16日

Verifying Equilibria in Finite-Horizon Probabilistic Concurrent Game Systems

Arxiv

0+阅读 · 2月13日

Learning in Structured Stackelberg Games

Arxiv

0+阅读 · 2月12日

Computing stable limit cycles of learning in games

Arxiv

0+阅读 · 2月11日

Statistical Equilibrium of Optimistic Beliefs

Arxiv

0+阅读 · 2月11日

Optimal Rates for Feasible Payoff Set Estimation in Games

Arxiv

0+阅读 · 2月4日

The Learning Approach to Games

Arxiv

0+阅读 · 2月3日

Actor-Dual-Critic Dynamics for Zero-sum and Identical-Interest Stochastic Games

Arxiv

0+阅读 · 1月31日

相关基金

集成专家意见的在线投资组合策略设计及竞争性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

复杂动态网络上演化博弈的群体策略选择和干预机制研究

国家自然科学基金

5+阅读 · 2015年12月31日

经济学中均衡的计算及其在排序机制中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

随机对策的首达目标准则及其有限逼近

国家自然科学基金

0+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

有限范围随机最优控制系统的数值方法与均场倒向随机系统的最优控制问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

随机方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员