Extensive-form games (EFGs) are a standard model for sequential decision-making in games. A fundamental and typically implicit assumption in EFGs is that players always have access to all of their actions at every decision point. However, in many realistic settings, certain actions might be unavailable during game-play due to exogenous stochasticity, hindering the expressivity of the standard EFG model. Given a `base' EFG, we formalize a model that allows for actions to be stochastically restricted, leading to a corresponding Extensive-Form Games with Stochastic Action Sets (EFGSAS). In EFGSAS, we derive an expansion procedure that results in an equivalent EFG, thus showing that standard strategy formalisms could require exponentially-large representations. However, under an appropriate independence assumption, we show that compact strategy representations polynomial in the size of the base EFG exist. Computationally, we introduce an algorithm called SI-CFR that minimizes sleeping internal regret, converging to Nash equilibria with high probability in two-player zero-sum EFGSAS. Finally, we utilize a stochastic approximation procedure to recover compact representations of Nash equilibria, utilizing only the iterates of SI-CFR.


翻译:扩展式博弈(Extensive-Form Games,EFGs)是建模博弈中序贯决策的标准模型。该模型通常隐含一个基本假设:玩家在每个决策点始终能够使用所有可用动作。然而,在众多现实场景中,某些动作可能在博弈过程中因外生随机性而不可用,从而限制了标准EFG模型的表达能力。基于一个“基础”EFG,我们形式化了一个允许动作受到随机限制的模型,由此得到对应的具有随机动作集的扩展式博弈(Extensive-Form Games with Stochastic Action Sets,EFGSAS)。在EFGSAS中,我们推导出一种展开过程,该过程可得到一个等价的EFG,从而表明标准策略形式化表示可能需要指数级大小的表示。然而,在适当的独立性假设下,我们证明存在以基础EFG规模为多项式的紧凑策略表示。在计算方面,我们提出一种称为SI-CFR的算法,它能最小化睡眠内部遗憾,并在两人零和EFGSAS中以高概率收敛到纳什均衡。最后,我们利用一种随机逼近过程,仅通过SI-CFR的迭代结果来恢复纳什均衡的紧凑表示。

0
下载
关闭预览

相关内容

ACM/IEEE第23届模型驱动工程语言和系统国际会议,是模型驱动软件和系统工程的首要会议系列,由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来,模型涵盖了建模的各个方面,从语言和方法到工具和应用程序。模特的参加者来自不同的背景,包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛,参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会,并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。 官网链接:http://www.modelsconference.org/
【2023新书】合作博弈论的计算方面,170页pdf
专知会员服务
72+阅读 · 2023年6月29日
使用博弈论进行国防资源分配管理
专知会员服务
87+阅读 · 2022年5月6日
专知会员服务
41+阅读 · 2021年2月12日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
综述:军事应用中使用的一些重要算法
专知
13+阅读 · 2022年7月3日
Attention!注意力机制模型最新综述
中国人工智能学会
18+阅读 · 2019年4月8日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Arxiv
0+阅读 · 6月2日
Arxiv
0+阅读 · 5月11日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员