This work introduces a unified framework for analyzing games in greater depth. In the existing literature, players' strategies are typically assigned scalar values, and equilibrium concepts are used to identify compatible choices. However, this approach neglects the internal structure of players, thereby failing to accurately model observed behaviors. To address this limitation, we propose an abstract definition of a player, consistent with constructions in reinforcement learning. Instead of defining games as external settings, our framework defines them in terms of the players themselves. This offers a language that enables a deeper connection between games and learning. To illustrate the need for this generality, we study a simple two-player game and show that even in basic settings, a sophisticated player may adopt dynamic strategies that cannot be captured by simpler models or compatibility analysis. For a general definition of a player, we discuss natural conditions on its components and define competition through their behavior. In the discrete setting, we consider players whose estimates largely follow the standard framework from the literature. We explore connections to correlated equilibrium and highlight that dynamic programming naturally applies to all estimates. In the mean-field setting, we exploit symmetry to construct explicit examples of equilibria. Finally, we conclude by examining relations to reinforcement learning.


翻译:本研究提出了一个用于深入分析博弈的统一框架。现有文献通常将参与者的策略分配标量值,并使用均衡概念来识别相容选择。然而,这种方法忽略了参与者的内部结构,因而无法准确建模观察到的行为。为克服这一局限,我们提出了与强化学习构造相一致的参与者抽象定义。我们的框架并非将博弈定义为外部环境,而是依据参与者自身来定义博弈。这提供了一种能够更深入连接博弈与学习的语言。为说明这种一般性定义的必要性,我们研究了一个简单的双参与者博弈,并证明即使在基本设定中,复杂参与者也可能采用动态策略,这些策略无法通过简单模型或相容性分析来捕捉。针对参与者的一般定义,我们讨论了其各组成部分的自然条件,并通过其行为定义竞争关系。在离散设定中,我们考察了其估计值基本遵循文献标准框架的参与者。我们探讨了与相关均衡的联系,并强调动态规划自然适用于所有估计过程。在平均场设定中,我们利用对称性构建了均衡的显式示例。最后,我们通过考察与强化学习的关系来总结全文。

0
下载
关闭预览

相关内容

【新书】深度学习中的博弈论应用
专知会员服务
84+阅读 · 2024年3月27日
【干货书】算法博弈论,Algorithmic Game Theory,775页pdf
专知会员服务
89+阅读 · 2023年6月19日
【硬核书】博弈论,592页pdf
专知会员服务
164+阅读 · 2022年12月7日
使用博弈论进行国防资源分配管理
专知会员服务
86+阅读 · 2022年5月6日
【经典书】算法博弈论,775页pdf,Algorithmic Game Theory
专知会员服务
156+阅读 · 2021年5月9日
浅谈主动学习(Active Learning)
凡人机器学习
32+阅读 · 2020年6月18日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
Arxiv
0+阅读 · 2月19日
Arxiv
0+阅读 · 2月12日
VIP会员
相关基金
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员