Repeated games are a framework for investigating long-term interdependence of multi-agent systems. In repeated games, zero-determinant (ZD) strategies attract much attention in evolutionary game theory, since they can unilaterally control payoffs. Especially, fair ZD strategies unilaterally equalize the payoff of the focal player and the average payoff of the opponents, and they were found in several games including the social dilemma games. Although the existence condition of ZD strategies in repeated games was specified, its extension to stochastic games is almost unclear. Stochastic games are an extension of repeated games, where a state of an environment exists, and the state changes to another one according to an action profile of players. Because of the transition of an environmental state, the existence condition of ZD strategies in stochastic games is more complicated than that in repeated games. Here, we investigate the existence condition of fair ZD strategies in the periodic prisoner's dilemma game, which is one of the simplest stochastic games. We show that fair ZD strategies do not necessarily exist in the periodic prisoner's dilemma game, in contrast to the repeated prisoner's dilemma game. Furthermore, we also prove that the Tit-for-Tat strategy, which imitates the opponent's action, is not necessarily a fair ZD strategy in the periodic prisoner's dilemma game, whereas the Tit-for-Tat strategy is always a fair ZD strategy in the repeated prisoner's dilemma game. Our results highlight difference between ZD strategies in the periodic prisoner's dilemma game and ones in the standard repeated prisoner's dilemma game.


翻译:重复博弈是研究多智能体系统长期相互依存关系的框架。在重复博弈中,零行列式(ZD)策略因能单方面控制收益而受到演化博弈理论的广泛关注。特别是公平的ZD策略能单方面使焦点玩家的收益与对手的平均收益相等化,此类策略已在包括社会困境博弈在内的多种博弈中被发现。尽管重复博弈中ZD策略的存在条件已明确,但其在随机博弈中的推广仍几乎未知。随机博弈是重复博弈的推广形式,其中存在环境状态,且状态会根据玩家的行动组合发生转移。由于环境状态的转移,随机博弈中ZD策略的存在条件比重复博弈更为复杂。本文研究最简单随机博弈之一——周期囚徒困境博弈中公平ZD策略的存在条件。我们证明与重复囚徒困境博弈不同,周期囚徒困境博弈中并不必然存在公平ZD策略。此外,我们还证明了模仿对手行为的"以牙还牙"策略在周期囚徒困境博弈中不必然是公平ZD策略,而在重复囚徒困境博弈中该策略始终是公平ZD策略。我们的研究结果凸显了周期囚徒困境博弈与标准重复囚徒困境博弈中ZD策略的差异。

0
下载
关闭预览

相关内容

【2023新书】使用博弈论进行决策,215页pdf
专知会员服务
132+阅读 · 2023年4月19日
面向智能博弈的决策Transformer方法综述
专知会员服务
201+阅读 · 2023年4月14日
【硬核书】博弈论,592页pdf
专知会员服务
165+阅读 · 2022年12月7日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
无人机集群对抗研究的关键问题
无人机
66+阅读 · 2018年9月16日
不对称多代理博弈中的博弈理论解读
AI前线
14+阅读 · 2018年3月8日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
Arxiv
0+阅读 · 4月26日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
2+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
3+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
3+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员