Although logit quantal response equilibrium (logit QRE) offers a natural equilibrium selection mechanism and converges to Nash equilibrium as the rationality parameter tends to infinity, its computation in extensive-form games is generally intractable when based on the normal-form representation, due to the exponential growth of the strategy space. To address this difficulty, this paper develops a sequence-form formulation of logit QRE for finite n-player extensive-form games with perfect recall, which avoids explicit construction of the normal form and enables compact computation. Based on this formulation, we further develop a differentiable path-following method starting from an arbitrary initial point, such that each point on the path corresponds to a logit QRE associated with a particular value of the rationality parameter, and the limiting point yields a Nash equilibrium. In this way, the proposed method provides an efficient computational framework for exploiting the equilibrium selection property of logit QRE in extensive-form games. The effectiveness of the proposed method is validated by theoretical analysis and numerical experiments.


翻译:虽然对数线性量化反应均衡(logit QRE)提供了一种自然的均衡选择机制,且当理性参数趋于无穷时收敛于纳什均衡,但在扩展型博弈中,基于正规形式表示的计算通常因其策略空间呈指数增长而难以处理。为解决这一难题,本文针对具有完美记忆的有限n人扩展型博弈,发展了一种基于序列形式的logit QRE表述,该表述避免了正规形式的显式构造,并实现了紧凑计算。基于这一表述,我们进一步提出了一种从任意初始点出发的可微路径追踪方法,使得路径上的每个点对应特定理性参数值下的logit QRE,而极限点则产生一个纳什均衡。由此,所提方法为在扩展型博弈中利用logit QRE的均衡选择特性提供了高效的计算框架。理论分析与数值实验验证了该方法的有效性。

0
下载
关闭预览

相关内容

基于博弈论的弹目攻防决策方法研究
专知会员服务
52+阅读 · 2024年7月11日
面向智能博弈的决策Transformer方法综述
专知会员服务
201+阅读 · 2023年4月14日
《资源分配博弈中的收敛率》
专知会员服务
42+阅读 · 2023年3月10日
专知会员服务
41+阅读 · 2021年2月12日
详解ORB-SLAM2中的特征均匀提取策略
计算机视觉life
11+阅读 · 2019年10月9日
变分自编码器VAE:一步到位的聚类方案
PaperWeekly
25+阅读 · 2018年9月18日
超全总结:神经网络加速之量化模型 | 附带代码
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | 从问答到任务完成:Agent系统与Harness设计
专知会员服务
2+阅读 · 今天16:54
Agentic RL:框架、实践与长程智能体训练
专知会员服务
1+阅读 · 今天16:52
重新思考无人机时代的生存能力
专知会员服务
5+阅读 · 今天7:44
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
4+阅读 · 今天7:28
在人工智能加速决策环境中拓展OODA循环
专知会员服务
4+阅读 · 今天7:18
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
4+阅读 · 今天7:03
综述 | 世界动作模型:少做梦,多行动
专知会员服务
6+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关VIP内容
基于博弈论的弹目攻防决策方法研究
专知会员服务
52+阅读 · 2024年7月11日
面向智能博弈的决策Transformer方法综述
专知会员服务
201+阅读 · 2023年4月14日
《资源分配博弈中的收敛率》
专知会员服务
42+阅读 · 2023年3月10日
专知会员服务
41+阅读 · 2021年2月12日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员