Strategic multi-agent systems are fundamentally characterized by decentralization, uncertainty, and ambiguity. Agents operating under limited observations will often need to make decisions based on simplified internal models of the environment, reflecting bounded rationality in both computational capacity and environmental knowledge. The Empirical Evidence Equilibrium (EEE) framework explicitly accounts for these limitations by modeling each agent as forming a potentially misspecified belief derived from signals obtained through partial observations of the environment. The resulting equilibrium concept captures the system's steady state under bounded rationality and decentralization. In this work, we study games in which the environment dynamics are driven jointly by exogenous factors and agents' actions. We analyze agent behavior under Q-value iteration where each agent independently forms a belief model, computes Q-values, and derives a greedy strategy, yet the collective actions of all agents jointly shape the environment each agent faces at the next stage. We prove that despite this decentralization, an EEE emerges from the joint dynamics when the coupling between agents' actions and the environment is sufficiently weak. We further extend this result to softmax policies, establishing a contraction result under a sufficient coupling condition.


翻译:战略多智能体系统本质上以去中心化、不确定性和模糊性为特征。在有限观测下运行的智能体,通常需要基于简化的环境内部模型做出决策,这反映了它们在计算能力和环境知识两方面的有限理性。经验证据均衡(EEE)框架通过将每个智能体建模为基于对环境的局部观测所获信号来形成可能错误设定的信念,明确考虑了这些限制。由此产生的均衡概念捕捉了系统在有限理性和去中心化下的稳态。本文研究了环境动态由外生因素与智能体行动共同驱动的博弈。我们分析了智能体在Q值迭代下的行为,其中每个智能体独立形成信念模型、计算Q值并推导出贪婪策略,然而所有智能体的集体行动共同塑造了每个智能体在下一阶段所面临的环境。我们证明,尽管存在去中心化,但当智能体行动与环境之间的耦合足够弱时,EEE会从联合动态中涌现。我们进一步将这一结果扩展到softmax策略,在充分耦合条件下建立了收缩结果。

0
下载
关闭预览

相关内容

数据驱动的态势认知技术及发展思考
专知
19+阅读 · 2022年7月12日
强化学习《奖励函数设计: Reward Shaping》详细解读
深度强化学习实验室
20+阅读 · 2020年9月1日
量化金融强化学习论文集合
专知
14+阅读 · 2019年12月18日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
1+阅读 · 今天14:45
定向能反无人机系统最新发展动态
专知会员服务
3+阅读 · 今天13:50
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
2+阅读 · 今天13:33
相关VIP内容
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员