The Learning Approach to Games - 专知论文

会员服务 ·

0

博弈 · 均衡 · 分析 · 标量 · 识别 ·

The Learning Approach to Games

翻译：博弈的学习方法

Melih İşeri,Erhan Bayraktar

from arxiv, 43 pages, 2 figures. Related repositories are http://github.com/melihiseri/TwoPlayerGame and http://github.com/melihiseri/CartPole_ToyModel

This work introduces a unified framework for analyzing games in greater depth. In the existing literature, players' strategies are typically assigned scalar values, and equilibrium concepts are used to identify compatible choices. However, this approach neglects the internal structure of players, thereby failing to accurately model observed behaviors. To address this limitation, we propose an abstract definition of a player, consistent with constructions in reinforcement learning. Instead of defining games as external settings, our framework defines them in terms of the players themselves. This offers a language that enables a deeper connection between games and learning. To illustrate the need for this generality, we study a simple two-player game and show that even in basic settings, a sophisticated player may adopt dynamic strategies that cannot be captured by simpler models or compatibility analysis. For a general definition of a player, we discuss natural conditions on its components and define competition through their behavior. In the discrete setting, we consider players whose estimates largely follow the standard framework from the literature. We explore connections to correlated equilibrium and highlight that dynamic programming naturally applies to all estimates. In the mean-field setting, we exploit symmetry to construct explicit examples of equilibria. Finally, we conclude by examining relations to reinforcement learning.

翻译：本研究提出了一个用于深入分析博弈的统一框架。现有文献通常将参与者的策略分配标量值，并使用均衡概念来识别相容选择。然而，这种方法忽略了参与者的内部结构，因而无法准确建模观察到的行为。为克服这一局限，我们提出了与强化学习构造相一致的参与者抽象定义。我们的框架并非将博弈定义为外部环境，而是依据参与者自身来定义博弈。这提供了一种能够更深入连接博弈与学习的语言。为说明这种一般性定义的必要性，我们研究了一个简单的双参与者博弈，并证明即使在基本设定中，复杂参与者也可能采用动态策略，这些策略无法通过简单模型或相容性分析来捕捉。针对参与者的一般定义，我们讨论了其各组成部分的自然条件，并通过其行为定义竞争关系。在离散设定中，我们考察了其估计值基本遵循文献标准框架的参与者。我们探讨了与相关均衡的联系，并强调动态规划自然适用于所有估计过程。在平均场设定中，我们利用对称性构建了均衡的显式示例。最后，我们通过考察与强化学习的关系来总结全文。

0

相关内容

【新书】深度学习中的博弈论应用

【新书】深度学习中的博弈论应用

专知会员服务

84+阅读 · 2024年3月27日

【干货书】算法博弈论，Algorithmic Game Theory，775页pdf

【干货书】算法博弈论，Algorithmic Game Theory，775页pdf

专知会员服务

89+阅读 · 2023年6月19日

【硬核书】博弈论，592页pdf

【硬核书】博弈论，592页pdf

专知会员服务

165+阅读 · 2022年12月7日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

86+阅读 · 2022年5月6日

【AI+军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf

【AI+军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf

专知会员服务

319+阅读 · 2022年4月3日

斯坦福大学《博弈论基础简介》2017版，A Brief Introduction to the Basics of Game Theory，21页论文

斯坦福大学《博弈论基础简介》2017版，A Brief Introduction to the Basics of Game Theory，21页论文

专知会员服务

33+阅读 · 2022年4月1日

【经典书】算法博弈论，775页pdf，Algorithmic Game Theory

【经典书】算法博弈论，775页pdf，Algorithmic Game Theory

专知会员服务

156+阅读 · 2021年5月9日

【硬核书】博弈论导论，417页pdf，Game Theory: An Introduction，普林斯顿大学出版社

【硬核书】博弈论导论，417页pdf，Game Theory: An Introduction，普林斯顿大学出版社

专知会员服务

234+阅读 · 2020年4月21日

【基于模型的强化学习的博弈论框架】A Game Theoretic Framework for Model Based Reinforcement Learning

【基于模型的强化学习的博弈论框架】A Game Theoretic Framework for Model Based Reinforcement Learning

专知会员服务

131+阅读 · 2020年4月19日

【硬核书】数学博弈论与应用，431页pdf，Mathematical Game Theory and Applications

【硬核书】数学博弈论与应用，431页pdf，Mathematical Game Theory and Applications

专知会员服务

171+阅读 · 2020年4月18日

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

专知

16+阅读 · 2022年10月22日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

专知

23+阅读 · 2022年8月28日

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

专知

131+阅读 · 2022年4月4日

万字长文！《博弈论在国防中的应用综述》悉尼大学与澳大利亚国防科技2022最新40页pdf综述论文

万字长文！《博弈论在国防中的应用综述》悉尼大学与澳大利亚国防科技2022最新40页pdf综述论文

专知

26+阅读 · 2022年3月22日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知

42+阅读 · 2019年1月7日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

【下载】深度学习与围棋实战书籍《Deep Learning and the Game of Go》

【下载】深度学习与围棋实战书籍《Deep Learning and the Game of Go》

专知

20+阅读 · 2017年12月13日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

复杂动态网络上演化博弈的群体策略选择和干预机制研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于非局域性的量子博弈研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

随机方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

基于博弈论的信息安全理论与方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

Learning to Recommend in Unknown Games

Arxiv

0+阅读 · 3月4日

Sink equilibria and the attractors of learning in games

Arxiv

0+阅读 · 3月4日

Optimistic Online Learning in Symmetric Cone Games

Arxiv

0+阅读 · 3月2日

Gaming and Cooperation in Federated Learning: What Can Happen and How to Monitor It

Arxiv

0+阅读 · 3月2日

Learning a Game by Paying the Agents

Arxiv

0+阅读 · 3月2日

Learning to Play Multi-Follower Bayesian Stackelberg Games

Arxiv

0+阅读 · 3月1日

Learning to Control Unknown Strongly Monotone Games

Arxiv

0+阅读 · 2月24日

Learning to Recommend in Unknown Games

Arxiv

0+阅读 · 2月19日

Learning in Structured Stackelberg Games

Arxiv

0+阅读 · 2月12日

Games with Payments between Learning Agents

Arxiv

0+阅读 · 2月11日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

专知会员服务

2+阅读 · 6月1日

综述 | OPSD：大语言模型的在线策略自蒸馏

综述 | OPSD：大语言模型的在线策略自蒸馏

专知会员服务

2+阅读 · 6月1日

算法化战争：人工智能时代的新范式（万字长文）

算法化战争：人工智能时代的新范式（万字长文）

专知会员服务

7+阅读 · 6月1日

帕兰蒂尔Maven：军事人工智能的新纪元

帕兰蒂尔Maven：军事人工智能的新纪元

专知会员服务

7+阅读 · 6月1日

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

专知会员服务

9+阅读 · 6月1日

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

专知会员服务

8+阅读 · 6月1日

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

13+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

6+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

5+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

3+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

8+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

4+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

6+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

7+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

7+阅读 · 5月30日

相关VIP内容

【新书】深度学习中的博弈论应用

【新书】深度学习中的博弈论应用

专知会员服务

84+阅读 · 2024年3月27日

【干货书】算法博弈论，Algorithmic Game Theory，775页pdf

【干货书】算法博弈论，Algorithmic Game Theory，775页pdf

专知会员服务

89+阅读 · 2023年6月19日

【硬核书】博弈论，592页pdf

【硬核书】博弈论，592页pdf

专知会员服务

165+阅读 · 2022年12月7日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

86+阅读 · 2022年5月6日

【AI+军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf

【AI+军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf

专知会员服务

319+阅读 · 2022年4月3日

斯坦福大学《博弈论基础简介》2017版，A Brief Introduction to the Basics of Game Theory，21页论文

斯坦福大学《博弈论基础简介》2017版，A Brief Introduction to the Basics of Game Theory，21页论文

专知会员服务

33+阅读 · 2022年4月1日

【经典书】算法博弈论，775页pdf，Algorithmic Game Theory

【经典书】算法博弈论，775页pdf，Algorithmic Game Theory

专知会员服务

156+阅读 · 2021年5月9日

【硬核书】博弈论导论，417页pdf，Game Theory: An Introduction，普林斯顿大学出版社

【硬核书】博弈论导论，417页pdf，Game Theory: An Introduction，普林斯顿大学出版社

专知会员服务

234+阅读 · 2020年4月21日

【基于模型的强化学习的博弈论框架】A Game Theoretic Framework for Model Based Reinforcement Learning

【基于模型的强化学习的博弈论框架】A Game Theoretic Framework for Model Based Reinforcement Learning

专知会员服务

131+阅读 · 2020年4月19日

【硬核书】数学博弈论与应用，431页pdf，Mathematical Game Theory and Applications

【硬核书】数学博弈论与应用，431页pdf，Mathematical Game Theory and Applications

专知会员服务

171+阅读 · 2020年4月18日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | OPSD：大语言模型的在线策略自蒸馏

帕兰蒂尔Maven：军事人工智能的新纪元

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

算法化战争：人工智能时代的新范式（万字长文）

相关资讯

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

专知

16+阅读 · 2022年10月22日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

专知

23+阅读 · 2022年8月28日

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

专知

131+阅读 · 2022年4月4日

万字长文！《博弈论在国防中的应用综述》悉尼大学与澳大利亚国防科技2022最新40页pdf综述论文

万字长文！《博弈论在国防中的应用综述》悉尼大学与澳大利亚国防科技2022最新40页pdf综述论文

专知

26+阅读 · 2022年3月22日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知

42+阅读 · 2019年1月7日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

【下载】深度学习与围棋实战书籍《Deep Learning and the Game of Go》

【下载】深度学习与围棋实战书籍《Deep Learning and the Game of Go》

专知

20+阅读 · 2017年12月13日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Learning to Recommend in Unknown Games

Arxiv

0+阅读 · 3月4日

Sink equilibria and the attractors of learning in games

Arxiv

0+阅读 · 3月4日

Optimistic Online Learning in Symmetric Cone Games

Arxiv

0+阅读 · 3月2日

Gaming and Cooperation in Federated Learning: What Can Happen and How to Monitor It

Arxiv

0+阅读 · 3月2日

Learning a Game by Paying the Agents

Arxiv

0+阅读 · 3月2日

Learning to Play Multi-Follower Bayesian Stackelberg Games

Arxiv

0+阅读 · 3月1日

Learning to Control Unknown Strongly Monotone Games

Arxiv

0+阅读 · 2月24日

Learning to Recommend in Unknown Games

Arxiv

0+阅读 · 2月19日

Learning in Structured Stackelberg Games

Arxiv

0+阅读 · 2月12日

Games with Payments between Learning Agents

Arxiv

0+阅读 · 2月11日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

复杂动态网络上演化博弈的群体策略选择和干预机制研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于非局域性的量子博弈研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

随机方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

基于博弈论的信息安全理论与方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员