Do Not Discretize, Optimize: Almost Greedy Fictitious Play - 专知论文

会员服务 ·

0

贪心 · 纳什均衡 · Machine Learning · Learning · motivation ·

Do Not Discretize, Optimize: Almost Greedy Fictitious Play

翻译：不要离散化，优化：近乎贪婪的虚构博弈

Evangelos Markakis,Christodoulos Santorinaios

from arxiv, 18 pages, 7 figures

Our work revolves around Fictitious Play, one of the first iterative methods that is known to converge to a Nash equilibrium in zero-sum games. In recent years, there has been a revived interest, due to applications in various machine learning problems, which has motivated a line of work on its convergence properties and on proposing new variants of the initial algorithm. Our paper is along this direction and introduces one new variant, which we refer to as Almost Greedy Fictitious Play. The proposed algorithm greedily attempts to find the optimal stepsize at each iteration but its search space is constrained and includes almost all the line between the cumulative mixed strategy and the current best response. Our main result is that the method achieves an instance dependent convergence rate of $\mathcal{O}(1/T)$ with respect to the duality gap. This matches the rate of Continuous Fictitious Play, and offers an alternative to discretization. We complement our theoretical findings with experiments that demonstrate the effectiveness of the method.

翻译：我们的工作围绕虚构博弈展开，这是已知在零和博弈中收敛到纳什均衡的首批迭代方法之一。近年来，由于在各类机器学习问题中的应用，该领域重新引起了研究兴趣，并推动了关于其收敛特性以及提出初始算法新变种的一系列工作。我们的论文沿此方向，引入了一种新变体，我们称之为“近乎贪婪的虚构博弈”。所提出的算法在每个迭代中贪婪地尝试寻找最优步长，但其搜索空间受到约束，涵盖了累积混合策略与当前最优反应之间几乎所有的线段。我们的主要结果是，该方法在对偶间隙方面实现了依赖于实例的$\mathcal{O}(1/T)$收敛速率。这与连续虚构博弈的速率相匹配，并为离散化提供了一种替代方案。我们通过实验补充了理论发现，证明了该方法的有效性。

0

相关内容

【阿姆斯特丹博士论文】优化、博弈与泛化界，208页pdf

【阿姆斯特丹博士论文】优化、博弈与泛化界，208页pdf

专知会员服务

31+阅读 · 2024年11月16日

【干货书】算法博弈论，Algorithmic Game Theory，775页pdf

【干货书】算法博弈论，Algorithmic Game Theory，775页pdf

专知会员服务

89+阅读 · 2023年6月19日

《资源分配博弈中的收敛率》

《资源分配博弈中的收敛率》

专知会员服务

42+阅读 · 2023年3月10日

【硬核书】博弈论，592页pdf

【硬核书】博弈论，592页pdf

专知会员服务

165+阅读 · 2022年12月7日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

专知会员服务

33+阅读 · 2022年3月4日

【经典书】算法博弈论，775页pdf，Algorithmic Game Theory

【经典书】算法博弈论，775页pdf，Algorithmic Game Theory

专知会员服务

157+阅读 · 2021年5月9日

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

专知会员服务

21+阅读 · 2020年7月24日

【NeurlPS2019论文总结】一致收敛可能无法解释深度学习中的泛化现象，Uniform convergence may be unable to explain generalization in deep learning

【NeurlPS2019论文总结】一致收敛可能无法解释深度学习中的泛化现象，Uniform convergence may be unable to explain generalization in deep learning

专知会员服务

15+阅读 · 2019年12月17日

【NeurIPS2019|杰出新方向论文奖】统一收敛可能无法解释深度学习中的泛化性（Uniform convergence maybe unable to explain generalization in deep learning）

【NeurIPS2019|杰出新方向论文奖】统一收敛可能无法解释深度学习中的泛化性（Uniform convergence maybe unable to explain generalization in deep learning）

专知会员服务

13+阅读 · 2019年12月9日

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

专知

16+阅读 · 2022年10月22日

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

专知

131+阅读 · 2022年4月4日

元强化学习迎来一盆冷水：不比元Q学习好多少

元强化学习迎来一盆冷水：不比元Q学习好多少

AI科技评论

12+阅读 · 2020年2月27日

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知

42+阅读 · 2019年1月7日

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

专知

32+阅读 · 2018年8月14日

如果你研究多因子模型，这篇文章看不懂就别玩了！

如果你研究多因子模型，这篇文章看不懂就别玩了！

量化投资与机器学习

26+阅读 · 2018年7月31日

放弃 RNN/LSTM 吧，因为真的不好用！望周知~

放弃 RNN/LSTM 吧，因为真的不好用！望周知~

人工智能头条

19+阅读 · 2018年4月24日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

从浅层模型到深度模型：概览机器学习优化算法

从浅层模型到深度模型：概览机器学习优化算法

机器之心

27+阅读 · 2017年7月9日

非线性组合优化暑期学校暨学术前沿研讨会

国家自然科学基金

6+阅读 · 2017年6月30日

复杂动态网络上演化博弈的群体策略选择和干预机制研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于非局域性的量子博弈研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

非光滑非凸优化问题的交替线性化算法及其应用

国家自然科学基金

6+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

随机偏微分方程多辛几何算法及不确定性量化

国家自然科学基金

0+阅读 · 2015年12月31日

广义单调（增生）算子的零点逼近与分裂可行问题的正则化研究

国家自然科学基金

0+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

Characterizing Nash Equilibria in Zero-Sum Games: A Physics-Inspired, Parallelizable Approach with a Linear Number of Gradient Queries

Characterizing Nash Equilibria in Zero-Sum Games: A Physics-Inspired, Parallelizable Approach with a Linear Number of Gradient Queries

Arxiv

0+阅读 · 6月16日

On Type Deception in Linear-Quadratic Differential Games

Arxiv

0+阅读 · 6月13日

Zero-Sum Fictitious Play Cannot Converge to a Point

Arxiv

0+阅读 · 6月12日

On the Geometry of Games and their Solvers

Arxiv

0+阅读 · 5月28日

On the Complexity of Correlated Equilibria Beyond Normal-Form Games

Arxiv

0+阅读 · 5月17日

When and Why is Optimistic Multiplicative Weights Slow? The Geometry of Energy Dissipation

Arxiv

0+阅读 · 5月13日

Offline Two-Player Zero-Sum Markov Games with KL Regularization

Arxiv

0+阅读 · 5月13日

Structure from Strategic Interaction & Uncertainty: Risk Sensitive Games for Robust Preference Learning

Arxiv

0+阅读 · 5月12日

Structure from Strategic Interaction & Uncertainty Risk Sensitive Games for Robust Preference Learning

Arxiv

0+阅读 · 5月11日

Fast Strategy Solving for the Informed Player in Two-Player Zero-Sum Linear-Quadratic Differential Games with One-Sided Information

Arxiv

0+阅读 · 5月4日

VIP会员

文章信息

相关主题

Machine Learning

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

1+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

3+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

2+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

2+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

9+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

11+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

5+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

9+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

7+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

7+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

7+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

5+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

【阿姆斯特丹博士论文】优化、博弈与泛化界，208页pdf

【阿姆斯特丹博士论文】优化、博弈与泛化界，208页pdf

专知会员服务

31+阅读 · 2024年11月16日

【干货书】算法博弈论，Algorithmic Game Theory，775页pdf

【干货书】算法博弈论，Algorithmic Game Theory，775页pdf

专知会员服务

89+阅读 · 2023年6月19日

《资源分配博弈中的收敛率》

《资源分配博弈中的收敛率》

专知会员服务

42+阅读 · 2023年3月10日

【硬核书】博弈论，592页pdf

【硬核书】博弈论，592页pdf

专知会员服务

165+阅读 · 2022年12月7日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

专知会员服务

33+阅读 · 2022年3月4日

【经典书】算法博弈论，775页pdf，Algorithmic Game Theory

【经典书】算法博弈论，775页pdf，Algorithmic Game Theory

专知会员服务

157+阅读 · 2021年5月9日

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

专知会员服务

21+阅读 · 2020年7月24日

【NeurlPS2019论文总结】一致收敛可能无法解释深度学习中的泛化现象，Uniform convergence may be unable to explain generalization in deep learning

【NeurlPS2019论文总结】一致收敛可能无法解释深度学习中的泛化现象，Uniform convergence may be unable to explain generalization in deep learning

专知会员服务

15+阅读 · 2019年12月17日

【NeurIPS2019|杰出新方向论文奖】统一收敛可能无法解释深度学习中的泛化性（Uniform convergence maybe unable to explain generalization in deep learning）

【NeurIPS2019|杰出新方向论文奖】统一收敛可能无法解释深度学习中的泛化性（Uniform convergence maybe unable to explain generalization in deep learning）

专知会员服务

13+阅读 · 2019年12月9日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

专知

16+阅读 · 2022年10月22日

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

专知

131+阅读 · 2022年4月4日

元强化学习迎来一盆冷水：不比元Q学习好多少

元强化学习迎来一盆冷水：不比元Q学习好多少

AI科技评论

12+阅读 · 2020年2月27日

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知

42+阅读 · 2019年1月7日

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

专知

32+阅读 · 2018年8月14日

如果你研究多因子模型，这篇文章看不懂就别玩了！

如果你研究多因子模型，这篇文章看不懂就别玩了！

量化投资与机器学习

26+阅读 · 2018年7月31日

放弃 RNN/LSTM 吧，因为真的不好用！望周知~

放弃 RNN/LSTM 吧，因为真的不好用！望周知~

人工智能头条

19+阅读 · 2018年4月24日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

从浅层模型到深度模型：概览机器学习优化算法

从浅层模型到深度模型：概览机器学习优化算法

机器之心

27+阅读 · 2017年7月9日

相关论文

Characterizing Nash Equilibria in Zero-Sum Games: A Physics-Inspired, Parallelizable Approach with a Linear Number of Gradient Queries

Characterizing Nash Equilibria in Zero-Sum Games: A Physics-Inspired, Parallelizable Approach with a Linear Number of Gradient Queries

Arxiv

0+阅读 · 6月16日

On Type Deception in Linear-Quadratic Differential Games

Arxiv

0+阅读 · 6月13日

Zero-Sum Fictitious Play Cannot Converge to a Point

Arxiv

0+阅读 · 6月12日

On the Geometry of Games and their Solvers

Arxiv

0+阅读 · 5月28日

On the Complexity of Correlated Equilibria Beyond Normal-Form Games

Arxiv

0+阅读 · 5月17日

When and Why is Optimistic Multiplicative Weights Slow? The Geometry of Energy Dissipation

Arxiv

0+阅读 · 5月13日

Offline Two-Player Zero-Sum Markov Games with KL Regularization

Arxiv

0+阅读 · 5月13日

Structure from Strategic Interaction & Uncertainty: Risk Sensitive Games for Robust Preference Learning

Arxiv

0+阅读 · 5月12日

Structure from Strategic Interaction & Uncertainty Risk Sensitive Games for Robust Preference Learning

Arxiv

0+阅读 · 5月11日

Fast Strategy Solving for the Informed Player in Two-Player Zero-Sum Linear-Quadratic Differential Games with One-Sided Information

Arxiv

0+阅读 · 5月4日

相关基金

非线性组合优化暑期学校暨学术前沿研讨会

国家自然科学基金

6+阅读 · 2017年6月30日

复杂动态网络上演化博弈的群体策略选择和干预机制研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于非局域性的量子博弈研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

非光滑非凸优化问题的交替线性化算法及其应用

国家自然科学基金

6+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

随机偏微分方程多辛几何算法及不确定性量化

国家自然科学基金

0+阅读 · 2015年12月31日

广义单调（增生）算子的零点逼近与分裂可行问题的正则化研究

国家自然科学基金

0+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员