Optimal Rates for Feasible Payoff Set Estimation in Games - 专知论文

会员服务 ·

0

博弈 · 可行 · 最优 · 均衡 · 近似 ·

Optimal Rates for Feasible Payoff Set Estimation in Games

翻译：博弈中可行收益集估计的最优速率

Annalisa Barbara,Riccardo Poiani,Martino Bernasconi,Andrea Celli

We study a setting in which two players play a (possibly approximate) Nash equilibrium of a bimatrix game, while a learner observes only their actions and has no knowledge of the equilibrium or the underlying game. A natural question is whether the learner can rationalize the observed behavior by inferring the players' payoff functions. Rather than producing a single payoff estimate, inverse game theory aims to identify the entire set of payoffs consistent with observed behavior, enabling downstream use in, e.g., counterfactual analysis and mechanism design across applications like auctions, pricing, and security games. We focus on the problem of estimating the set of feasible payoffs with high probability and up to precision $ε$ on the Hausdorff metric. We provide the first minimax-optimal rates for both exact and approximate equilibrium play, in zero-sum as well as general-sum games. Our results provide learning-theoretic foundations for set-valued payoff inference in multi-agent environments.

翻译：我们研究一种场景：两名玩家进行双矩阵博弈的（可能近似）纳什均衡博弈，而学习者仅能观察其行动，对均衡或底层博弈一无所知。一个自然的问题是，学习者能否通过推断玩家的收益函数来合理化观察到的行为。与生成单一收益估计不同，逆博弈论旨在识别与观察行为一致的全部收益集合，从而支持下游应用，如拍卖、定价和安全博弈等场景中的反事实分析与机制设计。我们重点关注以高概率和豪斯多夫度量精度$ε$估计可行收益集合的问题。我们首次为零和博弈及一般和博弈中的精确与近似均衡博弈提供了极小极大最优速率。我们的研究结果为多智能体环境中集合值收益推断奠定了学习理论基础。

0

相关内容

博弈论精要：基于优化方法的数学导论

博弈论精要：基于优化方法的数学导论

专知会员服务

47+阅读 · 2025年3月30日

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

专知会员服务

141+阅读 · 2024年3月16日

【2023新书】合作博弈论的计算方面，170页pdf

【2023新书】合作博弈论的计算方面，170页pdf

专知会员服务

72+阅读 · 2023年6月29日

《资源分配博弈中的收敛率》

《资源分配博弈中的收敛率》

专知会员服务

41+阅读 · 2023年3月10日

【硬核书】博弈论，592页pdf

【硬核书】博弈论，592页pdf

专知会员服务

165+阅读 · 2022年12月7日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

【CMU博士论文】统计博弈理论，Statistical Game Theory，279页pdf

【CMU博士论文】统计博弈理论，Statistical Game Theory，279页pdf

专知会员服务

79+阅读 · 2022年8月17日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

86+阅读 · 2022年5月6日

印度理工学院《有限观测下目标防御差异博弈的动态网络分析》，23页pdf

印度理工学院《有限观测下目标防御差异博弈的动态网络分析》，23页pdf

专知会员服务

23+阅读 · 2022年4月5日

AAAI 2021 | 稀疏胜负多智能体博弈中的纳什均衡解计算

专知会员服务

41+阅读 · 2021年2月12日

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

专知

16+阅读 · 2022年10月22日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

专知

131+阅读 · 2022年4月4日

万字长文！《博弈论在国防中的应用综述》悉尼大学与澳大利亚国防科技2022最新40页pdf综述论文

万字长文！《博弈论在国防中的应用综述》悉尼大学与澳大利亚国防科技2022最新40页pdf综述论文

专知

26+阅读 · 2022年3月22日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

这是一本好玩的可视化统计概率入门书，66页pdf下载

这是一本好玩的可视化统计概率入门书，66页pdf下载

专知

40+阅读 · 2018年12月30日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

【干货】终极入门马尔可夫网络 (Markov Networks)——概率图模型

【干货】终极入门马尔可夫网络 (Markov Networks)——概率图模型

机器学习研究会

31+阅读 · 2018年1月7日

集成专家意见的在线投资组合策略设计及竞争性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

经济学中均衡的计算及其在排序机制中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

模糊情况下的最优消费与投资

国家自然科学基金

3+阅读 · 2015年12月31日

随机波动率模型下金融衍生产品定价中的条件蒙特卡罗加速方法

国家自然科学基金

1+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

随机递归最优控制及其在金融中的应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于竞争差分析的单向交易策略

国家自然科学基金

0+阅读 · 2014年12月31日

机制转化下的最优停时问题研究---以金融中投资决策分析为例

国家自然科学基金

2+阅读 · 2014年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

Optimal Modified Feedback Strategies in LQ Games under Control Imperfections

Arxiv

0+阅读 · 3月14日

Optimal strategy in the game Risk or Safety

Arxiv

0+阅读 · 3月1日

Efficiently Computing Equilibria in Budget-Aggregation Games

Arxiv

0+阅读 · 2月24日

Learning to Control Unknown Strongly Monotone Games

Arxiv

0+阅读 · 2月24日

The Complexity of Sparse Win-Lose Bimatrix Games

Arxiv

0+阅读 · 2月20日

Computing Equilibria in Games with Stochastic Action Sets

Arxiv

0+阅读 · 2月18日

Nash-convergence of Game Dynamics and Complexity

Arxiv

0+阅读 · 2月17日

Convergence rates of random-order best-response dynamics in public good games on networks

Arxiv

0+阅读 · 2月17日

Equilibria in Large Position-Optimization Games

Arxiv

0+阅读 · 2月16日

Scale-Invariant Fast Convergence in Games

Arxiv

0+阅读 · 2月12日

VIP会员

文章信息

相关主题

最新内容

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

7+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

5+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

4+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

2+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

8+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

4+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

6+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

7+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

7+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

7+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

19+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

10+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

11+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

10+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

14+阅读 · 5月29日

相关VIP内容

博弈论精要：基于优化方法的数学导论

博弈论精要：基于优化方法的数学导论

专知会员服务

47+阅读 · 2025年3月30日

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

专知会员服务

141+阅读 · 2024年3月16日

【2023新书】合作博弈论的计算方面，170页pdf

【2023新书】合作博弈论的计算方面，170页pdf

专知会员服务

72+阅读 · 2023年6月29日

《资源分配博弈中的收敛率》

《资源分配博弈中的收敛率》

专知会员服务

41+阅读 · 2023年3月10日

【硬核书】博弈论，592页pdf

【硬核书】博弈论，592页pdf

专知会员服务

165+阅读 · 2022年12月7日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

【CMU博士论文】统计博弈理论，Statistical Game Theory，279页pdf

【CMU博士论文】统计博弈理论，Statistical Game Theory，279页pdf

专知会员服务

79+阅读 · 2022年8月17日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

86+阅读 · 2022年5月6日

印度理工学院《有限观测下目标防御差异博弈的动态网络分析》，23页pdf

印度理工学院《有限观测下目标防御差异博弈的动态网络分析》，23页pdf

专知会员服务

23+阅读 · 2022年4月5日

AAAI 2021 | 稀疏胜负多智能体博弈中的纳什均衡解计算

专知会员服务

41+阅读 · 2021年2月12日

热门VIP内容

开通专知VIP会员享更多权益服务

比利时发布用于实时战场军事装备识别的离线人工智能系统

超越网格：作战环境对炮兵的影响

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

相关资讯

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

专知

16+阅读 · 2022年10月22日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

专知

131+阅读 · 2022年4月4日

万字长文！《博弈论在国防中的应用综述》悉尼大学与澳大利亚国防科技2022最新40页pdf综述论文

万字长文！《博弈论在国防中的应用综述》悉尼大学与澳大利亚国防科技2022最新40页pdf综述论文

专知

26+阅读 · 2022年3月22日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

这是一本好玩的可视化统计概率入门书，66页pdf下载

这是一本好玩的可视化统计概率入门书，66页pdf下载

专知

40+阅读 · 2018年12月30日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

【干货】终极入门马尔可夫网络 (Markov Networks)——概率图模型

【干货】终极入门马尔可夫网络 (Markov Networks)——概率图模型

机器学习研究会

31+阅读 · 2018年1月7日

相关论文

Optimal Modified Feedback Strategies in LQ Games under Control Imperfections

Arxiv

0+阅读 · 3月14日

Optimal strategy in the game Risk or Safety

Arxiv

0+阅读 · 3月1日

Efficiently Computing Equilibria in Budget-Aggregation Games

Arxiv

0+阅读 · 2月24日

Learning to Control Unknown Strongly Monotone Games

Arxiv

0+阅读 · 2月24日

The Complexity of Sparse Win-Lose Bimatrix Games

Arxiv

0+阅读 · 2月20日

Computing Equilibria in Games with Stochastic Action Sets

Arxiv

0+阅读 · 2月18日

Nash-convergence of Game Dynamics and Complexity

Arxiv

0+阅读 · 2月17日

Convergence rates of random-order best-response dynamics in public good games on networks

Arxiv

0+阅读 · 2月17日

Equilibria in Large Position-Optimization Games

Arxiv

0+阅读 · 2月16日

Scale-Invariant Fast Convergence in Games

Arxiv

0+阅读 · 2月12日

相关基金

集成专家意见的在线投资组合策略设计及竞争性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

经济学中均衡的计算及其在排序机制中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

模糊情况下的最优消费与投资

国家自然科学基金

3+阅读 · 2015年12月31日

随机波动率模型下金融衍生产品定价中的条件蒙特卡罗加速方法

国家自然科学基金

1+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

随机递归最优控制及其在金融中的应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于竞争差分析的单向交易策略

国家自然科学基金

0+阅读 · 2014年12月31日

机制转化下的最优停时问题研究---以金融中投资决策分析为例

国家自然科学基金

2+阅读 · 2014年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员