Improved Algorithms for Nash Welfare in Linear Bandits - 专知论文

会员服务 ·

0

赌博机 · 算法 · 均值 · 性能指标 · 多臂赌博机 ·

Improved Algorithms for Nash Welfare in Linear Bandits

翻译：线性赌博机中纳什福利的改进算法

Dhruv Sarkar,Nishant Pandey,Sayak Ray Chowdhury

Nash regret has recently emerged as a principled fairness-aware performance metric for stochastic multi-armed bandits, motivated by the Nash Social Welfare objective. Although this notion has been extended to linear bandits, existing results suffer from suboptimality in ambient dimension $d$, stemming from proof techniques that rely on restrictive concentration inequalities. In this work, we resolve this open problem by introducing new analytical tools that yield an order-optimal Nash regret bound in linear bandits. Beyond Nash regret, we initiate the study of $p$-means regret in linear bandits, a unifying framework that interpolates between fairness and utility objectives and strictly generalizes Nash regret. We propose a generic algorithmic framework, FairLinBandit, that works as a meta-algorithm on top of any linear bandit strategy. We instantiate this framework using two bandit algorithms: Phased Elimination and Upper Confidence Bound, and prove that both achieve sublinear $p$-means regret for the entire range of $p$. Extensive experiments on linear bandit instances generated from real-world datasets demonstrate that our methods consistently outperform the existing state-of-the-art baseline.

翻译：纳什遗憾最近作为一种原则性的公平感知性能指标，在随机多臂赌博机领域兴起，其动机源于纳什社会福利目标。尽管这一概念已被推广至线性赌博机，但现有结果在环境维度$d$上存在次优性，这源于依赖限制性集中不等式的证明技术。在本工作中，我们通过引入新的分析工具解决了这一开放性问题，得到了线性赌博机中阶次最优的纳什遗憾界。除纳什遗憾外，我们首次研究了线性赌博机中的$p$-均值遗憾，这是一个在公平性与效用目标之间插值并严格推广纳什遗憾的统一框架。我们提出了一个通用算法框架FairLinBandit，该框架可作为元算法运行于任意线性赌博机策略之上。我们使用两种赌博机算法——阶段消除法与置信上界法——对该框架进行了实例化，并证明两者在整个$p$值范围内均能实现次线性的$p$-均值遗憾。基于真实世界数据集生成的线性赌博机实例上的大量实验表明，我们的方法始终优于现有的最先进基线。

0

相关内容

赌博机

【ETHZ博士论文】算法补救的进展：确保因果一致性、公平性和鲁棒性，233页pdf

【ETHZ博士论文】算法补救的进展：确保因果一致性、公平性和鲁棒性，233页pdf

专知会员服务

29+阅读 · 2023年11月26日

《资源分配博弈中的收敛率》

《资源分配博弈中的收敛率》

专知会员服务

41+阅读 · 2023年3月10日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

牛津大学教授Michael Bronstein 最新几何深度学习综述：超越 WL 和原始消息传递的 GNN

牛津大学教授Michael Bronstein 最新几何深度学习综述：超越 WL 和原始消息传递的 GNN

专知会员服务

46+阅读 · 2022年3月9日

GNN在几何深度学习有何进展？斯坦福CS224W《几何深度学习》课程报告，DeepMind大牛Petar主讲，附112页ppt

GNN在几何深度学习有何进展？斯坦福CS224W《几何深度学习》课程报告，DeepMind大牛Petar主讲，附112页ppt

专知会员服务

54+阅读 · 2021年12月4日

【NeurIPS2021】去掉softmax后Transformer会更好吗？复旦&华为诺亚提出SOFT：轻松搞定线性近似

【NeurIPS2021】去掉softmax后Transformer会更好吗？复旦&华为诺亚提出SOFT：轻松搞定线性近似

专知会员服务

20+阅读 · 2021年10月26日

万字综述，GNN在NLP中的应用，建议收藏慢慢看

万字综述，GNN在NLP中的应用，建议收藏慢慢看

专知会员服务

59+阅读 · 2021年6月22日

AAAI 2021 | 稀疏胜负多智能体博弈中的纳什均衡解计算

专知会员服务

41+阅读 · 2021年2月12日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

71+阅读 · 2020年1月17日

不得不看！NeurIPS 2019三个关键研究热点趋势：贝叶斯、GNN、凸优化

不得不看！NeurIPS 2019三个关键研究热点趋势：贝叶斯、GNN、凸优化

专知会员服务

58+阅读 · 2019年12月19日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

50+阅读 · 2022年11月16日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

基于 SonarQube 的增量代码扫描

基于 SonarQube 的增量代码扫描

DevOps时代

12+阅读 · 2019年7月18日

Bert最新进展，继续在NLP各领域开花结果！

Bert最新进展，继续在NLP各领域开花结果！

机器学习算法与Python学习

20+阅读 · 2019年6月11日

深入理解BERT Transformer ，不仅仅是注意力机制

深入理解BERT Transformer ，不仅仅是注意力机制

大数据文摘

22+阅读 · 2019年3月19日

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

机器之心

15+阅读 · 2019年2月13日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

量子位

10+阅读 · 2017年12月10日

一类随机Navier-Stokes方程的数值解及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

SPN型分组密码的新型代数分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机偏微分方程多辛几何算法及不确定性量化

国家自然科学基金

0+阅读 · 2015年12月31日

基于马尔科夫链的线性系统求解问题的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态Gr？bner 基与GVW算法

国家自然科学基金

0+阅读 · 2014年12月31日

超线性增长条件下的混杂型随机时滞微分方程

国家自然科学基金

0+阅读 · 2014年12月31日

若干广义Nash均衡问题的非线性分析方法和应用

国家自然科学基金

0+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

随机Helmholtz型问题的数值方法

国家自然科学基金

0+阅读 · 2014年12月31日

Asymmetric Nash Seeking via Best Response Maps: Global Linear Convergence and Robustness to Inexact Reaction Models

Asymmetric Nash Seeking via Best Response Maps: Global Linear Convergence and Robustness to Inexact Reaction Models

Arxiv

0+阅读 · 3月17日

Approximating Competitive Equilibrium by Nash Welfare

Arxiv

0+阅读 · 3月17日

Nash-convergence of Game Dynamics and Complexity

Arxiv

0+阅读 · 2月17日

Linear Bandits beyond Inner Product Spaces, the case of Bandit Optimal Transport

Arxiv

0+阅读 · 2月17日

Blessings of Multiple Good Arms in Multi-Objective Linear Bandits

Arxiv

0+阅读 · 2月13日

Achieving Optimal Static and Dynamic Regret Simultaneously in Bandits with Deterministic Losses

Arxiv

0+阅读 · 2月7日

Online Learning for Uninformed Markov Games: Empirical Nash-Value Regret and Non-Stationarity Adaptation

Arxiv

0+阅读 · 2月6日

Nash Equilibria in Games with Playerwise Concave Coupling Constraints: Existence and Computation

Arxiv

0+阅读 · 2月6日

Learning to Explore with Lagrangians for Bandits under Unknown Linear Constraints

Arxiv

0+阅读 · 2月4日

Stochastic Linear Bandits with Parameter Noise

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

多臂赌博机

最新内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

3+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

3+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

4+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

10+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

6+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

7+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

8+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

11+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

6+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

6+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

8+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

6+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

10+阅读 · 5月29日

相关VIP内容

【ETHZ博士论文】算法补救的进展：确保因果一致性、公平性和鲁棒性，233页pdf

【ETHZ博士论文】算法补救的进展：确保因果一致性、公平性和鲁棒性，233页pdf

专知会员服务

29+阅读 · 2023年11月26日

《资源分配博弈中的收敛率》

《资源分配博弈中的收敛率》

专知会员服务

41+阅读 · 2023年3月10日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

牛津大学教授Michael Bronstein 最新几何深度学习综述：超越 WL 和原始消息传递的 GNN

牛津大学教授Michael Bronstein 最新几何深度学习综述：超越 WL 和原始消息传递的 GNN

专知会员服务

46+阅读 · 2022年3月9日

GNN在几何深度学习有何进展？斯坦福CS224W《几何深度学习》课程报告，DeepMind大牛Petar主讲，附112页ppt

GNN在几何深度学习有何进展？斯坦福CS224W《几何深度学习》课程报告，DeepMind大牛Petar主讲，附112页ppt

专知会员服务

54+阅读 · 2021年12月4日

【NeurIPS2021】去掉softmax后Transformer会更好吗？复旦&华为诺亚提出SOFT：轻松搞定线性近似

【NeurIPS2021】去掉softmax后Transformer会更好吗？复旦&华为诺亚提出SOFT：轻松搞定线性近似

专知会员服务

20+阅读 · 2021年10月26日

万字综述，GNN在NLP中的应用，建议收藏慢慢看

万字综述，GNN在NLP中的应用，建议收藏慢慢看

专知会员服务

59+阅读 · 2021年6月22日

AAAI 2021 | 稀疏胜负多智能体博弈中的纳什均衡解计算

专知会员服务

41+阅读 · 2021年2月12日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

71+阅读 · 2020年1月17日

不得不看！NeurIPS 2019三个关键研究热点趋势：贝叶斯、GNN、凸优化

不得不看！NeurIPS 2019三个关键研究热点趋势：贝叶斯、GNN、凸优化

专知会员服务

58+阅读 · 2019年12月19日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

美以伊战争：首次人工智能战争——军事自主性困境

BES：让语言模型通过双向进化搜索自我改进

以色列-美国-伊朗战争中的无人机：关键要点

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

50+阅读 · 2022年11月16日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

基于 SonarQube 的增量代码扫描

基于 SonarQube 的增量代码扫描

DevOps时代

12+阅读 · 2019年7月18日

Bert最新进展，继续在NLP各领域开花结果！

Bert最新进展，继续在NLP各领域开花结果！

机器学习算法与Python学习

20+阅读 · 2019年6月11日

深入理解BERT Transformer ，不仅仅是注意力机制

深入理解BERT Transformer ，不仅仅是注意力机制

大数据文摘

22+阅读 · 2019年3月19日

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

机器之心

15+阅读 · 2019年2月13日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

量子位

10+阅读 · 2017年12月10日

相关论文

Asymmetric Nash Seeking via Best Response Maps: Global Linear Convergence and Robustness to Inexact Reaction Models

Asymmetric Nash Seeking via Best Response Maps: Global Linear Convergence and Robustness to Inexact Reaction Models

Arxiv

0+阅读 · 3月17日

Approximating Competitive Equilibrium by Nash Welfare

Arxiv

0+阅读 · 3月17日

Nash-convergence of Game Dynamics and Complexity

Arxiv

0+阅读 · 2月17日

Linear Bandits beyond Inner Product Spaces, the case of Bandit Optimal Transport

Arxiv

0+阅读 · 2月17日

Blessings of Multiple Good Arms in Multi-Objective Linear Bandits

Arxiv

0+阅读 · 2月13日

Achieving Optimal Static and Dynamic Regret Simultaneously in Bandits with Deterministic Losses

Arxiv

0+阅读 · 2月7日

Online Learning for Uninformed Markov Games: Empirical Nash-Value Regret and Non-Stationarity Adaptation

Arxiv

0+阅读 · 2月6日

Nash Equilibria in Games with Playerwise Concave Coupling Constraints: Existence and Computation

Arxiv

0+阅读 · 2月6日

Learning to Explore with Lagrangians for Bandits under Unknown Linear Constraints

Arxiv

0+阅读 · 2月4日

Stochastic Linear Bandits with Parameter Noise

Arxiv

0+阅读 · 1月30日

相关基金

一类随机Navier-Stokes方程的数值解及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

SPN型分组密码的新型代数分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机偏微分方程多辛几何算法及不确定性量化

国家自然科学基金

0+阅读 · 2015年12月31日

基于马尔科夫链的线性系统求解问题的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态Gr？bner 基与GVW算法

国家自然科学基金

0+阅读 · 2014年12月31日

超线性增长条件下的混杂型随机时滞微分方程

国家自然科学基金

0+阅读 · 2014年12月31日

若干广义Nash均衡问题的非线性分析方法和应用

国家自然科学基金

0+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

随机Helmholtz型问题的数值方法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员