Online Generalized-mean Welfare Maximization: Achieving Near-Optimal Regret from Samples - 专知论文

会员服务 ·

0

在线 · 样本 · 算法 · 均值 · 最优 ·

Online Generalized-mean Welfare Maximization: Achieving Near-Optimal Regret from Samples

翻译：在线广义均值福利最大化：从样本中实现近乎最优的遗憾

Zongjun Yang,Rachitesh Kumar,Christian Kroer

We study online fair allocation of $T$ sequentially arriving items among $n$ agents with heterogeneous preferences, with the objective of maximizing generalized-mean welfare, defined as the $p$-mean of agents' time-averaged utilities, with $p\in (-\infty, 1)$. We first consider the i.i.d. arrival model and show that the pure greedy algorithm -- which myopically chooses the welfare-maximizing integral allocation -- achieves $\widetilde{O}(1/T)$ average regret. Importantly, in contrast to prior work, our algorithm does not require distributional knowledge and achieves the optimal regret rate using only the online samples. We then go beyond i.i.d. arrivals and investigate a nonstationary model with time-varying independent distributions. In the absence of additional data about the distributions, it is known that every online algorithm must suffer $Ω(1)$ average regret. We show that only a single historical sample from each distribution is sufficient to recover the optimal $\widetilde{O}(1/T)$ average regret rate, even in the face of arbitrary non-stationarity. Our algorithms are based on the re-solving paradigm: they assume that the remaining items will be the ones seen historically in those periods and solve the resulting welfare-maximization problem to determine the decision in every period. Finally, we also account for distribution shifts that may distort the fidelity of historical samples and show that the performance of our re-solving algorithms is robust to such shifts.

翻译：我们研究在具有异质偏好的 $n$ 个智能体之间在线公平分配 $T$ 个顺序到达的物品，目标是最大化广义均值福利，其定义为智能体时间平均效用的 $p$ 均值，其中 $p\in (-\infty, 1)$。我们首先考虑独立同分布到达模型，并证明纯贪心算法——该算法短视地选择福利最大化的整数分配——能够实现 $\widetilde{O}(1/T)$ 的平均遗憾。重要的是，与先前工作相比，我们的算法不需要分布知识，仅利用在线样本即可达到最优遗憾率。随后，我们超越独立同分布到达，研究了一个具有时变独立分布的非平稳模型。在缺乏关于分布的额外数据的情况下，已知任何在线算法都必须承受 $Ω(1)$ 的平均遗憾。我们证明，即使面对任意的非平稳性，每个分布仅需一个历史样本就足以恢复最优的 $\widetilde{O}(1/T)$ 平均遗憾率。我们的算法基于重求解范式：它们假设剩余物品将是那些时期历史上观察到的物品，并通过求解由此产生的福利最大化问题来确定每个时期的决策。最后，我们还考虑了可能扭曲历史样本保真度的分布偏移，并证明了我们的重求解算法对此类偏移具有鲁棒性。

0

相关内容

随机网络效用最大化在战略排队系统中的博弈论方法

随机网络效用最大化在战略排队系统中的博弈论方法

专知会员服务

7+阅读 · 4月13日

多样化偏好优化

多样化偏好优化

专知会员服务

12+阅读 · 2025年2月3日

ICLR 2024 | 近似最优的最大损失函数量子优化算法

ICLR 2024 | 近似最优的最大损失函数量子优化算法

专知会员服务

21+阅读 · 2024年2月23日

【剑桥大学博士论文】不完全信息下均衡分配：新的设置与技术，237页pdf

【剑桥大学博士论文】不完全信息下均衡分配：新的设置与技术，237页pdf

专知会员服务

30+阅读 · 2023年11月2日

【ICLR 2022】《多Agent控制的遗憾最小化方法》谷歌、普林斯顿大学

【ICLR 2022】《多Agent控制的遗憾最小化方法》谷歌、普林斯顿大学

专知会员服务

19+阅读 · 2022年6月16日

【CMU-Xinying Chen博士论文】优化与人工智能中的公平方法，

【CMU-Xinying Chen博士论文】优化与人工智能中的公平方法，

专知会员服务

26+阅读 · 2022年5月6日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

分布外泛化(Out-Of-Distribution Generalization) 综述论文，22页pdf240篇文献

专知会员服务

64+阅读 · 2021年9月2日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

【ACM MM 2019 】MMGCN：用于微视频个性化推荐的多模图卷积网络（MMGCN：Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video）

【ACM MM 2019 】MMGCN：用于微视频个性化推荐的多模图卷积网络（MMGCN：Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video）

专知会员服务

57+阅读 · 2019年11月20日

强化学习《奖励函数设计: Reward Shaping》详细解读

强化学习《奖励函数设计: Reward Shaping》详细解读

深度强化学习实验室

19+阅读 · 2020年9月1日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

详解ORB-SLAM2中的特征均匀提取策略

详解ORB-SLAM2中的特征均匀提取策略

计算机视觉life

11+阅读 · 2019年10月9日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

小样本学习（Few-shot Learning）综述

小样本学习（Few-shot Learning）综述

机器之心

18+阅读 · 2019年4月1日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

【伯克利博士论文】最优化无所不在-凸优化、组合优化与经济学（附256页全文下载）

【伯克利博士论文】最优化无所不在-凸优化、组合优化与经济学（附256页全文下载）

专知

16+阅读 · 2018年12月26日

用于目标定位的全局平均池化

用于目标定位的全局平均池化

论智

22+阅读 · 2018年8月18日

【论文推荐】最新六篇目标跟踪相关论文—双重Siamese网络、判别性相关滤波、多目标跟踪、深度多尺度时空判别性、综述、显著性增强

【论文推荐】最新六篇目标跟踪相关论文—双重Siamese网络、判别性相关滤波、多目标跟踪、深度多尺度时空判别性、综述、显著性增强

专知

34+阅读 · 2018年2月27日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

最小化加权完工时间和的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

最大化接收工件总利益的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

具有服务等级的平行机在线排序问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

在线服务信誉可比较性及其保障机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

若干广义Nash均衡问题的非线性分析方法和应用

国家自然科学基金

0+阅读 · 2014年12月31日

Regularized Online RLHF with Generalized Bilinear Preferences

Arxiv

0+阅读 · 2月26日

Maximin Share Guarantees via Limited Cost-Sensitive Sharing

Arxiv

0+阅读 · 2月25日

Maximizing Nash Social Welfare in 2-Value Instances: Delineating Tractability

Arxiv

0+阅读 · 2月20日

Simultaneous Ordinal Maximin Share and Envy-Based Guarantees

Arxiv

0+阅读 · 2月17日

Truthful Fair Division under Stochastic Valuations

Arxiv

0+阅读 · 2月12日

On the Fairness of Normalized p-Means for Allocating Goods and Chores

Arxiv

0+阅读 · 2月12日

From Average Sensitivity to Small-Loss Regret Bounds under Random-Order Model

Arxiv

0+阅读 · 2月10日

Maximin Relative Improvement: Fair Learning as a Bargaining Problem

Arxiv

0+阅读 · 2月4日

Expected Cost of Greedy Online Facility Assignment on Regular Polygons (v3)

Arxiv

0+阅读 · 1月31日

Optimal Transport under Group Fairness Constraints

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

9+阅读 · 4月18日

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

9+阅读 · 4月18日

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

专知会员服务

8+阅读 · 4月18日

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

专知会员服务

14+阅读 · 4月18日

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

专知会员服务

7+阅读 · 4月18日

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

专知会员服务

9+阅读 · 4月18日

人工智能在战场行动中的演进及伊朗案例

人工智能在战场行动中的演进及伊朗案例

专知会员服务

7+阅读 · 4月18日

美AI公司Anthropic推出网络安全模型“Mythos”

美AI公司Anthropic推出网络安全模型“Mythos”

专知会员服务

4+阅读 · 4月18日

【博士论文】面向城市环境的可解释计算机视觉

【博士论文】面向城市环境的可解释计算机视觉

专知会员服务

5+阅读 · 4月18日

【CVPR2026】SEATrack：一种简明、高效且具备自适应能力的多模态跟踪器

【CVPR2026】SEATrack：一种简明、高效且具备自适应能力的多模态跟踪器

专知会员服务

4+阅读 · 4月18日

大语言模型的自改进机制：技术综述与未来展望

大语言模型的自改进机制：技术综述与未来展望

专知会员服务

7+阅读 · 4月18日

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

专知会员服务

11+阅读 · 4月18日

《分布式军事人工智能理论：部分可观测与通信条件下的协调约束多智能体强化学习》

《分布式军事人工智能理论：部分可观测与通信条件下的协调约束多智能体强化学习》

专知会员服务

11+阅读 · 4月18日

《第四代军事特种作战部队选拔与评估》

《第四代军事特种作战部队选拔与评估》

专知会员服务

3+阅读 · 4月18日

《迈向可解释强化学习及面向战略决策的定制化学习基准》（70页）

《迈向可解释强化学习及面向战略决策的定制化学习基准》（70页）

专知会员服务

6+阅读 · 4月18日

相关VIP内容

随机网络效用最大化在战略排队系统中的博弈论方法

随机网络效用最大化在战略排队系统中的博弈论方法

专知会员服务

7+阅读 · 4月13日

多样化偏好优化

多样化偏好优化

专知会员服务

12+阅读 · 2025年2月3日

ICLR 2024 | 近似最优的最大损失函数量子优化算法

ICLR 2024 | 近似最优的最大损失函数量子优化算法

专知会员服务

21+阅读 · 2024年2月23日

【剑桥大学博士论文】不完全信息下均衡分配：新的设置与技术，237页pdf

【剑桥大学博士论文】不完全信息下均衡分配：新的设置与技术，237页pdf

专知会员服务

30+阅读 · 2023年11月2日

【ICLR 2022】《多Agent控制的遗憾最小化方法》谷歌、普林斯顿大学

【ICLR 2022】《多Agent控制的遗憾最小化方法》谷歌、普林斯顿大学

专知会员服务

19+阅读 · 2022年6月16日

【CMU-Xinying Chen博士论文】优化与人工智能中的公平方法，

【CMU-Xinying Chen博士论文】优化与人工智能中的公平方法，

专知会员服务

26+阅读 · 2022年5月6日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

分布外泛化(Out-Of-Distribution Generalization) 综述论文，22页pdf240篇文献

专知会员服务

64+阅读 · 2021年9月2日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

【ACM MM 2019 】MMGCN：用于微视频个性化推荐的多模图卷积网络（MMGCN：Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video）

【ACM MM 2019 】MMGCN：用于微视频个性化推荐的多模图卷积网络（MMGCN：Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video）

专知会员服务

57+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《利用大语言模型增强多域作战兵棋推演》（报告）

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

相关资讯

强化学习《奖励函数设计: Reward Shaping》详细解读

强化学习《奖励函数设计: Reward Shaping》详细解读

深度强化学习实验室

19+阅读 · 2020年9月1日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

详解ORB-SLAM2中的特征均匀提取策略

详解ORB-SLAM2中的特征均匀提取策略

计算机视觉life

11+阅读 · 2019年10月9日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

小样本学习（Few-shot Learning）综述

小样本学习（Few-shot Learning）综述

机器之心

18+阅读 · 2019年4月1日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

【伯克利博士论文】最优化无所不在-凸优化、组合优化与经济学（附256页全文下载）

【伯克利博士论文】最优化无所不在-凸优化、组合优化与经济学（附256页全文下载）

专知

16+阅读 · 2018年12月26日

用于目标定位的全局平均池化

用于目标定位的全局平均池化

论智

22+阅读 · 2018年8月18日

【论文推荐】最新六篇目标跟踪相关论文—双重Siamese网络、判别性相关滤波、多目标跟踪、深度多尺度时空判别性、综述、显著性增强

【论文推荐】最新六篇目标跟踪相关论文—双重Siamese网络、判别性相关滤波、多目标跟踪、深度多尺度时空判别性、综述、显著性增强

专知

34+阅读 · 2018年2月27日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

相关论文

Regularized Online RLHF with Generalized Bilinear Preferences

Arxiv

0+阅读 · 2月26日

Maximin Share Guarantees via Limited Cost-Sensitive Sharing

Arxiv

0+阅读 · 2月25日

Maximizing Nash Social Welfare in 2-Value Instances: Delineating Tractability

Arxiv

0+阅读 · 2月20日

Simultaneous Ordinal Maximin Share and Envy-Based Guarantees

Arxiv

0+阅读 · 2月17日

Truthful Fair Division under Stochastic Valuations

Arxiv

0+阅读 · 2月12日

On the Fairness of Normalized p-Means for Allocating Goods and Chores

Arxiv

0+阅读 · 2月12日

From Average Sensitivity to Small-Loss Regret Bounds under Random-Order Model

Arxiv

0+阅读 · 2月10日

Maximin Relative Improvement: Fair Learning as a Bargaining Problem

Arxiv

0+阅读 · 2月4日

Expected Cost of Greedy Online Facility Assignment on Regular Polygons (v3)

Arxiv

0+阅读 · 1月31日

Optimal Transport under Group Fairness Constraints

Arxiv

0+阅读 · 1月30日

相关基金

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

最小化加权完工时间和的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

最大化接收工件总利益的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

具有服务等级的平行机在线排序问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

在线服务信誉可比较性及其保障机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

若干广义Nash均衡问题的非线性分析方法和应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员