This paper addresses the problem of designing efficient no-swap regret algorithms for combinatorial bandits, where the number of actions $N$ is exponentially large in the dimensionality of the problem. In this setting, designing efficient no-swap regret translates to sublinear -- in horizon $T$ -- swap regret with polylogarithmic dependence on $N$. In contrast to the weaker notion of external regret minimization - a problem which is fairly well understood in the literature - achieving no-swap regret with a polylogarithmic dependence on $N$ has remained elusive in combinatorial bandits. Our paper resolves this challenge, by introducing a no-swap-regret learning algorithm with regret that scales polylogarithmically in $N$ and is tight for the class of combinatorial bandits. To ground our results, we also demonstrate how to implement the proposed algorithm efficiently -- that is, with a per-iteration complexity that also scales polylogarithmically in $N$ -- across a wide range of well-studied applications.


翻译:本文研究了组合多臂老虎机中高效无交换遗憾算法的设计问题,其中动作数量$N$相对于问题维度呈指数级增长。在此设定下,设计高效无交换遗憾算法意味着实现与时间范围$T$呈次线性关系、且对$N$具有多对数依赖性的交换遗憾。相较于文献中已有较深入研究的较弱概念——外部遗憾最小化问题,在组合多臂老虎机中实现具有多对数$N$依赖性的无交换遗憾始终是未解决的难题。本文通过提出一种遗憾对$N$呈多对数缩放、且对组合多臂老虎机类别达到紧界的无交换遗憾学习算法,成功解决了这一挑战。为验证结果的实际意义,我们还展示了如何在多种经典应用场景中高效实现该算法——即每次迭代的计算复杂度同样对$N$呈多对数缩放。

0
下载
关闭预览

相关内容

在数学和计算机科学之中,算法(Algorithm)为一个计算的具体步骤,常用于计算、数据处理和自动推理。精确而言,算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。 来自维基百科: 算法
【ICML2024】通过动态可组合多头注意力改进Transformers
专知会员服务
21+阅读 · 2024年5月17日
基于深度强化学习的多无人车系统编队控制
专知会员服务
45+阅读 · 2024年2月23日
深度学习组合优化,30页ppt,阿姆斯特丹Wouter Kool讲授
专知会员服务
27+阅读 · 2021年2月27日
专知会员服务
90+阅读 · 2020年12月11日
常用的模型集成方法介绍:bagging、boosting 、stacking
机器学习中的最优化算法总结
人工智能前沿讲习班
22+阅读 · 2019年3月22日
换个角度看GAN:另一种损失函数
机器之心
16+阅读 · 2019年1月1日
强化学习初探 - 从多臂老虎机问题说起
专知
10+阅读 · 2018年4月3日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月16日
Arxiv
0+阅读 · 1月14日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员