Stochastic high dimensional bandit problems with low dimensional structure are useful in different applications such as online advertising and drug discovery. In this work, we propose a simple unified algorithm for such problems and present a general analysis framework for the regret upper bound of our algorithm. We show that under some mild unified assumptions, our algorithm can be applied to different high dimensional bandit problems. Our framework utilizes the low dimensional structure to guide the parameter estimation in the problem, therefore our algorithm achieves the best regret bounds in the LASSO bandit, better bounds in the low-rank matrix bandit and the group sparse matrix bandit, as well as a novel bound in the multi-agent LASSO bandit.


翻译:低维结构的高维土匪问题在诸如在线广告和药物发现等不同应用中非常有用。 在这项工作中,我们建议为这类问题提供一个简单的统一算法,并为我们的算法的末端提出一个总体分析框架。我们表明,根据一些温和的统一假设,我们的算法可以适用于不同的高维土匪问题。我们的框架利用低维结构来指导问题中的参数估计,因此我们的算法在LASSO土匪中达到了最好的遗憾界限,在低级矩阵土匪和群体稀少的矩阵土匪中得到了更好的界限,并在多试剂LASSO土匪中得到了新的界限。

0
下载
关闭预览

相关内容

强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
已删除
将门创投
5+阅读 · 2018年7月25日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Arxiv
3+阅读 · 2017年12月14日
VIP会员
最新内容
乌克兰前线的五项创新
专知会员服务
1+阅读 · 32分钟前
 军事通信系统与设备的技术演进综述
专知会员服务
1+阅读 · 47分钟前
《北约标准:医疗评估手册》174页
专知会员服务
1+阅读 · 55分钟前
《提升生成模型的安全性与保障》博士论文
专知会员服务
0+阅读 · 59分钟前
美国当前高超音速导弹发展概述
专知会员服务
4+阅读 · 4月19日
无人机蜂群建模与仿真方法
专知会员服务
8+阅读 · 4月19日
澳大利亚发布《国防战略(2026年)》
专知会员服务
4+阅读 · 4月19日
全球高超音速武器最新发展趋势
专知会员服务
3+阅读 · 4月19日
相关VIP内容
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
Top
微信扫码咨询专知VIP会员