在本文中,我们提出了一种层次自适应上下文强盗方法(HATCH)来进行有预算约束的上下文强盗的策略学习。HATCH采用了一种自适应的方法,根据剩余资源/时间和不同用户上下文之间的报酬分配来分配勘探资源。此外,我们利用丰富的上下文特征信息来寻找最佳的个性化推荐。

成为VIP会员查看完整内容
21

相关内容

近期必读的五篇KDD 2020【图神经网络 (GNN) 】相关论文_Part2
专知会员服务
161+阅读 · 2020年6月30日
近期必读的6篇顶会WWW2020【推荐系统】相关论文-Part3
专知会员服务
58+阅读 · 2020年4月14日
近期必读的5篇顶会WWW2020【推荐系统】相关论文-Part2
专知会员服务
70+阅读 · 2020年4月7日
专知会员服务
88+阅读 · 2020年1月20日
层级强化学习概念简介
CreateAMind
21+阅读 · 2019年6月9日
论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法
开放知识图谱
30+阅读 · 2019年3月26日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
图上的归纳表示学习
科技创新与创业
23+阅读 · 2017年11月9日
推荐系统杂谈
架构文摘
28+阅读 · 2017年9月15日
Arxiv
30+阅读 · 2019年3月13日
VIP会员
最新内容
《低数据领域军事目标检测模型研究》
专知会员服务
0+阅读 · 14分钟前
【CMU博士论文】物理世界的视觉感知与深度理解
伊朗战争停火期间美军关键弹药状况分析
专知会员服务
8+阅读 · 4月22日
电子战革命:塑造战场的十年突破(2015–2025)
人工智能即服务与未来战争(印度视角)
专知会员服务
4+阅读 · 4月22日
《美国战争部2027财年军事人员预算》
专知会员服务
3+阅读 · 4月22日
伊朗战争中的电子战
专知会员服务
5+阅读 · 4月22日
大语言模型平台在国防情报应用中的对比
专知会员服务
9+阅读 · 4月22日
相关资讯
微信扫码咨询专知VIP会员