【WWW2020-中科大-滴滴】层次自适应上下文赌博机的资源约束推荐

2020 年 4 月 3 日 专知


在本文中,我们提出了一种层次自适应上下文强盗方法(HATCH)来进行有预算约束的上下文强盗的策略学习。HATCH采用了一种自适应的方法,根据剩余资源/时间和不同用户上下文之间的报酬分配来分配勘探资源。此外,我们利用丰富的上下文特征信息来寻找最佳的个性化推荐。

https://www.zhuanzhi.ai/paper/5229744bf1a6972ca12240df07e0f236



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“HATC” 就可以获取层次自适应上下文赌博机的资源约束推荐》论文专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

近期必读的五篇KDD 2020【图神经网络 (GNN) 】相关论文_Part2
专知会员服务
161+阅读 · 2020年6月30日
【IJCAI2020】图神经网络预测结构化实体交互
专知会员服务
43+阅读 · 2020年5月13日
近期必读的6篇顶会WWW2020【推荐系统】相关论文-Part3
专知会员服务
58+阅读 · 2020年4月14日
近期必读的5篇顶会WWW2020【推荐系统】相关论文-Part2
专知会员服务
70+阅读 · 2020年4月7日
【WWW2020-UIUC】为新闻故事生成具有代表性的标题
专知会员服务
27+阅读 · 2020年3月18日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
Arxiv
4+阅读 · 2019年12月2日
VIP会员
最新内容
战争机器学习:数据生态系统构建(155页)
专知会员服务
6+阅读 · 今天8:10
内省扩散语言模型
专知会员服务
5+阅读 · 4月14日
国外反无人机系统与技术动态
专知会员服务
3+阅读 · 4月14日
大规模作战行动中的战术作战评估(研究论文)
未来的海战无人自主系统
专知会员服务
3+阅读 · 4月14日
美军多域作战现状分析:战略、概念还是幻想?
无人机与反无人机系统(书籍)
专知会员服务
19+阅读 · 4月14日
美陆军2026条令:安全与机动支援
专知会员服务
9+阅读 · 4月14日
Top
微信扫码咨询专知VIP会员