No-Regret Bayesian Recommendation to Homogeneous Users - 专知论文

会员服务 ·

0

在线 · 贝叶斯 · 在线推荐 · 轮数 · 同质 ·

No-Regret Bayesian Recommendation to Homogeneous Users

翻译：面向同质化用户的无遗憾贝叶斯推荐方法

Yiding Feng,Wei Tang,Haifeng Xu

from arxiv, Accepted by OR'26, conference version in EC'22

We introduce and study the online Bayesian recommendation problem for a recommender system platform. The platform has the privilege to privately observe a utility-relevant \emph{state} of a product at each round and uses this information to make online recommendations to a stream of myopic users. This paradigm is common in a wide range of scenarios in the current Internet economy. The platform commits to an online recommendation policy that utilizes her information advantage on the product state to persuade self-interested users to follow the recommendation. Since the platform does not know users' preferences or beliefs in advance, we study the platform's online learning problem of designing an adaptive recommendation policy to persuade users while gradually learning users' preferences and beliefs en route. Specifically, we aim to design online learning policies with no \emph{Stackelberg regret} for the platform, i.e., against the optimal benchmark policy in hindsight under the assumption that users will correspondingly adapt their responses to the benchmark policy. Our first result is an online policy that achieves double logarithmic regret dependence on the number of rounds. We also present an information-theoretic lower bound showing that no adaptive online policy can achieve regret with better dependency on the number of rounds. Finally, by formulating the platform's problem as optimizing a linear program with membership oracle access, we present our second online recommendation policy that achieves regret with polynomial dependence on the number of states but logarithmic dependence on the number of rounds.

翻译：我们提出并研究了推荐系统平台中的在线贝叶斯推荐问题。平台每轮可私密观测到产品关于效用的\textit{状态}信息，并利用该信息向一系列短视用户进行在线推荐。这一范式广泛存在于当前互联网经济的多种场景中。平台承诺采用在线推荐策略，利用其在产品状态上的信息优势，说服自利型用户采纳推荐。由于平台事先不了解用户的偏好或信念，我们研究了平台如何设计自适应性推荐策略，在逐步学习用户偏好与信念的同时说服用户。具体而言，我们旨在为平台设计具有\textit{Stackelberg无遗憾}的在线学习策略，即在反向假设用户会相应调整对基准策略响应的前提下，与事后最优基准策略相比的遗憾。我们的第一项成果是提出一种在线策略，其遗憾值关于轮数呈双对数依赖关系。我们还给出了信息论下界，证明任何自适应在线策略都无法在轮数依赖关系上实现更优的遗憾。最后，通过将平台问题形式化为具有成员查询接口的线性规划优化，我们提出了第二种在线推荐策略，其遗憾值关于状态数呈多项式依赖，但关于轮数呈对数依赖。

0

相关内容

【NTU博士论文】面向可信赖的推荐系统：构建可解释且无偏的推荐系统

【NTU博士论文】面向可信赖的推荐系统：构建可解释且无偏的推荐系统

专知会员服务

18+阅读 · 2024年10月16日

【阿姆斯特丹博士论文】从有偏见的用户互动中学习推荐系统，127页pdf

【阿姆斯特丹博士论文】从有偏见的用户互动中学习推荐系统，127页pdf

专知会员服务

24+阅读 · 2024年2月4日

推荐如何用多模态信息？南洋理工最新《多模态推荐系统》综述，33页pdf阐述多模态推荐系统的分类、评价和未来方向

推荐如何用多模态信息？南洋理工最新《多模态推荐系统》综述，33页pdf阐述多模态推荐系统的分类、评价和未来方向

专知会员服务

49+阅读 · 2023年2月13日

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

专知会员服务

20+阅读 · 2022年2月25日

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

专知会员服务

52+阅读 · 2021年1月11日

不可错过！MASON最新《贝叶斯推断与决策理论》课程，附PPT下载

不可错过！MASON最新《贝叶斯推断与决策理论》课程，附PPT下载

专知会员服务

34+阅读 · 2020年12月25日

【上海交通大学王鸿伟博士论文】基于网络特征学习的个性化推荐系统

【上海交通大学王鸿伟博士论文】基于网络特征学习的个性化推荐系统

专知会员服务

40+阅读 · 2020年12月11日

个性化推荐系统技术进展

个性化推荐系统技术进展

专知会员服务

66+阅读 · 2020年8月15日

【干货书】实战推荐系统，Practical Recommender Systems，432页pdf

【干货书】实战推荐系统，Practical Recommender Systems，432页pdf

专知会员服务

181+阅读 · 2020年4月17日

【NLPCC2019 Tutorial】个性化推荐的基础与趋势（Foundations and Trends for Personalized Recommendation）附145页ppt，清华大学张敏老师

【NLPCC2019 Tutorial】个性化推荐的基础与趋势（Foundations and Trends for Personalized Recommendation）附145页ppt，清华大学张敏老师

专知会员服务

68+阅读 · 2019年11月22日

最全推荐系统Embedding召回算法总结

最全推荐系统Embedding召回算法总结

凡人机器学习

30+阅读 · 2020年7月5日

推荐系统丨完整的架构设计和算法（协同过滤、隐语义）

推荐系统丨完整的架构设计和算法（协同过滤、隐语义）

架构文摘

16+阅读 · 2019年9月9日

推荐系统（一）：推荐系统基础

推荐系统（一）：推荐系统基础

菜鸟的机器学习

25+阅读 · 2019年9月2日

新书推荐《推荐系统进展：方法与技术》

新书推荐《推荐系统进展：方法与技术》

LibRec智能推荐

13+阅读 · 2019年3月18日

微软重磅开源Recommenders：企业级可扩展推荐系统实践指南

微软重磅开源Recommenders：企业级可扩展推荐系统实践指南

AI前线

46+阅读 · 2019年2月25日

推荐系统

炼数成金订阅号

28+阅读 · 2019年1月17日

推荐系统概述

推荐系统概述

Linux爱好者

20+阅读 · 2018年9月6日

【论文推荐】最新七篇推荐系统相关论文—协同度量学习、SQL-Rank、用户行为与神经网络、隐私价格、贝叶斯、 IoT、序列感知

【论文推荐】最新七篇推荐系统相关论文—协同度量学习、SQL-Rank、用户行为与神经网络、隐私价格、贝叶斯、 IoT、序列感知

专知

10+阅读 · 2018年3月9日

【推荐系统】深度解析京东个性化推荐系统演进史

【推荐系统】深度解析京东个性化推荐系统演进史

产业智能官

23+阅读 · 2017年12月8日

【机器学习】【推荐系统】做推荐系统之前，希望有人告诉我这些

【机器学习】【推荐系统】做推荐系统之前，希望有人告诉我这些

产业智能官

11+阅读 · 2017年10月14日

贝叶斯网分解理论及其应用

国家自然科学基金

16+阅读 · 2017年12月31日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于在线消费者购买意向挖掘的个性化推荐研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非对称群体兴趣相关性并融合情境与群体信任的Web服务推荐研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于社交媒体地理大数据的可感知情境的个性化旅游推荐研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于文本情感和异质网络分析的社会化推荐研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

The Bandit's Blind Spot: The Critical Role of User State Representation in Recommender Systems

Arxiv

0+阅读 · 4月29日

Mirroring Users: Towards Building Preference-aligned User Simulator with User Feedback in Recommendation

Arxiv

0+阅读 · 4月17日

DIAURec: Dual-Intent Space Representation Optimization for Recommendation

Arxiv

0+阅读 · 4月10日

Collaborative User Prompt for Personalized Generative Recommendation

Arxiv

0+阅读 · 3月21日

Meta-Learning for Repeated Bayesian Persuasion

Arxiv

0+阅读 · 3月20日

A Bayesian adaptive enrichment design using aggregate historical data to inform individualized treatment recommendations

Arxiv

0+阅读 · 3月10日

AlphaFree: Recommendation Free from Users, IDs, and GNNs

Arxiv

0+阅读 · 3月3日

Adversarial Query Synthesis via Bayesian Optimization

Arxiv

0+阅读 · 3月2日

Unsupervised Continual Learning for Amortized Bayesian Inference

Arxiv

0+阅读 · 2月26日

Give Users the Wheel: Towards Promptable Recommendation Paradigm

Arxiv

0+阅读 · 2月21日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

3+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

3+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

3+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

3+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

3+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

【NTU博士论文】面向可信赖的推荐系统：构建可解释且无偏的推荐系统

【NTU博士论文】面向可信赖的推荐系统：构建可解释且无偏的推荐系统

专知会员服务

18+阅读 · 2024年10月16日

【阿姆斯特丹博士论文】从有偏见的用户互动中学习推荐系统，127页pdf

【阿姆斯特丹博士论文】从有偏见的用户互动中学习推荐系统，127页pdf

专知会员服务

24+阅读 · 2024年2月4日

推荐如何用多模态信息？南洋理工最新《多模态推荐系统》综述，33页pdf阐述多模态推荐系统的分类、评价和未来方向

推荐如何用多模态信息？南洋理工最新《多模态推荐系统》综述，33页pdf阐述多模态推荐系统的分类、评价和未来方向

专知会员服务

49+阅读 · 2023年2月13日

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

专知会员服务

20+阅读 · 2022年2月25日

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

专知会员服务

52+阅读 · 2021年1月11日

不可错过！MASON最新《贝叶斯推断与决策理论》课程，附PPT下载

不可错过！MASON最新《贝叶斯推断与决策理论》课程，附PPT下载

专知会员服务

34+阅读 · 2020年12月25日

【上海交通大学王鸿伟博士论文】基于网络特征学习的个性化推荐系统

【上海交通大学王鸿伟博士论文】基于网络特征学习的个性化推荐系统

专知会员服务

40+阅读 · 2020年12月11日

个性化推荐系统技术进展

个性化推荐系统技术进展

专知会员服务

66+阅读 · 2020年8月15日

【干货书】实战推荐系统，Practical Recommender Systems，432页pdf

【干货书】实战推荐系统，Practical Recommender Systems，432页pdf

专知会员服务

181+阅读 · 2020年4月17日

【NLPCC2019 Tutorial】个性化推荐的基础与趋势（Foundations and Trends for Personalized Recommendation）附145页ppt，清华大学张敏老师

【NLPCC2019 Tutorial】个性化推荐的基础与趋势（Foundations and Trends for Personalized Recommendation）附145页ppt，清华大学张敏老师

专知会员服务

68+阅读 · 2019年11月22日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

最全推荐系统Embedding召回算法总结

最全推荐系统Embedding召回算法总结

凡人机器学习

30+阅读 · 2020年7月5日

推荐系统丨完整的架构设计和算法（协同过滤、隐语义）

推荐系统丨完整的架构设计和算法（协同过滤、隐语义）

架构文摘

16+阅读 · 2019年9月9日

推荐系统（一）：推荐系统基础

推荐系统（一）：推荐系统基础

菜鸟的机器学习

25+阅读 · 2019年9月2日

新书推荐《推荐系统进展：方法与技术》

新书推荐《推荐系统进展：方法与技术》

LibRec智能推荐

13+阅读 · 2019年3月18日

微软重磅开源Recommenders：企业级可扩展推荐系统实践指南

微软重磅开源Recommenders：企业级可扩展推荐系统实践指南

AI前线

46+阅读 · 2019年2月25日

推荐系统

炼数成金订阅号

28+阅读 · 2019年1月17日

推荐系统概述

推荐系统概述

Linux爱好者

20+阅读 · 2018年9月6日

【论文推荐】最新七篇推荐系统相关论文—协同度量学习、SQL-Rank、用户行为与神经网络、隐私价格、贝叶斯、 IoT、序列感知

【论文推荐】最新七篇推荐系统相关论文—协同度量学习、SQL-Rank、用户行为与神经网络、隐私价格、贝叶斯、 IoT、序列感知

专知

10+阅读 · 2018年3月9日

【推荐系统】深度解析京东个性化推荐系统演进史

【推荐系统】深度解析京东个性化推荐系统演进史

产业智能官

23+阅读 · 2017年12月8日

【机器学习】【推荐系统】做推荐系统之前，希望有人告诉我这些

【机器学习】【推荐系统】做推荐系统之前，希望有人告诉我这些

产业智能官

11+阅读 · 2017年10月14日

相关论文

The Bandit's Blind Spot: The Critical Role of User State Representation in Recommender Systems

Arxiv

0+阅读 · 4月29日

Mirroring Users: Towards Building Preference-aligned User Simulator with User Feedback in Recommendation

Arxiv

0+阅读 · 4月17日

DIAURec: Dual-Intent Space Representation Optimization for Recommendation

Arxiv

0+阅读 · 4月10日

Collaborative User Prompt for Personalized Generative Recommendation

Arxiv

0+阅读 · 3月21日

Meta-Learning for Repeated Bayesian Persuasion

Arxiv

0+阅读 · 3月20日

A Bayesian adaptive enrichment design using aggregate historical data to inform individualized treatment recommendations

Arxiv

0+阅读 · 3月10日

AlphaFree: Recommendation Free from Users, IDs, and GNNs

Arxiv

0+阅读 · 3月3日

Adversarial Query Synthesis via Bayesian Optimization

Arxiv

0+阅读 · 3月2日

Unsupervised Continual Learning for Amortized Bayesian Inference

Arxiv

0+阅读 · 2月26日

Give Users the Wheel: Towards Promptable Recommendation Paradigm

Arxiv

0+阅读 · 2月21日

相关基金

贝叶斯网分解理论及其应用

国家自然科学基金

16+阅读 · 2017年12月31日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于在线消费者购买意向挖掘的个性化推荐研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非对称群体兴趣相关性并融合情境与群体信任的Web服务推荐研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于社交媒体地理大数据的可感知情境的个性化旅游推荐研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于文本情感和异质网络分析的社会化推荐研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员