We study an online stochastic matching problem in which an algorithm sequentially matches $U$ users to $K$ arms, aiming to maximize cumulative reward over $T$ rounds under budget constraints. Without structural assumptions, computing the optimal matching is NP-hard, making online learning computationally infeasible. To overcome this barrier, we focus on single-peaked preferences -- a well-established structure in social choice theory, where users' preferences are unimodal with respect to a common order over arms. We devise an efficient algorithm for the offline budgeted matching problem, and leverage it into an efficient online algorithm with a regret of $\tilde O(UKT^{2/3})$. Our approach relies on a novel PQ tree-based order approximation method. If the single-peaked structure is known, we develop an efficient UCB-like algorithm that achieves a regret bound of $\tilde O(U\sqrt{TK})$.


翻译:本文研究一种在线随机匹配问题,其中算法需在$T$轮中将$U$个用户依次匹配至$K$个臂,目标是在预算约束下最大化累积奖励。若无结构假设,计算最优匹配是NP难问题,使得在线学习在计算上不可行。为突破此障碍,我们聚焦于单峰偏好——社会选择理论中一种成熟的结构,其中用户偏好相对于臂的公共序呈单峰形态。我们为离线预算匹配问题设计了一种高效算法,并将其转化为具有$\tilde O(UKT^{2/3})$遗憾界的高效在线算法。我们的方法依赖于一种基于PQ树的新型序逼近技术。若单峰结构已知,我们提出一种类UCB高效算法,其遗憾界可达$\tilde O(U\sqrt{TK})$。

0
下载
关闭预览

相关内容

单峰博士,中国城市科学学会副总规划师,数字城市工程研究中心常务副主任(分管工作),兼任ISO TC268智能城市基础设施分委会成员,IEEE PES智能园区分委会主席。参与制定了十余项与智慧城市相关的国际标准和国家标准;先后参与和主持国家科技支撑计划项目“智慧城市”专项,科技部重点专项智慧城市是指对智慧城市关键技术的研究认证指标的构建与评价,具有独立性,可控高精度CIM的CIM开放应用集成平台开发与应用示范等重大科研项目;发表论文、专著十余篇;主持和参与城市总体规划、战略规划、城市设计等各类工程项目50余项。;部颁优秀城市规划设计奖,获省部级科技进步奖1次,获2020年中国智慧城市领军人物。
多样化偏好优化
专知会员服务
12+阅读 · 2025年2月3日
【ETHZ博士论文】分布不确定性下的决策,234页pdf
专知会员服务
49+阅读 · 2024年4月5日
多因素问题分析时,如何确立各因素权重?
人人都是产品经理
75+阅读 · 2020年3月4日
标签间相关性在多标签分类问题中的应用
人工智能前沿讲习班
23+阅读 · 2019年6月5日
【边缘计算】边缘计算面临的问题
产业智能官
17+阅读 · 2019年5月31日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月17日
Arxiv
0+阅读 · 2月16日
Arxiv
0+阅读 · 2月7日
Arxiv
0+阅读 · 1月27日
VIP会员
相关VIP内容
多样化偏好优化
专知会员服务
12+阅读 · 2025年2月3日
【ETHZ博士论文】分布不确定性下的决策,234页pdf
专知会员服务
49+阅读 · 2024年4月5日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员