We study the \emph{Submodular Welfare Problem} (SWP), where items are partitioned among agents with monotone submodular utilities to maximize the total welfare under \emph{bandit feedback}. Classical SWP assumes full value-oracle access, achieving $(1-1/e)$ approximations via continuous-greedy algorithms. We extend this to a \emph{multi-agent combinatorial bandit} framework (\textsc{MA-CMAB}), where actions are partitions under full-bandit feedback with non-communicating agents. Unlike prior single-agent or separable multi-agent CMAB models, our setting couples agents through shared allocation constraints. We propose an explore-then-commit strategy with randomized assignments, achieving $\tilde{\mathcal{O}}(T^{2/3})$ regret against a $(1-1/e)$ benchmark, the first such guarantee for partition-based submodular welfare problem under bandit feedback.


翻译:本研究探讨了《子模福利问题》(SWP),其中物品在具有单调子模效用函数的智能体之间进行分配,以在《老虎机反馈》下最大化总福利。经典的SWP假设完全价值预言机访问,通过连续贪心算法可实现$(1-1/e)$的近似比。我们将此问题扩展至《多智能体组合老虎机》框架(\textsc{MA-CMAB}),其中动作是在完全老虎机反馈下由非通信智能体执行的分配方案。与先前单智能体或可分离多智能体CMAB模型不同,我们的设定通过共享分配约束耦合了智能体。我们提出了一种采用随机分配的探索-利用策略,针对$(1-1/e)$基准实现了$\tilde{\mathcal{O}}(T^{2/3})$的遗憾界,这是基于分配的子模福利问题在老虎机反馈下的首个此类理论保证。

0
下载
关闭预览

相关内容

智能体,顾名思义,就是具有智能的实体,英文名是Agent。
《多智能体大语言模型系统的可靠决策研究》
专知会员服务
32+阅读 · 2月2日
中文版 | 集中式与分布式多智能体AI协调策略
专知会员服务
19+阅读 · 2025年5月8日
多智能体协作机制:大语言模型综述
专知会员服务
67+阅读 · 2025年3月4日
基于多智能体强化学习的协同目标分配
专知会员服务
136+阅读 · 2023年9月5日
多智能体协同决策方法研究
专知会员服务
133+阅读 · 2022年12月15日
面向多智能体博弈对抗的对手建模框架
专知会员服务
162+阅读 · 2022年9月28日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
多智能体强化学习(MARL)近年研究概览
PaperWeekly
38+阅读 · 2020年3月15日
经典书《斯坦福大学-多智能体系统》532页pdf
强化学习初探 - 从多臂老虎机问题说起
专知
10+阅读 · 2018年4月3日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Arxiv
0+阅读 · 1月30日
Arxiv
0+阅读 · 1月30日
VIP会员
相关基金
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员