We study multi-agent contract design, where a principal incentivizes a team of agents to take costly actions that jointly determine the project success via a combinatorial reward function. While prior work largely focuses on unconstrained contracts that allow heterogeneous payments across agents, many real-world environments limit payment dispersion. Motivated by this, we study equal-pay contracts, where all agents receive identical payments. Our results also extend to nearly-equal-pay contracts where any two payments are identical up to a constant factor. We provide both algorithmic and hardness results across a broad hierarchy of reward functions, under both binary and combinatorial action models. While we focus on equal-pay contracts, our analysis also yields new insights into unconstrained contract design, and resolves two important open problems. On the positive side, we design polynomial-time O(1)-approximation algorithms for (i) submodular rewards under combinatorial actions, and (ii) XOS rewards under binary actions. These guarantees are tight: We rule out the existence of (i) a PTAS for combinatorial actions, even for gross substitutes rewards (unless P = NP), and (ii) any O(1)-approximation for XOS rewards with combinatorial actions. Crucially, our hardness results hold even for unconstrained contracts, thereby settling the corresponding open problems in this setting. Finally, we quantify the loss induced by fairness via the price of equality, defined as the worst-case ratio between the optimal principal's utility achievable by unconstrained contracts and that achievable by equal-pay contracts. We obtain a bound of $Θ(\log n/ \log \log n)$, where $n$ is the number of agents. This gap is tight in a strong sense: the upper bound applies even for XOS rewards with combinatorial actions, while the lower bound arises already for additive rewards with binary actions.


翻译:本研究探讨多智能体契约设计问题,其中委托人通过组合奖励函数激励一组智能体采取共同决定项目成功与否的高成本行动。现有研究主要关注允许跨智能体异质支付的未约束契约,而现实环境往往限制支付差异。受此启发,我们研究等酬契约,即所有智能体获得相同报酬。我们的结果还可推广至近似等酬契约——其中任意两个支付报酬在常数因子内保持相同。我们在二元行动与组合行动模型下,针对广泛的奖励函数层次体系,同时给出算法设计与计算复杂性结果。尽管聚焦于等酬契约,我们的分析亦为未约束契约设计提供新见解,并解决了两个重要的开放性问题。在积极成果方面,我们设计了多项式时间O(1)近似算法用于:(i)组合行动下的子模奖励函数;(ii)二元行动下的XOS奖励函数。这些保证具有紧致性:我们排除了(i)组合行动下存在PTAS的可能性(即使针对总替代奖励函数,除非P=NP);(ii)组合行动下XOS奖励函数存在任何O(1)近似的可能性。关键的是,我们的硬度结果对未约束契约同样成立,从而解决了该设定下的相应开放问题。最后,我们通过等酬代价——定义为未约束契约可实现的最优委托人效用与等酬契约可实现效用之间的最坏情况比值——来量化公平性导致的损失。我们得到$Θ(\log n/ \log \log n)$的界,其中$n$为智能体数量。该差距在强意义下是紧致的:上界甚至适用于组合行动下的XOS奖励函数,而下界在二元行动下的可加奖励函数中即已出现。

0
下载
关闭预览

相关内容

多智能体协作机制
专知会员服务
23+阅读 · 4月25日
《在互补战场上进行多场战斗》
专知会员服务
19+阅读 · 2024年1月20日
专知会员服务
34+阅读 · 2021年5月8日
《“边缘计算+”技术白皮书》,82页pdf
专知
11+阅读 · 2022年8月28日
智能合约的形式化验证方法研究综述
专知
16+阅读 · 2021年5月8日
强化学习《奖励函数设计: Reward Shaping》详细解读
深度强化学习实验室
20+阅读 · 2020年9月1日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Arxiv
0+阅读 · 3月2日
Arxiv
0+阅读 · 3月2日
Arxiv
0+阅读 · 2月26日
Arxiv
0+阅读 · 2月12日
Arxiv
0+阅读 · 2月7日
Arxiv
0+阅读 · 2月1日
VIP会员
最新内容
重新思考无人机时代的生存能力
专知会员服务
2+阅读 · 今天7:44
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
2+阅读 · 今天7:28
在人工智能加速决策环境中拓展OODA循环
专知会员服务
3+阅读 · 今天7:18
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
3+阅读 · 今天7:03
综述 | 世界动作模型:少做梦,多行动
专知会员服务
5+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员