Information that is of relevance for decision-making is often distributed, and held by self-interested agents. Decision markets are well-suited mechanisms to elicit such information and aggregate it into conditional forecasts that can be used for decision-making. However, for incentive-compatible elicitation, decision markets rely on stochastic decision rules which entails that sometimes actions have to be taken that have been predicted to be sub-optimal. In this work, we propose three closely related mechanisms that elicit and aggregate information similar to a decision market, but are incentive compatible despite using a deterministic decision rule. Following ideas from peer prediction mechanisms, proxies rather than observed future outcomes are used to score predictions. The first mechanism requires the principal to have her own signal, which is then used as a proxy to elicit information from a group of self-interested agents. The principal then deterministically maps the aggregated forecasts and the proxy to the best possible decision. The second and third mechanisms expand the first to cover a scenario where the principal does not have access to her own signal. The principal offers a partial profit to align the interest of one agent and retrieve its signal as a proxy; or alternatively uses a proper peer prediction mechanism to elicit signals from two agents. Aggregation and decision-making then follow the first mechanism. We evaluate our first mechanism using a multi-agent bandit learning system. The result suggests that the mechanism can train agents to achieve a performance similar to a Bayesian inference model with access to all information held by the agents.


翻译:与决策相关的信息通常是分布式的,并由自利的参与者持有。决策市场是能够有效获取此类信息并将其整合为可用于决策的条件预测的机制。然而,为了实现激励兼容的信息获取,决策市场依赖于随机决策规则,这意味着有时必须采取已被预测为次优的行动。在本文中,我们提出了三种密切相关的机制,这些机制能够像决策市场一样获取和聚合信息,但在使用确定性决策规则的情况下仍能保持激励兼容性。遵循同行预测机制的思想,我们采用代理变量而非观察到的未来结果来对预测进行评分。第一个机制要求委托方拥有自己的信号,该信号随后被用作代理变量,以从一组自利参与者那里获取信息。然后,委托方根据聚合的预测和代理变量确定性地做出最佳决策。第二个和第三个机制将第一个机制扩展到委托方无法获取自身信号的情景。委托方提供部分利润以对齐某个参与者的利益,并获取其信号作为代理变量;或者,委托方使用适当的同行预测机制从两个参与者那里获取信号。聚合和决策过程随后遵循第一个机制。我们使用多智能体老虎机学习系统对第一个机制进行了评估。结果表明,该机制能够训练智能体达到与能够访问所有参与者信息的贝叶斯推理模型相似的性能。

0
下载
关闭预览

相关内容

《计算机信息》杂志发表高质量的论文,扩大了运筹学和计算的范围,寻求有关理论、方法、实验、系统和应用方面的原创研究论文、新颖的调查和教程论文,以及描述新的和有用的软件工具的论文。官网链接:https://pubsonline.informs.org/journal/ijoc
【2023博士论文】《游戏和强化学习》北卡州立大学
专知会员服务
98+阅读 · 2023年1月27日
【伯克利Lydia Liu博士论文】机器学习与决策的社会动力学
【MIT】硬负样本的对比学习
专知会员服务
40+阅读 · 2020年10月14日
【KDD2020】TAdaNet: 用于图增强元学习的任务自适应网络
专知会员服务
18+阅读 · 2020年9月21日
让AI做决策,我们的社会准备好了吗?
学术头条
0+阅读 · 2022年6月6日
【新书】分布式强化学习,280页pdf
专知
24+阅读 · 2021年12月19日
LASSO回归与XGBoost:融合模型预测房价
论智
32+阅读 · 2018年8月8日
使用随机森林分类器预测森林火灾规模
论智
13+阅读 · 2018年5月15日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年5月6日
Arxiv
15+阅读 · 2021年12月22日
VIP会员
最新内容
超越网格:作战环境对炮兵的影响
专知会员服务
1+阅读 · 今天15:35
KDD 2026 | MixRAGRec:面向LLM推荐的混合专家KG-RAG框架
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
4+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
4+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
14+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
8+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员