We study statistical parameter estimation in the setting of data markets. A buyer seeks to estimate a parameter based on samples that can be purchased from competing providers that differ in their data quality and provision costs. When quality is known ex ante, we define a cost-per-information score that summarizes each provider's provision cost per unit of information about the buyer's estimation objective. We describe second-score procurement mechanism that ranks providers by this score, and endogenously chooses both a provider and a sample size while making truthful cost reports optimal. We then turn to the more realistic setting where data quality is private, and can only be indirectly observed via the delivered data. In this setting, we propose a simple mechanism that augments the second-score rule with a lenient ex post statistical test of the reported quality. We prove that under mild conditions, there exists an equilibrium in which sellers report costs truthfully and report quality up to deviations that vanish as the procured sample size grows. Our analysis highlights how the choice of verification test and the buyer's accuracy-cost tradeoff jointly shape participation and misreporting incentives in data markets.


翻译:我们研究了数据市场背景下的统计参数估计问题。买方需要根据可从竞争性供应商处购买的样本来估计参数,这些供应商在数据质量和供应成本上存在差异。当质量事先已知时,我们定义了一个每单位信息成本评分,该评分总结了每个供应商相对于买方估计目标每单位信息的供应成本。我们描述了一种二次评分采购机制,该机制根据此评分对供应商进行排名,并内生地选择供应商和样本量,同时使诚实的成本报告达到最优。随后,我们转向更现实的场景,即数据质量是私有的,只能通过交付的数据间接观察。在此场景中,我们提出了一种简单机制,该机制在二次评分规则基础上增加了针对所报告质量的宽松事后统计检验。我们证明,在温和条件下,存在一个均衡,其中卖方如实报告成本,并报告质量,其偏差随着采购样本量的增加而消失。我们的分析强调了验证测试的选择与买方的精度-成本权衡如何共同塑造数据市场中的参与和虚假报告激励。

0
下载
关闭预览

相关内容

数据质量维度的实践展开:一项综述
专知会员服务
20+阅读 · 2025年7月28日
《数据价值化与数据要素市场发展报告(2024年)》下载
专知会员服务
35+阅读 · 2024年10月6日
数据要素流通典型应用场景案例集(2023)
专知会员服务
49+阅读 · 2023年12月6日
数据要素行业深度报告:新型生产要素,新增长引擎
专知会员服务
35+阅读 · 2023年11月28日
国家标准《物联网 数据质量》(征求意见稿)
专知会员服务
52+阅读 · 2022年9月13日
工信部发布《质量大数据白皮书》,178页pdf
专知会员服务
95+阅读 · 2022年7月12日
【资源推荐】公开数据集收集汇总
专知
19+阅读 · 2019年6月5日
20个安全可靠的免费数据源,各领域数据任你挑
机器学习算法与Python学习
14+阅读 · 2019年5月9日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
不要担心没数据!史上最全数据集网站汇总
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月3日
Arxiv
0+阅读 · 3月5日
VIP会员
最新内容
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
7+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
4+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员