Ranking items based on pairwise comparisons is common, from using match outcomes to rank sports teams to using purchase or survey data to rank consumer products. Statistical inference-based methods such as the Bradley-Terry model, which extract rankings based on an underlying generative model, have emerged as flexible and powerful tools to tackle ranking in empirical data. In situations with limited and/or noisy comparisons, it is often challenging to confidently distinguish the performance of different items based on the evidence available in the data. However, most inference-based ranking methods choose to assign each item to a unique rank or score, suggesting a meaningful distinction when there is none. Here, we develop a principled nonparametric Bayesian method, adaptable to any statistical ranking method, for learning partial rankings (rankings with ties) that distinguishes among the ranks of different items only when there is sufficient evidence available in the data. We develop a fast agglomerative algorithm to perform Maximum A Posteriori (MAP) inference of partial rankings under our framework and examine the performance of our method on a variety of real and synthetic network datasets, finding that it frequently gives a more parsimonious summary of the data than traditional ranking, particularly when observations are sparse.


翻译:基于成对比较对项目进行排序是常见的做法,从利用比赛结果对运动队进行排名,到利用购买或调查数据对消费品进行排序。基于统计推断的方法,例如Bradley-Terry模型,它基于一个潜在的生成模型来提取排序,已成为处理经验数据中排序问题的灵活而强大的工具。在比较数据有限和/或存在噪声的情况下,通常难以根据数据中可用的证据来有把握地区分不同项目的性能。然而,大多数基于推断的排序方法选择为每个项目分配一个唯一的排名或分数,这在没有实质性区别时暗示了有意义的区分。本文中,我们开发了一种原则性的非参数贝叶斯方法,可适应于任何统计排序方法,用于学习部分排序(允许并列的排序),该方法仅在数据中存在足够证据时才区分不同项目的排名。我们开发了一种快速的凝聚算法,以在我们的框架下执行部分排序的最大后验概率推断,并在各种真实和合成的网络数据集上检验了我们方法的性能,发现与传统排序方法相比,它通常能给出更简约的数据摘要,尤其是在观测数据稀疏的情况下。

0
下载
关闭预览

相关内容

排序是计算机内经常进行的一种操作,其目的是将一组“无序”的记录序列调整为“有序”的记录序列。分内部排序和外部排序。若整个排序过程不需要访问外存便能完成,则称此类排序问题为内部排序。反之,若参加排序的记录数量很大,整个序列的排序过程不可能在内存中完成,则称此类排序问题为外部排序。内部排序的过程是一个逐步扩大记录的有序序列长度的过程。
《序列推荐》最新综述
专知会员服务
22+阅读 · 2024年12月27日
基于因果推断的推荐系统去偏研究
专知会员服务
21+阅读 · 2024年11月10日
【TPAMI2024】序列操作对排名聚合的攻击:理论与算法
专知会员服务
14+阅读 · 2024年8月15日
美国防部测试和评估 |《序列分析综述》53页报告
专知会员服务
28+阅读 · 2023年2月26日
多因素问题分析时,如何确立各因素权重?
人人都是产品经理
75+阅读 · 2020年3月4日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
Arxiv
0+阅读 · 1月22日
Arxiv
0+阅读 · 1月8日
VIP会员
相关基金
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员