AI arenas, which rank generative models from pairwise preferences of users, are a popular method for measuring the relative performance of models in the course of their organic use. Because rankings are computed from noisy preferences, there is a concern that model producers can exploit this randomness by submitting many models (e.g., multiple variants of essentially the same model) and thereby artificially improve the rank of their top models. This can lead to degradations in the quality, and therefore the usefulness, of the ranking. In this paper, we begin by establishing, both theoretically and in simulations calibrated to data from the platform Arena (formerly LMArena, Chatbot Arena), conditions under which producers can benefit from submitting clones when their goal is to be ranked highly. We then propose a new mechanism for ranking models from pairwise comparisons, called You-Rank-We-Rank (YRWR). It requires that producers submit rankings over their own models and uses these rankings to correct statistical estimates of model quality. We prove that this mechanism is approximately clone-robust, in the sense that a producer cannot improve their rank much by doing anything other than submitting each of their unique models exactly once. Moreover, to the extent that model producers are able to correctly rank their own models, YRWR improves overall ranking accuracy. In further simulations, we show that indeed the mechanism is approximately clone-robust and quantify improvements to ranking accuracy, even under producer misranking.


翻译:人工智能竞技场通过用户对生成模型的成对偏好进行排名,已成为在模型有机使用过程中衡量其相对性能的流行方法。由于排名是根据带有噪声的偏好计算得出,模型生产者可能利用这种随机性提交大量模型(例如,本质相同的多个变体),从而人为提升其顶级模型的排名。这种行为可能导致排名质量下降,进而削弱其可用性。本文首先从理论和数值模拟两个层面(模拟数据校准自Arena平台,原LMArena/Chatbot Arena),证实了当生产者以高排名为目标时,其可通过提交克隆模型获益的条件。随后,我们提出一种基于成对比较的排名新机制——“你排我排”(YRWR)。该机制要求生产者提交自身模型的排名,并利用这些排名修正模型质量的统计估计值。理论证明该机制具有近似克隆鲁棒性:即生产者仅提交每个独特模型一次时,无法通过其他操作显著提升排名。此外,在生产者能正确排序自身模型的条件下,YRWR可提升整体排名准确性。进一步模拟显示,即使存在生产者错误排名的情形,该机制仍保持近似克隆鲁棒性,且能量化评估排名准确性的改进幅度。

0
下载
关闭预览

相关内容

将生成式人工智能整合进军事战术决策中
专知会员服务
30+阅读 · 4月10日
生成式人工智能的军事应用及路径探讨
专知会员服务
30+阅读 · 2025年11月12日
中文版 | 战争算法:生成式人工智能在战场的崛起
专知会员服务
35+阅读 · 2025年7月14日
生成式人工智能:数据军备竞赛中的新弹药
专知会员服务
28+阅读 · 2025年2月21日
【新书】利用生成式人工智能进行网络防御策略
专知会员服务
31+阅读 · 2024年10月18日
《生成式人工智能模型:机遇与风险》
专知会员服务
79+阅读 · 2024年4月22日
创新战争:利用生成式人工智能的力量
专知会员服务
63+阅读 · 2024年2月14日
《人工智能对战略和业务决策的影响》
专知会员服务
60+阅读 · 2023年12月17日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
兵棋推演的智能决策技术与挑战
专知
28+阅读 · 2022年7月5日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
Arxiv
0+阅读 · 3月17日
Arxiv
12+阅读 · 2024年4月16日
VIP会员
相关主题
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
7+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
将生成式人工智能整合进军事战术决策中
专知会员服务
30+阅读 · 4月10日
生成式人工智能的军事应用及路径探讨
专知会员服务
30+阅读 · 2025年11月12日
中文版 | 战争算法:生成式人工智能在战场的崛起
专知会员服务
35+阅读 · 2025年7月14日
生成式人工智能:数据军备竞赛中的新弹药
专知会员服务
28+阅读 · 2025年2月21日
【新书】利用生成式人工智能进行网络防御策略
专知会员服务
31+阅读 · 2024年10月18日
《生成式人工智能模型:机遇与风险》
专知会员服务
79+阅读 · 2024年4月22日
创新战争:利用生成式人工智能的力量
专知会员服务
63+阅读 · 2024年2月14日
《人工智能对战略和业务决策的影响》
专知会员服务
60+阅读 · 2023年12月17日
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员