Assessing the validity of user simulators when used for the evaluation of information retrieval systems remains an open question, constraining their effective use and the reliability of simulation-based results. To address this issue, we conduct a comprehensive literature review with a particular focus on methods for the validation of simulated user queries with regard to real queries. Based on the review, we develop a taxonomy that structures the current landscape of available measures. We empirically corroborate the taxonomy by analyzing the relationships between the different measures applied to four different datasets representing diverse search scenarios. Finally, we provide concrete recommendations on which measures or combinations of measures should be considered when validating user simulation in different contexts. Furthermore, we release a dedicated library with the most commonly used measures to facilitate future research.


翻译:评估用户模拟器在信息检索系统评估中的有效性仍是一个悬而未决的问题,这限制了其有效使用以及基于模拟的结果的可靠性。为解决这一问题,我们进行了全面的文献综述,特别关注模拟用户查询相对于真实查询的验证方法。基于此综述,我们构建了一个分类体系,用以梳理当前可用度量指标的全貌。我们通过分析应用于四个代表不同搜索场景的数据集时各度量指标间的关系,从经验上验证了该分类体系。最后,我们针对不同情境下验证用户模拟时应考虑哪些度量指标或其组合,提供了具体建议。此外,我们发布了一个包含最常用度量指标的专用库,以促进未来研究。

0
下载
关闭预览

相关内容

信息检索中模型架构综述
专知会员服务
19+阅读 · 2025年2月23日
深度 | 推荐系统评估
AI100
24+阅读 · 2019年3月16日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
A Picture of Agentic Search
Arxiv
0+阅读 · 2月19日
Arxiv
0+阅读 · 2月12日
VIP会员
相关VIP内容
信息检索中模型架构综述
专知会员服务
19+阅读 · 2025年2月23日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员