With automated systems increasingly issuing search queries alongside humans, Information Retrieval (IR) faces a major shift. Yet IR remains human-centred, with systems, evaluation metrics, user models, and datasets designed around human queries and behaviours. Consequently, IR operates under assumptions that no longer hold in practice, with changes to workload volumes, predictability, and querying behaviours. This misalignment affects system performance and optimisation: caching may lose effectiveness, query pre-processing may add overhead without improving results, and standard metrics may mismeasure satisfaction. Without adaptation, retrieval models risk satisfying neither humans, nor the emerging user segment of agents. However, datasets capturing agent search behaviour are lacking, which is a critical gap given IR's historical reliance on data-driven evaluation and optimisation. We develop a methodology for collecting all the data produced and consumed by agentic retrieval-augmented systems when answering queries, and we release the Agentic Search Queryset (ASQ) dataset. ASQ contains reasoning-induced queries, retrieved documents, and thoughts for queries in HotpotQA, Researchy Questions, and MS MARCO, for 3 diverse agents and 2 retrieval pipelines. The accompanying toolkit enables ASQ to be extended to new agents, retrievers, and datasets.


翻译:随着自动化系统日益与人类并行发出搜索查询,信息检索领域正面临重大变革。然而当前信息检索仍以人为中心,其系统设计、评估指标、用户模型和数据集均围绕人类查询行为构建。这导致信息检索所依赖的基本假设在实践中已不再成立,具体体现在工作负载规模、可预测性及查询行为模式的变化。此种错位将影响系统性能与优化:缓存机制可能失效,查询预处理可能徒增开销却无益于结果改进,标准评估指标可能无法准确衡量满意度。若不进行适应性调整,检索模型将面临既无法满足人类需求,也难以适应新兴智能体用户群体的困境。然而,当前缺乏能够捕捉智能体搜索行为的数据集,鉴于信息检索历来依赖数据驱动的评估与优化方法,这一缺失构成关键瓶颈。本研究开发了一套方法论,用于系统收集智能增强检索系统在应答查询过程中生成与消耗的全流程数据,并据此发布智能搜索查询集数据集。该数据集涵盖HotpotQA、Researchy Questions和MS MARCO三大基准中的推理驱动查询、检索文档及思维链数据,包含3种异构智能体与2种检索管道的实验记录。配套工具包支持将该数据集扩展至新型智能体、检索器及数据源。

0
下载
关闭预览

相关内容

机器视觉专题报告: AI+机器视觉,应用场景持续拓展
专知会员服务
61+阅读 · 2023年6月20日
专知会员服务
22+阅读 · 2021年4月1日
知识图谱在智能制造领域的研究现状及其应用前景综述
专知会员服务
165+阅读 · 2021年2月25日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
124+阅读 · 2019年10月10日
【图计算】人工智能之图计算
产业智能官
17+阅读 · 2020年4月3日
完备的 AI 学习路线,最详细的资源整理!
新智元
17+阅读 · 2019年5月4日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
103+阅读 · 2019年1月9日
【知识图谱】知识图谱+人工智能=新型网络信息体系
产业智能官
14+阅读 · 2018年11月18日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
没错!卷积神经网络实现图像识别,就这么简单!
全球人工智能
20+阅读 · 2017年8月15日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月12日
VIP会员
相关资讯
【图计算】人工智能之图计算
产业智能官
17+阅读 · 2020年4月3日
完备的 AI 学习路线,最详细的资源整理!
新智元
17+阅读 · 2019年5月4日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
103+阅读 · 2019年1月9日
【知识图谱】知识图谱+人工智能=新型网络信息体系
产业智能官
14+阅读 · 2018年11月18日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
没错!卷积神经网络实现图像识别,就这么简单!
全球人工智能
20+阅读 · 2017年8月15日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员