A Picture of Agentic Search - 专知论文

会员服务 ·

0

系统 · 数据集 · 搜索 · 智能搜索 · 信息检索 ·

A Picture of Agentic Search

翻译：智能搜索图景

Francesca Pezzuti,Ophir Frieder,Fabrizio Silvestri,Sean MacAvaney,Nicola Tonellotto

from arxiv, 7 pages, 2 figures

With automated systems increasingly issuing search queries alongside humans, Information Retrieval (IR) faces a major shift. Yet IR remains human-centred, with systems, evaluation metrics, user models, and datasets designed around human queries and behaviours. Consequently, IR operates under assumptions that no longer hold in practice, with changes to workload volumes, predictability, and querying behaviours. This misalignment affects system performance and optimisation: caching may lose effectiveness, query pre-processing may add overhead without improving results, and standard metrics may mismeasure satisfaction. Without adaptation, retrieval models risk satisfying neither humans, nor the emerging user segment of agents. However, datasets capturing agent search behaviour are lacking, which is a critical gap given IR's historical reliance on data-driven evaluation and optimisation. We develop a methodology for collecting all the data produced and consumed by agentic retrieval-augmented systems when answering queries, and we release the Agentic Search Queryset (ASQ) dataset. ASQ contains reasoning-induced queries, retrieved documents, and thoughts for queries in HotpotQA, Researchy Questions, and MS MARCO, for 3 diverse agents and 2 retrieval pipelines. The accompanying toolkit enables ASQ to be extended to new agents, retrievers, and datasets.

翻译：随着自动化系统日益与人类并行发出搜索查询，信息检索领域正面临重大变革。然而当前信息检索仍以人为中心，其系统设计、评估指标、用户模型和数据集均围绕人类查询行为构建。这导致信息检索所依赖的基本假设在实践中已不再成立，具体体现在工作负载规模、可预测性及查询行为模式的变化。此种错位将影响系统性能与优化：缓存机制可能失效，查询预处理可能徒增开销却无益于结果改进，标准评估指标可能无法准确衡量满意度。若不进行适应性调整，检索模型将面临既无法满足人类需求，也难以适应新兴智能体用户群体的困境。然而，当前缺乏能够捕捉智能体搜索行为的数据集，鉴于信息检索历来依赖数据驱动的评估与优化方法，这一缺失构成关键瓶颈。本研究开发了一套方法论，用于系统收集智能增强检索系统在应答查询过程中生成与消耗的全流程数据，并据此发布智能搜索查询集数据集。该数据集涵盖HotpotQA、Researchy Questions和MS MARCO三大基准中的推理驱动查询、检索文档及思维链数据，包含3种异构智能体与2种检索管道的实验记录。配套工具包支持将该数据集扩展至新型智能体、检索器及数据源。

0

相关内容

【大模型+搜索】AI搜索行业深度：大模型催生搜索行业变革机遇，产品百花齐放效果几何

【大模型+搜索】AI搜索行业深度：大模型催生搜索行业变革机遇，产品百花齐放效果几何

专知会员服务

37+阅读 · 2024年4月17日

机器视觉专题报告: AI+机器视觉，应用场景持续拓展

机器视觉专题报告: AI+机器视觉，应用场景持续拓展

专知会员服务

61+阅读 · 2023年6月20日

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

专知会员服务

53+阅读 · 2022年4月30日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

5G+智能时代的多模搜索技术

专知会员服务

22+阅读 · 2021年4月1日

知识图谱在智能制造领域的研究现状及其应用前景综述

知识图谱在智能制造领域的研究现状及其应用前景综述

专知会员服务

165+阅读 · 2021年2月25日

《人工智能发展报告2020》,清华人工智能研究院等，235页pdf

专知会员服务

218+阅读 · 2021年1月21日

【清华大学】《人工智能之学术搜索》报告重磅发布：呈现知识和算法双引擎驱动的未来发展趋势 | 附报告PDF下载

【清华大学】《人工智能之学术搜索》报告重磅发布：呈现知识和算法双引擎驱动的未来发展趋势 | 附报告PDF下载

专知会员服务

71+阅读 · 2020年5月22日

2019年人工智能行业现状与发展趋势报告，52页ppt

2019年人工智能行业现状与发展趋势报告，52页ppt

专知会员服务

124+阅读 · 2019年10月10日

【报告推荐】《人工智能之信息检索与推荐》报告，附72页PDF下载

【报告推荐】《人工智能之信息检索与推荐》报告，附72页PDF下载

专知会员服务

86+阅读 · 2019年9月7日

重磅！最新《人工智能白皮书（2022年）》发布，42页pdf

重磅！最新《人工智能白皮书（2022年）》发布，42页pdf

专知

25+阅读 · 2022年4月13日

《人工智能之认知图谱》重磅发布（附报告全文下载）

《人工智能之认知图谱》重磅发布（附报告全文下载）

学术头条

41+阅读 · 2020年8月28日

【图计算】人工智能之图计算

【图计算】人工智能之图计算

产业智能官

17+阅读 · 2020年4月3日

纵览知识图谱在AI领域的有效应用，2019知识图谱前沿技术论坛即将开幕

纵览知识图谱在AI领域的有效应用，2019知识图谱前沿技术论坛即将开幕

机器之心

15+阅读 · 2019年10月11日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

完备的 AI 学习路线，最详细的资源整理！

完备的 AI 学习路线，最详细的资源整理！

新智元

18+阅读 · 2019年5月4日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

基于图片内容的深度学习图片检索（一）

基于图片内容的深度学习图片检索（一）

七月在线实验室

20+阅读 · 2017年10月1日

没错！卷积神经网络实现图像识别，就这么简单！

没错！卷积神经网络实现图像识别，就这么简单！

全球人工智能

20+阅读 · 2017年8月15日

物联网安全搜索技术研究

国家自然科学基金

3+阅读 · 2017年12月31日

高性能低比特视觉搜索及芯片结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

大数据环境下基于社交网络的图像搜索技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

协同视角下社会化搜索的形成机制及实现模式研究

国家自然科学基金

0+阅读 · 2014年12月31日

Towards AI Search Paradigm

Arxiv

0+阅读 · 3月13日

InterDeepResearch: Enabling Human-Agent Collaborative Information Seeking through Interactive Deep Research

Arxiv

0+阅读 · 3月13日

TURA: Tool-Augmented Unified Retrieval Agent for AI Search

Arxiv

0+阅读 · 3月12日

AgentIR: Reasoning-Aware Retrieval for Deep Research Agents

Arxiv

0+阅读 · 3月5日

AgentIR: Reasoning-Aware Retrival for Deep Research Agents

Arxiv

0+阅读 · 3月4日

Visual Model Checking: Graph-Based Inference of Visual Routines for Image Retrieval

Arxiv

0+阅读 · 2月19日

Agentic AI for Cybersecurity: A Meta-Cognitive Architecture for Governable Autonomy

Arxiv

1+阅读 · 2月12日

Analytical Search

Arxiv

0+阅读 · 2月12日

Table-as-Search: Formulate Long-Horizon Agentic Information Seeking as Table Completion

Arxiv

0+阅读 · 2月6日

Agent AI: Surveying the Horizons of Multimodal Interaction

Arxiv

61+阅读 · 2024年1月7日

VIP会员

文章信息

相关主题

最新内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

0+阅读 · 6分钟前

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

0+阅读 · 7分钟前

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

3+阅读 · 今天14:04

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

3+阅读 · 今天13:54

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

6+阅读 · 今天13:49

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

4+阅读 · 今天13:38

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

5+阅读 · 今天13:37

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

5+阅读 · 今天13:11

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

10+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

5+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

5+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

7+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

5+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

8+阅读 · 5月29日

相关VIP内容

【大模型+搜索】AI搜索行业深度：大模型催生搜索行业变革机遇，产品百花齐放效果几何

【大模型+搜索】AI搜索行业深度：大模型催生搜索行业变革机遇，产品百花齐放效果几何

专知会员服务

37+阅读 · 2024年4月17日

机器视觉专题报告: AI+机器视觉，应用场景持续拓展

机器视觉专题报告: AI+机器视觉，应用场景持续拓展

专知会员服务

61+阅读 · 2023年6月20日

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

专知会员服务

53+阅读 · 2022年4月30日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

5G+智能时代的多模搜索技术

专知会员服务

22+阅读 · 2021年4月1日

知识图谱在智能制造领域的研究现状及其应用前景综述

知识图谱在智能制造领域的研究现状及其应用前景综述

专知会员服务

165+阅读 · 2021年2月25日

《人工智能发展报告2020》,清华人工智能研究院等，235页pdf

专知会员服务

218+阅读 · 2021年1月21日

【清华大学】《人工智能之学术搜索》报告重磅发布：呈现知识和算法双引擎驱动的未来发展趋势 | 附报告PDF下载

【清华大学】《人工智能之学术搜索》报告重磅发布：呈现知识和算法双引擎驱动的未来发展趋势 | 附报告PDF下载

专知会员服务

71+阅读 · 2020年5月22日

2019年人工智能行业现状与发展趋势报告，52页ppt

2019年人工智能行业现状与发展趋势报告，52页ppt

专知会员服务

124+阅读 · 2019年10月10日

【报告推荐】《人工智能之信息检索与推荐》报告，附72页PDF下载

【报告推荐】《人工智能之信息检索与推荐》报告，附72页PDF下载

专知会员服务

86+阅读 · 2019年9月7日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

美以伊战争：首次人工智能战争——军事自主性困境

BES：让语言模型通过双向进化搜索自我改进

以色列-美国-伊朗战争中的无人机：关键要点

相关资讯

重磅！最新《人工智能白皮书（2022年）》发布，42页pdf

重磅！最新《人工智能白皮书（2022年）》发布，42页pdf

专知

25+阅读 · 2022年4月13日

《人工智能之认知图谱》重磅发布（附报告全文下载）

《人工智能之认知图谱》重磅发布（附报告全文下载）

学术头条

41+阅读 · 2020年8月28日

【图计算】人工智能之图计算

【图计算】人工智能之图计算

产业智能官

17+阅读 · 2020年4月3日

纵览知识图谱在AI领域的有效应用，2019知识图谱前沿技术论坛即将开幕

纵览知识图谱在AI领域的有效应用，2019知识图谱前沿技术论坛即将开幕

机器之心

15+阅读 · 2019年10月11日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

完备的 AI 学习路线，最详细的资源整理！

完备的 AI 学习路线，最详细的资源整理！

新智元

18+阅读 · 2019年5月4日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

基于图片内容的深度学习图片检索（一）

基于图片内容的深度学习图片检索（一）

七月在线实验室

20+阅读 · 2017年10月1日

没错！卷积神经网络实现图像识别，就这么简单！

没错！卷积神经网络实现图像识别，就这么简单！

全球人工智能

20+阅读 · 2017年8月15日

相关论文

Towards AI Search Paradigm

Arxiv

0+阅读 · 3月13日

InterDeepResearch: Enabling Human-Agent Collaborative Information Seeking through Interactive Deep Research

Arxiv

0+阅读 · 3月13日

TURA: Tool-Augmented Unified Retrieval Agent for AI Search

Arxiv

0+阅读 · 3月12日

AgentIR: Reasoning-Aware Retrieval for Deep Research Agents

Arxiv

0+阅读 · 3月5日

AgentIR: Reasoning-Aware Retrival for Deep Research Agents

Arxiv

0+阅读 · 3月4日

Visual Model Checking: Graph-Based Inference of Visual Routines for Image Retrieval

Arxiv

0+阅读 · 2月19日

Agentic AI for Cybersecurity: A Meta-Cognitive Architecture for Governable Autonomy

Arxiv

1+阅读 · 2月12日

Analytical Search

Arxiv

0+阅读 · 2月12日

Table-as-Search: Formulate Long-Horizon Agentic Information Seeking as Table Completion

Arxiv

0+阅读 · 2月6日

Agent AI: Surveying the Horizons of Multimodal Interaction

Arxiv

61+阅读 · 2024年1月7日

相关基金

物联网安全搜索技术研究

国家自然科学基金

3+阅读 · 2017年12月31日

高性能低比特视觉搜索及芯片结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

大数据环境下基于社交网络的图像搜索技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

协同视角下社会化搜索的形成机制及实现模式研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员