Deep Research agents driven by LLMs have automated the scholarly discovery pipeline, from planning and query formulation to iterative web exploration. Yet they remain constrained by a static, ``one-size-fits-all'' retrieval paradigm. Current systems fail to adaptively adjust the depth and breadth of exploration based on the user's existing expertise or latent interests, frequently resulting in reports that are either redundant for experts or overly dense for novices. To address this, we introduce Personalized Deep Research (PDR), a framework that integrates dynamic user context into the core retrieval-reasoning loop. Rather than treating personalization as a post-hoc formatting step, PDR unifies user profile modeling with iterative query development, dual-stage (private/public) retrieval, and context-aware synthesis. This allows the system to autonomously align research sub-goals with user intent and optimize the stopping criteria for evidence collection. To facilitate benchmarking, we release the PDR Dataset, covering four realistic user tasks, and propose a hybrid evaluation framework combining lexical metrics with LLM-based judgments to assess factual accuracy and personalization alignment. Experimental results against commercial baselines demonstrate that PDR significantly improves retrieval utility and report relevance, effectively bridging the gap between generic information retrieval and personalized knowledge acquisition. The resource is available to the public at https://github.com/Applied-Machine-Learning-Lab/SIGIR2026_PDR.


翻译:由大语言模型驱动的深度研究智能体已自动化了学术发现流程,涵盖规划、查询构建及迭代式网络探索。然而,这些系统仍受限于静态"一刀切"的检索范式。现有系统无法根据用户既有专业知识或潜在兴趣自适应调整探索深度与广度,导致生成的报告对专家而言冗余重复,对新手则信息密度过高。为解决此问题,我们提出个性化深度研究(PDR)框架,该框架将动态用户情境整合至核心检索-推理循环中。PDR并非将个性化视为后期格式调整步骤,而是将用户画像建模与迭代式查询生成、双阶段(私有/公开)检索及情境感知综合统一起来。这使得系统能够自主将研究子目标与用户意图对齐,并优化证据收集的终止准则。为促进基准测试,我们发布了PDR数据集,涵盖四项真实用户任务,并提出融合词汇指标与基于大语言模型评判的混合评估框架,以评估事实准确性与个性化对齐度。与商业基线的实验结果表明,PDR显著提升了检索效用与报告相关性,有效弥合了通用信息检索与个性化知识获取之间的鸿沟。相关资源已公开于https://github.com/Applied-Machine-Learning-Lab/SIGIR2026_PDR。

0
下载
关闭预览

相关内容

AI 智能体系统:体系架构、应用场景及评估范式
Deep Research(深度研究):系统性综述
专知会员服务
51+阅读 · 2025年12月3日
面向深度研究系统的强化学习基础:综述
专知会员服务
23+阅读 · 2025年9月22日
深度学习在推荐系统上的应用
架构文摘
13+阅读 · 2018年2月22日
深度学习学习合集
计算机视觉战队
12+阅读 · 2017年12月12日
Deep Learning(深度学习)各种资料网址
数据挖掘入门与实战
11+阅读 · 2017年10月31日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
Arxiv
0+阅读 · 5月18日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
5+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员