Deploying large language models in long-horizon, goal-oriented interactions remains challenging because similar entities and facts recur under different latent goals and constraints, causing memory systems to retrieve context-mismatched evidence. We propose STITCH (Structured Intent Tracking in Contextual History), an agentic memory system that indexes each trajectory step with a structured retrieval cue, contextual intent, and retrieves history by matching the current step's intent. Contextual intent provides compact signals that disambiguate repeated mentions and reduce interference: (1) the current latent goal defining a thematic segment, (2) the action type, and (3) the salient entity types anchoring which attributes matter. During inference, STITCH filters and prioritizes memory snippets by intent compatibility, suppressing semantically similar but context-incompatible history. For evaluation, we introduce CAME-Bench, a benchmark for context-aware retrieval in realistic, dynamic, goal-oriented trajectories. Across CAME-Bench and LongMemEval, STITCH achieves state-of-the-art performance, outperforming the strongest baseline by 35.6%, with the largest gains as trajectory length increases. Our analysis shows that intent indexing substantially reduces retrieval noise, supporting intent-aware memory for robust long-horizon reasoning.


翻译:在长期、目标导向的交互中部署大规模语言模型仍具挑战性,因为相似的实体和事实会在不同潜在目标和约束下重复出现,导致记忆系统检索到上下文不匹配的证据。我们提出STITCH(结构化上下文历史意图追踪),这是一种智能体记忆系统,通过对每个轨迹步骤建立结构化检索线索和上下文意图的索引,并通过匹配当前步骤的意图来检索历史记录。上下文意图提供紧凑的信号以消解重复提及并减少干扰:(1)定义主题分段的当前潜在目标,(2)动作类型,以及(3)锚定关键属性的显著实体类型。在推理过程中,STITCH通过意图兼容性筛选并优先排序记忆片段,抑制语义相似但上下文不兼容的历史记录。为评估模型,我们引入CAME-Bench——一个针对现实动态目标导向轨迹中上下文感知检索的基准测试。在CAME-Bench和LongMemEval上,STITCH实现了当前最优性能,超越最强基线35.6%,且性能提升随轨迹长度增加而增大。分析表明,意图索引显著降低了检索噪声,支持意图感知记忆以实现稳健的长期推理。

0
下载
关闭预览

相关内容

下半场思考:基础智能体记忆机制
专知会员服务
21+阅读 · 2月9日
AI智能体时代中的记忆:形式、功能与动态综述
专知会员服务
36+阅读 · 2025年12月16日
注意力机制综述(中文版)
专知
23+阅读 · 2021年1月26日
搜索query意图识别的演进
DataFunTalk
13+阅读 · 2020年11月15日
深度学习中的注意力机制
人工智能头条
16+阅读 · 2017年11月2日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月15日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
6+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
3+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
10+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
12+阅读 · 6月17日
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员