记忆是连接过去与未来的关键纽带,为人类和人工智能系统提供了在处理复杂任务时不可或缺的概念与经验。 近年来,针对自主智能体的研究愈发关注如何借鉴认知神经科学来设计高效的记忆工作流。然而,受限于学科间的壁垒,现有研究仍难以吸收人类记忆机制的精髓。 为了弥合这一差距,本文系统地综合了记忆领域的跨学科知识,将认知神经科学的深刻见解与 LLM 驱动的智能体相结合。具体而言,我们首先沿着“认知神经科学—LLM—智能体”的递进轨迹,阐明了记忆的定义与功能。随后,我们从生物学和人工系统的双重视角,对记忆分类学、存储机制以及完整的管理生命周期进行了对比分析。 紧接着,我们回顾了评估智能体记忆能力的主流基准测试(Benchmarks)。此外,我们还从攻击与防御两个维度探讨了记忆安全性。最后,我们对未来的研究方向进行了展望,重点聚焦于多模态记忆系统与技能获取。

1 引言 (INTRODUCTION)

记忆是将过往经验与未来决策交织在一起的认知纽带 [21]。在人类中,记忆表现为一种动态的神经过程,大脑通过该过程存储和管理信息 [70]。其深刻意义在于赋予了个体学习、适应和重塑行为的能力,使人类能够在瞬息万变的环境中保持连贯性与远见 [27, 207]。随着大语言模型(LLMs)的不断演进,为 AI 系统赋予类人记忆能力已成为一项关键挑战 [130]。然而,LLMs 本质上的无状态性(stateless nature) [117] 导致其每次推理相互独立,阻碍了模型维持跨会话的连续性或从历史交互中积累经验。尽管现代 LLMs 已将参数规模和上下文窗口扩展至巨大体量,但知识更新成本 [57] 与计算复杂度 [143, 182] 依然是显著的瓶颈。 随着智能体在各领域及任务中的飞速发展 [10, 44, 103, 116, 175, 205, 262, 286, 314, 315, 384],记忆系统已成为通过实现信息持久化 [123, 149, 264] 和长程规划 [96, 213] 来提升其性能的关键因素。记忆不再仅仅是历史交互的被动仓库,而是演变成了一个支撑复杂决策的动态认知枢纽。然而,尽管近年来记忆机制研究取得了显著进展,现有工作 [53, 215, 323, 331, 398] 往往局限于单一学科视角,或在生物学研究深度上有所欠缺,导致认知科学与人工智能之间难以实现深度融合。这种隔阂剥夺了两大领域在记忆研究中进行深度相互验证与启发的机会。 为了弥合这一差距,本综述对记忆系统进行了全面且统一的回顾,整合了认知神经科学与飞速发展的 LLM 驱动智能体领域的见解。我们首先建立了一个递进的记忆研究视角,从人类大脑过渡到 LLM,最终延伸至智能体,系统地阐明了其定义与基本作用 (§2, §3)。 * 分类学 (§4):基于认知神经科学中经典的短时与长时记忆二分法,我们提出了一个从两个维度对智能体记忆进行分类的体系,包括**基于性质(nature-based)基于范围(scope-based)**的分类。前者区分了程序性经验与概念性知识,而后者关注记忆在轨迹内(within trajectories)或跨轨迹(across trajectories)的持久性。 * 存储机制 (§5):我们从位置和格式两个角度审视了记忆存储。

位置:在认知神经科学中,短时记忆依赖于分布式的感觉-额顶网络,而长时记忆则依赖于海马体-新皮层(hippocampal-neocortical)的协同。对于智能体,存储位置包括用于临时记忆的上下文窗口和用于持久信息的外部记忆库。 * 格式:大脑利用持续性活动和突触连接权重进行短时保存,并使用**认知地图(cognitive maps)**等结构化形式存储长时记忆;而智能体则利用自然语言文本、保留关系信息的图结构、内化参数以及高维向量空间中的隐式表示。

本综述进一步分析了人类大脑与智能体中的记忆管理机制,涵盖了记忆提取、更新、检索和利用的完整闭环生命周期 (§6)。在认知神经科学中,新信息经编码后通过海马体-新皮层的协同作用逐渐稳定为持久表示。当外部线索触发海马重现(hippocampal replay)时,这些表示所携带的过往事件信息会被恢复,且检索过程本身会开启一个可塑性窗口,期间底层的记忆痕迹可以被更新、增强或削弱。在智能体中,原始信息通过扁平化、层次化或生成式范式提炼为结构化记录,在轨迹内动态刷新并在跨轨迹间维持。这些记录通过相似度匹配或多因子方法被检索,随后通过上下文增强或参数内化整合到推理中。 随后,我们全面概述了评估智能体记忆能力的各种基准测试,将其分为:考察内部状态维护和高阶认知能力的语义导向型基准,以及评估在网页搜索、工具调用及环境交互等垂直领域表现的情境导向型(episodic-oriented)基准 (§7)。此外,我们探讨了常被忽视但至关重要的记忆安全问题,从攻击与防御两个视角进行了系统调查 (§8)。在攻击端,现有方法侧重于提取敏感信息、通过恶意数据植入后门,或通过引入噪声和冲突信号降低智能体的判断力。在防御端,已开发出净化检索源、实时拦截有害响应以及在整个记忆生命周期内保护敏感数据的对策。 最后,我们提出了未来的研究方向,特别聚焦于两个关键领域 (§9): 1. 多模态记忆系统:能够处理并整合文本、图像、音频、视频等多模态信息。 1. 智能体技能:实现异构智能体间的记忆共享与迁移,将领域专业知识转化为可组合、可重用且可移植的模块化资源。

我们希望本综述能促进跨学科研究,为初学者提供易懂的入门指南,同时为资深研究者提供深刻见解。

成为VIP会员查看完整内容
21

相关内容

AI智能体时代中的记忆:形式、功能与动态综述
专知会员服务
32+阅读 · 2025年12月16日
大模型赋能的具身智能:决策与具身学习综述
专知会员服务
42+阅读 · 2025年8月16日
工业机器视觉中的生成式人工智能综述
专知会员服务
50+阅读 · 2024年9月1日
脑启发的人工智能:全面综述
专知会员服务
54+阅读 · 2024年8月30日
「基于通信的多智能体强化学习」 进展综述
综述| 当图神经网络遇上强化学习
图与推荐
35+阅读 · 2022年7月1日
时空数据挖掘:综述
专知
34+阅读 · 2022年6月30日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
A Survey of Large Language Models
Arxiv
497+阅读 · 2023年3月31日
VIP会员
相关VIP内容
AI智能体时代中的记忆:形式、功能与动态综述
专知会员服务
32+阅读 · 2025年12月16日
大模型赋能的具身智能:决策与具身学习综述
专知会员服务
42+阅读 · 2025年8月16日
工业机器视觉中的生成式人工智能综述
专知会员服务
50+阅读 · 2024年9月1日
脑启发的人工智能:全面综述
专知会员服务
54+阅读 · 2024年8月30日
相关资讯
「基于通信的多智能体强化学习」 进展综述
综述| 当图神经网络遇上强化学习
图与推荐
35+阅读 · 2022年7月1日
时空数据挖掘:综述
专知
34+阅读 · 2022年6月30日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员