迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

大语言模型（LLM）赋予了智能体进行推理、规划以及与工具和环境交互以完成复杂任务的能力。随着这些智能体在更长的交互周期（Interaction horizons）内运行，其效能日益取决于对个体用户的行为适应性及跨时空的连续性保持，从而催生了个性化 LLM 驱动的智能体。在涉及长期且用户依赖的场景下，个性化特征渗透于整个决策管线（Decision pipeline），而非仅仅局限于表层的文本生成。本综述对个性化 LLM 驱动的智能体进行了以能力为导向的深度回顾。我们围绕四个相互关联的组件组织相关文献：画像建模（Profile modeling）、记忆（Memory）、规划（Planning）以及动作执行（Action execution）。基于这一分类体系，我们整合了代表性方法，并分析了用户信号如何被表征、传递和利用，重点探讨了组件间的交互作用以及反复出现的决策权衡（Design trade-offs）。此外，我们还考察了针对个性化智能体量身定制的评估指标与基准测试，总结了从通用助手到专业领域的应用场景，并概述了研究与部署的未来方向。通过提供一个理解和设计个性化 LLM 驱动智能体的结构化框架，本综述为构建更符合用户意图（User-aligned）、自适应、鲁棒且可部署的智能体系统绘制了路线图，旨在加速从个性化原型向大规模现实世界助手的跨越。

1 引言

大语言模型（LLMs）已从被动的文本生成器演变为通用推理系统，具备理解多样化数据、规划行动以及使用外部工具的能力。基于这些能力，LLM 驱动的智能体将 LLM 扩展为集成系统，能够分解复杂目标、调用工具、与动态环境交互，并与人类或其他智能体协作，以在长周期内实现高层级目标 [8, 126, 213, 225]。这一转变不仅标志着 LLM 能力在技术上的扩张，也代表了向自主、自适应且具备社会化基础的智能助手进行的范式迁移。随着智能体系统日益支持长期交互和自主决策，个性化（Personalization）已成为在教育、医疗和推荐等领域 [31, 157, 229] 维持上下文连续性并使智能体行为与个人用户目标对齐的核心需求。在 LLM 驱动的智能体中，个性化贯穿于整个决策管线，塑造了智能体如何理解用户意图、跨时段保留信息、生成计划以及执行动作 [215, 288]。这种全系统范围的覆盖引入了新的挑战，包括处理动态和多模态反馈、维持交互组件间的一致性、平衡用户特定适配与通用能力，以及保障隐私和安全。相应地，评估个性化智能体需要超越静态的正确性，转而捕捉长期有效性、自适应性和用户满意度。尽管研究兴趣日益增长，但关于个性化 LLM 驱动智能体的综述仍显碎片化。现有研究通常集中在单一能力上，如用户建模与记忆构建 [250, 287]、规划与推理策略 [239]，或自适应交互机制 [46, 110]。目前尚缺乏一个能够连接整个智能体生命周期中个性化目标的统一框架。因此，不同个性化机制之间的交互、它们的系统级权衡（Trade-offs）及其对评估和部署的影响尚未得到充分理解。本综述从能力导向（Capability-oriented）和系统级（System-level）视角阐述了个性化 LLM 驱动的智能体。个性化被视为分布在四个相互依赖组件中的属性：画像建模（Profile modeling）、记忆管理（Memory management）、规划（Planning）和动作执行（Action execution）。这种分解方式使得我们能够系统地分析用户特定信号在从意图理解到现实结果的整个智能体生命周期中，是如何被表征、传播和执行的。如图 1 所示，当个人用户提交请求时，个性化智能体协调这四个相互依赖的能力来生成定制化响应。画像表征和角色定义塑造了内部偏好建模，记忆方案组织并检索相关的上下文信息，规划决定了个性化的决策策略，而动作执行则将这些决策落实于环境中。由此产生的交互结果提供反馈以优化内部用户表征，形成闭环，从而实现长期迭代且持续的个性化。基于这一分类体系，我们回顾了具有代表性的方法、基准测试和评估协议，总结了主要应用领域，并指出了开放性挑战和未来研究方向。本综述旨在厘清个性化智能体的设计空间，将基准驱动的研究与实际部署需求相结合，为开发可信、有效且可扩展的个性化智能体系统提供结构化基础。我们的贡献如下： 1. 我们提出了一个统一的分类体系，围绕四项核心能力（画像建模、记忆管理、规划和动作执行）组织个性化 LLM 驱动的智能体，提供了个性化如何在整个智能体管线中实现的系统级视角 (§2)。 1. 我们对近期的技术、基准测试和评估协议进行了广泛综述 (§3–§7)，重点阐述了个性化机制如何在智能体组件内及组件间运行，以及它们在实践中是如何被评估的。 1. 我们调研了个性化智能体的代表性应用领域，并讨论了开放性挑战和具有前景的研究方向 (§8-§9)。

成为VIP会员查看完整内容

相关内容

大语言模型

关注 65

大语言模型是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本，还能够深入理解文本含义，处理各种自然语言任务，如文本摘要、问答、翻译等。2023年，大语言模型及其在人工智能领域的应用已成为全球科技研究的热点，其在规模上的增长尤为引人注目，参数量已从最初的十几亿跃升到如今的一万亿。参数量的提升使得模型能够更加精细地捕捉人类语言微妙之处，更加深入地理解人类语言的复杂性。在过去的一年里，大语言模型在吸纳新知识、分解复杂任务以及图文对齐等多方面都有显著提升。随着技术的不断成熟，它将不断拓展其应用范围，为人类提供更加智能化和个性化的服务，进一步改善人们的生活和生产方式。

法律领域中的大语言模型智能体：分类体系、应用场景与挑战

专知会员服务

16+阅读 · 1月14日

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

专知会员服务

30+阅读 · 2025年9月27日

基于大语言模型的深度搜索智能体综述：范式、优化、评测与挑战

专知会员服务

33+阅读 · 2025年8月11日

大语言模型智能体的评估与基准：综述

专知会员服务

46+阅读 · 2025年7月31日