Modern conversational agents condition on an ever-growing dialogue history at each turn, incurring redundant attention and encoding costs that grow with conversation length. Naive truncation or summarization degrades fidelity, while existing context compressors lack cross-turn memory sharing or revision, causing information loss and compounding errors in long dialogues. We revisit the context compression under conversational dynamics and empirically present its fragility. To improve both efficiency and robustness, we introduce Context-Driven Incremental Compression (C-DIC), which treats a conversation as interleaved contextual threads and stores revisable per-thread compression states in a single, compact dialogue memory. At each turn, a lightweight retrieve, revise, and write-back loop shares information across turns and updates stale memories, stabilizing long-horizon behavior. In addition, we adapt truncated backpropagation-through-time (TBPTT) to our multi-turn setting, learning cross-turn dependencies without full-history backpropagation. Extensive experiments on long-form dialogue benchmarks demonstrate superior performance and efficiency of C-DIC; notably, C-DIC shows stable inference latency and perplexity over hundreds of dialogue turns, supporting a scalable path to high-quality dialogue modeling.


翻译:现代对话智能体在每轮交互中都会处理不断增长的对话历史,导致注意力机制和编码成本随对话长度同步增长。简单的截断或总结方法会损害生成保真度,而现有上下文压缩器缺乏跨轮次记忆共享或修正机制,在长对话中会导致信息丢失和误差累积。我们重新审视对话动态中的上下文压缩问题,并通过实验揭示了其脆弱性。为兼顾效率与鲁棒性,我们提出上下文驱动增量压缩(C-DIC),该方法将对话视为交织的上下文线程,并在单一紧凑的对话存储器中保存每线程可修正的压缩状态。每轮交互中,轻量级的"检索-修正-回写"循环机制实现跨轮信息共享并更新陈旧记忆,从而稳定长期行为。此外,我们还将截断式时间反向传播(TBPTT)适配至多轮对话场景,在不依赖完整历史反向传播的条件下学习跨轮依赖关系。在长对话基准上的大量实验表明,C-DIC在性能与效率上均表现优异;值得注意的是,C-DIC在数百轮对话中仍能保持稳定的推理延迟与困惑度,为高质量对话建模提供了可扩展的路径。

0
下载
关闭预览

相关内容

【博士论文】基于多模态基础模型的上下文学习
专知会员服务
24+阅读 · 2025年12月17日
《Transformer压缩》综述
专知会员服务
49+阅读 · 2024年2月14日
使用多模态语言模型生成图像
专知会员服务
32+阅读 · 2023年8月23日
基于文档的对话技术研究
专知会员服务
20+阅读 · 2022年2月20日
上海交大最新《多轮对话理解》综述论文,20页pdf
专知会员服务
31+阅读 · 2021年10月12日
用于语音识别的数据增强
AI研习社
24+阅读 · 2019年6月5日
一文读懂智能对话系统
数据派THU
16+阅读 · 2018年1月27日
多轮对话之对话管理:Dialog Management
PaperWeekly
18+阅读 · 2018年1月15日
赛尔原创 | 教聊天机器人进行多轮对话
哈工大SCIR
18+阅读 · 2017年9月18日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关VIP内容
【博士论文】基于多模态基础模型的上下文学习
专知会员服务
24+阅读 · 2025年12月17日
《Transformer压缩》综述
专知会员服务
49+阅读 · 2024年2月14日
使用多模态语言模型生成图像
专知会员服务
32+阅读 · 2023年8月23日
基于文档的对话技术研究
专知会员服务
20+阅读 · 2022年2月20日
上海交大最新《多轮对话理解》综述论文,20页pdf
专知会员服务
31+阅读 · 2021年10月12日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员