Information-Theoretic Generalization Bounds of Replay-based Continual Learning - 专知论文

会员服务 ·

0

泛化 · 持续学习 · 知识 · 样本 · 泛化误差 ·

Information-Theoretic Generalization Bounds of Replay-based Continual Learning

翻译：基于回放的持续学习的信息论泛化边界

Wen Wen,Tieliang Gong,Zeyu Gao,Yunjiao Zhang,Weizhan Zhang,Yong-Jin Liu

Continual learning (CL) has emerged as a dominant paradigm for acquiring knowledge from sequential tasks while avoiding catastrophic forgetting. Although many CL methods have been proposed to show impressive empirical performance, the theoretical understanding of their generalization behavior remains limited, particularly for replay-based approaches. This paper establishes a unified theoretical framework for replay-based CL, deriving a series of information-theoretic generalization bounds that explicitly elucidate the impact of the memory buffer alongside the current task on generalization performance. Specifically, our hypothesis-based bounds capture the trade-off between the number of selected exemplars and the information dependency between the hypothesis and the memory buffer. Our prediction-based bounds yield tighter and computationally tractable upper bounds on the generalization error by leveraging low-dimensional variables. Theoretical analysis is general and broadly applicable to a wide range of learning algorithms, exemplified by stochastic gradient Langevin dynamics (SGLD) as a representative method. Comprehensive experimental evaluations demonstrate the effectiveness of our derived bounds in capturing the generalization dynamics in replay-based CL settings.

翻译：持续学习（CL）已成为从顺序任务中获取知识同时避免灾难性遗忘的主导范式。尽管已提出许多CL方法并展现出令人印象深刻的实证性能，但对其泛化行为的理论理解仍然有限，特别是对于基于回放的方法。本文为基于回放的CL建立了一个统一的理论框架，推导出一系列信息论泛化边界，这些边界明确阐明了记忆缓冲区与当前任务对泛化性能的影响。具体而言，我们基于假设的边界捕捉了所选样本数量与假设和记忆缓冲区之间信息依赖性之间的权衡。我们基于预测的边界通过利用低维变量，得到了泛化误差更紧且计算上易处理的上界。理论分析具有一般性，广泛适用于多种学习算法，以随机梯度朗之万动力学（SGLD）作为代表性方法进行了示例说明。全面的实验评估证明了我们推导的边界在捕捉基于回放的CL设置中泛化动态的有效性。

0

相关内容

【牛津博士论文】考虑计算成本的可扩展持续深度学习

【牛津博士论文】考虑计算成本的可扩展持续深度学习

专知会员服务

16+阅读 · 2025年3月2日

多模态持续学习的最新进展：综合综述

多模态持续学习的最新进展：综合综述

专知会员服务

47+阅读 · 2024年10月10日

什么可控学习？人大最新《可控学习》综述，信息检索中的方法和应用

什么可控学习？人大最新《可控学习》综述，信息检索中的方法和应用

专知会员服务

7+阅读 · 2024年7月9日

【博士论文】信息论视角下的泛化理论方法，274页pdf

【博士论文】信息论视角下的泛化理论方法，274页pdf

专知会员服务

51+阅读 · 2024年4月28日

【CVPR2024】卷积提示"遇见了语言模型的持续学习

【CVPR2024】卷积提示"遇见了语言模型的持续学习

专知会员服务

18+阅读 · 2024年4月1日

持续学习的研究进展与趋势

持续学习的研究进展与趋势

专知会员服务

46+阅读 · 2024年3月8日

【综述】持续学习与预训练模型综述

【综述】持续学习与预训练模型综述

专知会员服务

54+阅读 · 2024年1月30日

【NeurIPS2022】解决持续学习问题的理论研究

【NeurIPS2022】解决持续学习问题的理论研究

专知会员服务

31+阅读 · 2022年11月7日

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

专知会员服务

56+阅读 · 2020年12月11日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知会员服务

37+阅读 · 2020年2月27日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

32+阅读 · 2022年11月12日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

中科院发布最新迁移学习综述论文，带你全面了解40种迁移学习方法

中科院发布最新迁移学习综述论文，带你全面了解40种迁移学习方法

专知

48+阅读 · 2019年11月12日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

基于信息理论的机器学习

基于信息理论的机器学习

专知

22+阅读 · 2017年11月23日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

40+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于渐进结构化学习的高维信息稀疏表示理论与技术

国家自然科学基金

0+阅读 · 2015年12月31日

面向构建过程的范畴学习模型及其适应性机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂网络上的广义传播过程溯源

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

12+阅读 · 2008年12月31日

An Attention-based Feature Memory Design for Energy-Efficient Continual Learning

Arxiv

0+阅读 · 2月5日

Attention Retention for Continual Learning with Vision Transformers

Arxiv

0+阅读 · 2月5日

Trust Region Continual Learning as an Implicit Meta-Learner

Arxiv

0+阅读 · 2月2日

On The Relationship Between Continual Learning and Long-Tailed Recognition

Arxiv

0+阅读 · 1月30日

Efficient Rehearsal for Continual Learning in ASR via Singular Value Tuning

Arxiv

0+阅读 · 1月26日

Continual Knowledge Adaptation for Reinforcement Learning

Arxiv

0+阅读 · 1月20日

Exploiting Task Relationships in Continual Learning via Transferability-Aware Task Embeddings

Arxiv

0+阅读 · 1月14日

Beyond Sharpness: A Flatness Decomposition Framework for Efficient Continual Learning

Arxiv

0+阅读 · 1月12日

Continual Learning of Achieving Forgetting-free and Positive Knowledge Transfer

Arxiv

0+阅读 · 1月9日

FOREVER: Forgetting Curve-Inspired Memory Replay for Language Model Continual Learning

Arxiv

0+阅读 · 1月7日

VIP会员

文章信息

相关主题

最新内容

《将量子技术集成到移动军事系统与战术作战中心框架》

《将量子技术集成到移动军事系统与战术作战中心框架》

专知会员服务

0+阅读 · 33分钟前

《美国战争部2027财年军事人员预算》

《美国战争部2027财年军事人员预算》

专知会员服务

0+阅读 · 42分钟前

伊朗战争中的电子战

伊朗战争中的电子战

专知会员服务

3+阅读 · 今天7:04

大语言模型平台在国防情报应用中的对比

大语言模型平台在国防情报应用中的对比

专知会员服务

5+阅读 · 今天3:12

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

专知会员服务

5+阅读 · 今天3:00

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

专知会员服务

3+阅读 · 今天2:56

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

专知会员服务

4+阅读 · 今天2:44

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

专知会员服务

7+阅读 · 今天2:37

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

专知会员服务

5+阅读 · 今天2:22

美海军“超配项目”

美海军“超配项目”

专知会员服务

6+阅读 · 今天2:13

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

10+阅读 · 4月21日

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

13+阅读 · 4月21日

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

7+阅读 · 4月21日

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

9+阅读 · 4月21日

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

相关VIP内容

【牛津博士论文】考虑计算成本的可扩展持续深度学习

【牛津博士论文】考虑计算成本的可扩展持续深度学习

专知会员服务

16+阅读 · 2025年3月2日

多模态持续学习的最新进展：综合综述

多模态持续学习的最新进展：综合综述

专知会员服务

47+阅读 · 2024年10月10日

什么可控学习？人大最新《可控学习》综述，信息检索中的方法和应用

什么可控学习？人大最新《可控学习》综述，信息检索中的方法和应用

专知会员服务

7+阅读 · 2024年7月9日

【博士论文】信息论视角下的泛化理论方法，274页pdf

【博士论文】信息论视角下的泛化理论方法，274页pdf

专知会员服务

51+阅读 · 2024年4月28日

【CVPR2024】卷积提示"遇见了语言模型的持续学习

【CVPR2024】卷积提示"遇见了语言模型的持续学习

专知会员服务

18+阅读 · 2024年4月1日

持续学习的研究进展与趋势

持续学习的研究进展与趋势

专知会员服务

46+阅读 · 2024年3月8日

【综述】持续学习与预训练模型综述

【综述】持续学习与预训练模型综述

专知会员服务

54+阅读 · 2024年1月30日

【NeurIPS2022】解决持续学习问题的理论研究

【NeurIPS2022】解决持续学习问题的理论研究

专知会员服务

31+阅读 · 2022年11月7日

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

专知会员服务

56+阅读 · 2020年12月11日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知会员服务

37+阅读 · 2020年2月27日

热门VIP内容

开通专知VIP会员享更多权益服务

《美国战争部2027财年军事人员预算》

大语言模型平台在国防情报应用中的对比

《将量子技术集成到移动军事系统与战术作战中心框架》

伊朗战争中的电子战

相关资讯

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

32+阅读 · 2022年11月12日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

中科院发布最新迁移学习综述论文，带你全面了解40种迁移学习方法

中科院发布最新迁移学习综述论文，带你全面了解40种迁移学习方法

专知

48+阅读 · 2019年11月12日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

基于信息理论的机器学习

基于信息理论的机器学习

专知

22+阅读 · 2017年11月23日

相关论文

An Attention-based Feature Memory Design for Energy-Efficient Continual Learning

Arxiv

0+阅读 · 2月5日

Attention Retention for Continual Learning with Vision Transformers

Arxiv

0+阅读 · 2月5日

Trust Region Continual Learning as an Implicit Meta-Learner

Arxiv

0+阅读 · 2月2日

On The Relationship Between Continual Learning and Long-Tailed Recognition

Arxiv

0+阅读 · 1月30日

Efficient Rehearsal for Continual Learning in ASR via Singular Value Tuning

Arxiv

0+阅读 · 1月26日

Continual Knowledge Adaptation for Reinforcement Learning

Arxiv

0+阅读 · 1月20日

Exploiting Task Relationships in Continual Learning via Transferability-Aware Task Embeddings

Arxiv

0+阅读 · 1月14日

Beyond Sharpness: A Flatness Decomposition Framework for Efficient Continual Learning

Arxiv

0+阅读 · 1月12日

Continual Learning of Achieving Forgetting-free and Positive Knowledge Transfer

Arxiv

0+阅读 · 1月9日

FOREVER: Forgetting Curve-Inspired Memory Replay for Language Model Continual Learning

Arxiv

0+阅读 · 1月7日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

40+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于渐进结构化学习的高维信息稀疏表示理论与技术

国家自然科学基金

0+阅读 · 2015年12月31日

面向构建过程的范畴学习模型及其适应性机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂网络上的广义传播过程溯源

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

12+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员