Fine-Tuning Regimes Define Distinct Continual Learning Problems - 专知论文

会员服务 ·

0

微调 · 持续学习 · 知识 · 基准 · 子空间 ·

Fine-Tuning Regimes Define Distinct Continual Learning Problems

翻译：微调机制定义不同的持续学习问题

Paul-Tiberiu Iordache,Elena Burceanu

from arxiv, 14 pages, 3 figures

Continual learning (CL) studies how models acquire tasks sequentially while retaining previously learned knowledge. Despite substantial progress in benchmarking CL methods, comparative evaluations typically keep the fine-tuning regime fixed. In this paper, we argue that the fine-tuning regime, defined by the trainable parameter subspace, is itself a key evaluation variable. We formalize adaptation regimes as projected optimization over fixed trainable subspaces, showing that changing the trainable depth alters the effective update signal through which both current task fitting and knowledge preservation operate. This analysis motivates the hypothesis that method comparisons need not be invariant across regimes. We test this hypothesis in task incremental CL, five trainable depth regimes, and four standard methods: online EWC, LwF, SI, and GEM. Across five benchmark datasets, namely MNIST, Fashion MNIST, KMNIST, QMNIST, and CIFAR-100, and across 11 task orders per dataset, we find that the relative ranking of methods is not consistently preserved across regimes. We further show that deeper adaptation regimes are associated with larger update magnitudes, higher forgetting, and a stronger relationship between the two. These results show that comparative conclusions in CL can depend strongly on the chosen fine-tuning regime, motivating regime-aware evaluation protocols that treat trainable depth as an explicit experimental factor.

翻译：持续学习（CL）研究模型如何顺序获取新任务，同时保留先前学到的知识。尽管在持续学习方法的基准测试方面取得了显著进展，但比较评估通常固定微调机制。本文提出，由可训练参数子空间定义的微调机制本身是一个关键的评估变量。我们将适应机制形式化为在固定可训练子空间上的投影优化，表明改变可训练深度会改变影响当前任务拟合与知识保留两者的有效更新信号。这一分析引出假设：方法比较在不同机制下不必保持一致。我们在任务增量持续学习、五种可训练深度机制以及四种标准方法（在线EWC、LwF、SI和GEM）中检验该假设。在五个基准数据集（MNIST、Fashion MNIST、KMNIST、QMNIST和CIFAR-100）上，每个数据集包含11种任务顺序，我们发现方法的相对排名在不同机制下并不一致。我们进一步表明，更深的适应机制与更大的更新幅度、更高的遗忘率以及两者之间更强的相关性相关联。这些结果表明，持续学习中的比较结论可能强烈依赖于所选的微调机制，这促使我们提出机制感知的评估协议，将可训练深度作为显式的实验因素。

0

相关内容

大语言模型持续学习：方法、挑战与机遇

大语言模型持续学习：方法、挑战与机遇

专知会员服务

21+阅读 · 3月16日

【牛津博士论文】考虑计算成本的可扩展持续深度学习

【牛津博士论文】考虑计算成本的可扩展持续深度学习

专知会员服务

16+阅读 · 2025年3月2日

多模态持续学习的最新进展：综合综述

多模态持续学习的最新进展：综合综述

专知会员服务

47+阅读 · 2024年10月10日

什么可控学习？人大最新《可控学习》综述，信息检索中的方法和应用

什么可控学习？人大最新《可控学习》综述，信息检索中的方法和应用

专知会员服务

7+阅读 · 2024年7月9日

【CVPR2024】卷积提示"遇见了语言模型的持续学习

【CVPR2024】卷积提示"遇见了语言模型的持续学习

专知会员服务

18+阅读 · 2024年4月1日

【综述】持续学习与预训练模型综述

【综述】持续学习与预训练模型综述

专知会员服务

55+阅读 · 2024年1月30日

【NeurIPS2022】解决持续学习问题的理论研究

【NeurIPS2022】解决持续学习问题的理论研究

专知会员服务

31+阅读 · 2022年11月7日

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

专知会员服务

56+阅读 · 2020年12月11日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

【谷歌大脑新论文】利用可微摄动优化器进行学习，Learning with Differentiable Perturbed Optimizers

【谷歌大脑新论文】利用可微摄动优化器进行学习，Learning with Differentiable Perturbed Optimizers

专知会员服务

29+阅读 · 2020年2月22日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

在线元学习：通过持续元学习解决传统机器学习方式的致命不足

在线元学习：通过持续元学习解决传统机器学习方式的致命不足

新智元

12+阅读 · 2019年3月3日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

产业智能官

49+阅读 · 2018年7月4日

【强化学习】强化学习/增强学习/再励学习介绍

【强化学习】强化学习/增强学习/再励学习介绍

产业智能官

10+阅读 · 2018年2月23日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

不可忽略缺失机制下的广义矩方法和调整经验似然方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

分数随机微分方程的定性理论研究及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

无穷维随机微分系统的适定性与渐近动力学研究

国家自然科学基金

0+阅读 · 2014年12月31日

随机延迟微分方程数值解的延迟依赖稳定性及自适应技术

国家自然科学基金

0+阅读 · 2014年12月31日

机制转化下的最优停时问题研究---以金融中投资决策分析为例

国家自然科学基金

2+阅读 · 2014年12月31日

连续变量量子误差修正的实验研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

12+阅读 · 2008年12月31日

When Does Structure Matter in Continual Learning? Dimensionality Controls When Modularity Shapes Representational Geometry

Arxiv

0+阅读 · 4月30日

Learning to Forget: Continual Learning with Adaptive Weight Decay

Arxiv

0+阅读 · 4月29日

TSN-Affinity: Similarity-Driven Parameter Reuse for Continual Offline Reinforcement Learning

Arxiv

0+阅读 · 4月28日

On the Theory of Continual Learning with Gradient Descent for Neural Networks

Arxiv

0+阅读 · 4月20日

Beyond Single-Model Optimization: Preserving Plasticity in Continual Reinforcement Learning

Arxiv

0+阅读 · 4月16日

Relative Contrastive Learning for Sequential Recommendation with Similarity-based Positive Pair Selection

Arxiv

0+阅读 · 4月2日

TuneShift-KD: Knowledge Distillation and Transfer for Fine-tuned Models

Arxiv

0+阅读 · 3月25日

General Machine Learning: Theory for Learning Under Variable Regimes

Arxiv

0+阅读 · 3月24日

Learning Progressive Adaptation for Multi-Modal Tracking

Arxiv

0+阅读 · 3月22日

Continual Learning as Shared-Manifold Continuation Under Compatible Shift

Arxiv

0+阅读 · 3月20日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

4+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

5+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

4+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

4+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

大语言模型持续学习：方法、挑战与机遇

大语言模型持续学习：方法、挑战与机遇

专知会员服务

21+阅读 · 3月16日

【牛津博士论文】考虑计算成本的可扩展持续深度学习

【牛津博士论文】考虑计算成本的可扩展持续深度学习

专知会员服务

16+阅读 · 2025年3月2日

多模态持续学习的最新进展：综合综述

多模态持续学习的最新进展：综合综述

专知会员服务

47+阅读 · 2024年10月10日

什么可控学习？人大最新《可控学习》综述，信息检索中的方法和应用

什么可控学习？人大最新《可控学习》综述，信息检索中的方法和应用

专知会员服务

7+阅读 · 2024年7月9日

【CVPR2024】卷积提示"遇见了语言模型的持续学习

【CVPR2024】卷积提示"遇见了语言模型的持续学习

专知会员服务

18+阅读 · 2024年4月1日

【综述】持续学习与预训练模型综述

【综述】持续学习与预训练模型综述

专知会员服务

55+阅读 · 2024年1月30日

【NeurIPS2022】解决持续学习问题的理论研究

【NeurIPS2022】解决持续学习问题的理论研究

专知会员服务

31+阅读 · 2022年11月7日

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

专知会员服务

56+阅读 · 2020年12月11日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

【谷歌大脑新论文】利用可微摄动优化器进行学习，Learning with Differentiable Perturbed Optimizers

【谷歌大脑新论文】利用可微摄动优化器进行学习，Learning with Differentiable Perturbed Optimizers

专知会员服务

29+阅读 · 2020年2月22日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

在线元学习：通过持续元学习解决传统机器学习方式的致命不足

在线元学习：通过持续元学习解决传统机器学习方式的致命不足

新智元

12+阅读 · 2019年3月3日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

产业智能官

49+阅读 · 2018年7月4日

【强化学习】强化学习/增强学习/再励学习介绍

【强化学习】强化学习/增强学习/再励学习介绍

产业智能官

10+阅读 · 2018年2月23日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

相关论文

When Does Structure Matter in Continual Learning? Dimensionality Controls When Modularity Shapes Representational Geometry

Arxiv

0+阅读 · 4月30日

Learning to Forget: Continual Learning with Adaptive Weight Decay

Arxiv

0+阅读 · 4月29日

TSN-Affinity: Similarity-Driven Parameter Reuse for Continual Offline Reinforcement Learning

Arxiv

0+阅读 · 4月28日

On the Theory of Continual Learning with Gradient Descent for Neural Networks

Arxiv

0+阅读 · 4月20日

Beyond Single-Model Optimization: Preserving Plasticity in Continual Reinforcement Learning

Arxiv

0+阅读 · 4月16日

Relative Contrastive Learning for Sequential Recommendation with Similarity-based Positive Pair Selection

Arxiv

0+阅读 · 4月2日

TuneShift-KD: Knowledge Distillation and Transfer for Fine-tuned Models

Arxiv

0+阅读 · 3月25日

General Machine Learning: Theory for Learning Under Variable Regimes

Arxiv

0+阅读 · 3月24日

Learning Progressive Adaptation for Multi-Modal Tracking

Arxiv

0+阅读 · 3月22日

Continual Learning as Shared-Manifold Continuation Under Compatible Shift

Arxiv

0+阅读 · 3月20日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

不可忽略缺失机制下的广义矩方法和调整经验似然方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

分数随机微分方程的定性理论研究及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

无穷维随机微分系统的适定性与渐近动力学研究

国家自然科学基金

0+阅读 · 2014年12月31日

随机延迟微分方程数值解的延迟依赖稳定性及自适应技术

国家自然科学基金

0+阅读 · 2014年12月31日

机制转化下的最优停时问题研究---以金融中投资决策分析为例

国家自然科学基金

2+阅读 · 2014年12月31日

连续变量量子误差修正的实验研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

12+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员