On The Relationship Between Continual Learning and Long-Tailed Recognition - 专知论文

会员服务 ·

0

识别 · 类别 · 持续学习 · 数据集 · 样本 ·

On The Relationship Between Continual Learning and Long-Tailed Recognition

翻译：长尾识别与持续学习的关系研究

Mahdiyar Molahasani,Michael Greenspan,Ali Etemad

Real-world datasets often exhibit long-tailed distributions, where a few dominant "Head" classes have abundant samples while most "Tail" classes are severely underrepresented, leading to biased learning and poor generalization for the Tail. We present a theoretical framework that reveals a previously undescribed connection between Long-Tailed Recognition (LTR) and Continual Learning (CL), the process of learning sequential tasks without forgetting prior knowledge. Our analysis demonstrates that, for models trained on imbalanced datasets, the weights converge to a bounded neighborhood of those trained exclusively on the Head, with the bound scaling as the inverse square root of the imbalance factor. Leveraging this insight, we introduce Continual Learning for Long-Tailed Recognition (CLTR), a principled approach that employs standard off-the-shelf CL methods to address LTR problems by sequentially learning Head and Tail classes without forgetting the Head. Our theoretical analysis further suggests that CLTR mitigates gradient saturation and improves Tail learning while maintaining strong Head performance. Extensive experiments on CIFAR100-LT, CIFAR10-LT, ImageNet-LT, and Caltech256 validate our theoretical predictions, achieving strong results across various LTR benchmarks. Our work bridges the gap between LTR and CL, providing a principled way to tackle imbalanced data challenges with standard existing CL strategies.

翻译：现实世界的数据集常呈现长尾分布特征：少数主导的"头部"类别拥有充足样本，而多数"尾部"类别样本严重不足，导致模型学习产生偏差且对尾部类别的泛化能力较弱。本文提出一个理论框架，揭示了长尾识别与持续学习之间尚未被描述的内在联系——后者指在不遗忘先前知识的前提下顺序学习多个任务的过程。我们的分析表明，在非平衡数据集上训练的模型，其权重会收敛至仅用头部数据训练所得权重的有界邻域内，该边界尺度与不平衡因子的平方根倒数成正比。基于这一发现，我们提出了面向长尾识别的持续学习方法，该方法通过顺序学习头部与尾部类别（同时保持对头部类别的记忆）来系统解决长尾识别问题。理论分析进一步表明，CLTR 能缓解梯度饱和现象，在保持头部性能的同时提升尾部类别的学习效果。在 CIFAR100-LT、CIFAR10-LT、ImageNet-LT 和 Caltech256 数据集上的大量实验验证了我们的理论预测，并在多个长尾识别基准测试中取得了优异结果。本研究弥合了长尾识别与持续学习领域的理论间隙，为利用现有标准持续学习策略解决数据不平衡问题提供了理论依据。

0

相关内容

联邦长尾学习研究综述

联邦长尾学习研究综述

专知会员服务

15+阅读 · 2025年5月1日

深度长尾学习研究综述

深度长尾学习研究综述

专知会员服务

29+阅读 · 2025年2月12日

《长尾学习》最新2024年综述

《长尾学习》最新2024年综述

专知会员服务

31+阅读 · 2024年8月3日

持续学习的研究进展与趋势

持续学习的研究进展与趋势

专知会员服务

46+阅读 · 2024年3月8日

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

专知会员服务

16+阅读 · 2023年4月6日

持续学习：研究综述

持续学习：研究综述

专知会员服务

83+阅读 · 2023年1月30日

「连续学习Continual learning, CL」最新2022研究综述

「连续学习Continual learning, CL」最新2022研究综述

专知会员服务

85+阅读 · 2022年6月26日

【CVPR 2022】长尾视觉数据识别的嵌套式协同学习方法 Nested Collaborative Learning for Long-Tailed Visual Recognition

【CVPR 2022】长尾视觉数据识别的嵌套式协同学习方法 Nested Collaborative Learning for Long-Tailed Visual Recognition

专知会员服务

13+阅读 · 2022年3月19日

【NUS】深度长尾学习综述，20页pdf172篇文献

【NUS】深度长尾学习综述，20页pdf172篇文献

专知会员服务

59+阅读 · 2021年10月14日

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

专知会员服务

24+阅读 · 2020年4月12日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART III）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART III）

AINLP

25+阅读 · 2019年8月21日

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

AINLP

15+阅读 · 2019年8月12日

论文浅尝 | 学习开发知识图谱中的长期关系依赖 - ICML 2019

论文浅尝 | 学习开发知识图谱中的长期关系依赖 - ICML 2019

开放知识图谱

12+阅读 · 2019年7月17日

【联邦学习】联邦学习的研究及应用、联邦学习的多种可能性

【联邦学习】联邦学习的研究及应用、联邦学习的多种可能性

产业智能官

30+阅读 · 2019年5月24日

长文本表示学习概述

长文本表示学习概述

云栖社区

15+阅读 · 2019年5月9日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

基于神经网络的实体识别和关系抽取联合学习 | PaperWeekly #54

基于神经网络的实体识别和关系抽取联合学习 | PaperWeekly #54

黑龙江大学自然语言处理实验室

19+阅读 · 2017年12月14日

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

40+阅读 · 2015年12月31日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向长尾现象的数据缓存技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于相关性的大数据分类理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

种群遗传学的多人交互式学习研究

国家自然科学基金

0+阅读 · 2014年12月31日

Learning When to Attend: Conditional Memory Access for Long-Context LLMs

Arxiv

0+阅读 · 3月18日

Confusion-Aware Spectral Regularizer for Long-Tailed Recognition

Arxiv

0+阅读 · 3月17日

Deterministic Policy Gradient for Reinforcement Learning with Continuous Time and State

Arxiv

0+阅读 · 3月16日

Lifelong Imitation Learning with Multimodal Latent Replay and Incremental Adjustment

Arxiv

0+阅读 · 3月12日

Long-Tail Knowledge in Large Language Models: Taxonomy, Mechanisms, Interventions and Implications

Arxiv

0+阅读 · 2月18日

TA-KAND: Two-stage Attention Triple Enhancement and U-KAN based Diffusion For Few-shot Knowledge Graph Completion

Arxiv

0+阅读 · 2月13日

Learning to Continually Learn via Meta-learning Agentic Memory Designs

Arxiv

0+阅读 · 2月8日

Degradation of Feature Space in Continual Learning

Arxiv

0+阅读 · 2月6日

Beyond the Majority: Long-tail Imitation Learning for Robotic Manipulation

Arxiv

0+阅读 · 2月6日

Contrastive Continual Learning for Model Adaptability in Internet of Things

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

1+阅读 · 今天15:43

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

1+阅读 · 今天15:41

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

1+阅读 · 今天15:37

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

1+阅读 · 今天15:35

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

4+阅读 · 今天12:11

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

3+阅读 · 今天12:10

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

4+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

5+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

5+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

14+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

8+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

8+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

9+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

12+阅读 · 5月29日

相关VIP内容

联邦长尾学习研究综述

联邦长尾学习研究综述

专知会员服务

15+阅读 · 2025年5月1日

深度长尾学习研究综述

深度长尾学习研究综述

专知会员服务

29+阅读 · 2025年2月12日

《长尾学习》最新2024年综述

《长尾学习》最新2024年综述

专知会员服务

31+阅读 · 2024年8月3日

持续学习的研究进展与趋势

持续学习的研究进展与趋势

专知会员服务

46+阅读 · 2024年3月8日

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

专知会员服务

16+阅读 · 2023年4月6日

持续学习：研究综述

持续学习：研究综述

专知会员服务

83+阅读 · 2023年1月30日

「连续学习Continual learning, CL」最新2022研究综述

「连续学习Continual learning, CL」最新2022研究综述

专知会员服务

85+阅读 · 2022年6月26日

【CVPR 2022】长尾视觉数据识别的嵌套式协同学习方法 Nested Collaborative Learning for Long-Tailed Visual Recognition

【CVPR 2022】长尾视觉数据识别的嵌套式协同学习方法 Nested Collaborative Learning for Long-Tailed Visual Recognition

专知会员服务

13+阅读 · 2022年3月19日

【NUS】深度长尾学习综述，20页pdf172篇文献

【NUS】深度长尾学习综述，20页pdf172篇文献

专知会员服务

59+阅读 · 2021年10月14日

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

专知会员服务

24+阅读 · 2020年4月12日

热门VIP内容

开通专知VIP会员享更多权益服务

比利时发布用于实时战场军事装备识别的离线人工智能系统

超越网格：作战环境对炮兵的影响

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

相关资讯

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART III）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART III）

AINLP

25+阅读 · 2019年8月21日

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

AINLP

15+阅读 · 2019年8月12日

论文浅尝 | 学习开发知识图谱中的长期关系依赖 - ICML 2019

论文浅尝 | 学习开发知识图谱中的长期关系依赖 - ICML 2019

开放知识图谱

12+阅读 · 2019年7月17日

【联邦学习】联邦学习的研究及应用、联邦学习的多种可能性

【联邦学习】联邦学习的研究及应用、联邦学习的多种可能性

产业智能官

30+阅读 · 2019年5月24日

长文本表示学习概述

长文本表示学习概述

云栖社区

15+阅读 · 2019年5月9日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

基于神经网络的实体识别和关系抽取联合学习 | PaperWeekly #54

基于神经网络的实体识别和关系抽取联合学习 | PaperWeekly #54

黑龙江大学自然语言处理实验室

19+阅读 · 2017年12月14日

相关论文

Learning When to Attend: Conditional Memory Access for Long-Context LLMs

Arxiv

0+阅读 · 3月18日

Confusion-Aware Spectral Regularizer for Long-Tailed Recognition

Arxiv

0+阅读 · 3月17日

Deterministic Policy Gradient for Reinforcement Learning with Continuous Time and State

Arxiv

0+阅读 · 3月16日

Lifelong Imitation Learning with Multimodal Latent Replay and Incremental Adjustment

Arxiv

0+阅读 · 3月12日

Long-Tail Knowledge in Large Language Models: Taxonomy, Mechanisms, Interventions and Implications

Arxiv

0+阅读 · 2月18日

TA-KAND: Two-stage Attention Triple Enhancement and U-KAN based Diffusion For Few-shot Knowledge Graph Completion

Arxiv

0+阅读 · 2月13日

Learning to Continually Learn via Meta-learning Agentic Memory Designs

Arxiv

0+阅读 · 2月8日

Degradation of Feature Space in Continual Learning

Arxiv

0+阅读 · 2月6日

Beyond the Majority: Long-tail Imitation Learning for Robotic Manipulation

Arxiv

0+阅读 · 2月6日

Contrastive Continual Learning for Model Adaptability in Internet of Things

Arxiv

0+阅读 · 2月4日

相关基金

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

40+阅读 · 2015年12月31日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向长尾现象的数据缓存技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于相关性的大数据分类理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

种群遗传学的多人交互式学习研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员