Despite significant advances, the performance of state-of-the-art continual learning approaches hinges on the unrealistic scenario of fully labeled data. In this paper, we tackle this challenge and propose an approach for continual semi-supervised learning--a setting where not all the data samples are labeled. A primary issue in this scenario is the model forgetting representations of unlabeled data and overfitting the labeled samples. We leverage the power of nearest-neighbor classifiers to nonlinearly partition the feature space and flexibly model the underlying data distribution thanks to its non-parametric nature. This enables the model to learn a strong representation for the current task, and distill relevant information from previous tasks. We perform a thorough experimental evaluation and show that our method outperforms all the existing approaches by large margins, setting a solid state of the art on the continual semi-supervised learning paradigm. For example, on CIFAR-100 we surpass several others even when using at least 30 times less supervision (0.8% vs. 25% of annotations). Finally, our method works well on both low and high resolution images and scales seamlessly to more complex datasets such as ImageNet-100. The code is publicly available on https://github.com/kangzhiq/NNCSL


翻译:尽管取得了显著进展,最先进的持续学习方法仍依赖于全标注数据这一不切实际的场景。本文针对这一挑战,提出了一种面向持续半监督学习(即并非所有数据样本都带有标注)的方法。该场景的核心问题在于模型会遗忘未标注数据的表征,并对已标注样本过拟合。我们利用最近邻分类器的能力来非线性划分特征空间,并凭借其非参数特性灵活建模底层数据分布。这使得模型能够为当前任务学习强表征,同时从先前任务中提取相关信息。通过详尽的实验评估,我们证明所提方法以大幅优势超越所有现有方法,为持续半监督学习范式奠定了坚实的业界最佳水平。例如,在CIFAR-100数据集上,即便使用至少30倍更少的监督信号(0.8% vs 25%的标注比例),我们的方法仍优于多个对比方法。最后,本方法在低分辨率与高分辨率图像上均表现优异,并能无缝扩展至ImageNet-100等更复杂的数据集。代码已开源发布在https://github.com/kangzhiq/NNCSL。

0
下载
关闭预览

相关内容

专知会员服务
19+阅读 · 2021年9月19日
专知会员服务
32+阅读 · 2021年7月15日
专知会员服务
26+阅读 · 2021年5月23日
专知会员服务
33+阅读 · 2021年3月7日
专知会员服务
45+阅读 · 2021年1月31日
【Google论文】ALBERT:自我监督学习语言表达的精简BERT
专知会员服务
24+阅读 · 2019年11月4日
CVPR 2022 | 元学习在图像回归任务的表现
PaperWeekly
1+阅读 · 2022年6月11日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2023年5月25日
Learning Embedding Adaptation for Few-Shot Learning
Arxiv
17+阅读 · 2018年12月10日
Arxiv
11+阅读 · 2018年7月8日
VIP会员
最新内容
乌克兰战场背后的新武器
专知会员服务
5+阅读 · 6月12日
基于博弈论的陆军人机协同(长文报告)
专知会员服务
12+阅读 · 6月12日
美国陆军航空兵:以愿景引领转型
专知会员服务
7+阅读 · 6月12日
《多域战场上反制小型无人机系统》150页
专知会员服务
18+阅读 · 6月11日
相关VIP内容
专知会员服务
19+阅读 · 2021年9月19日
专知会员服务
32+阅读 · 2021年7月15日
专知会员服务
26+阅读 · 2021年5月23日
专知会员服务
33+阅读 · 2021年3月7日
专知会员服务
45+阅读 · 2021年1月31日
【Google论文】ALBERT:自我监督学习语言表达的精简BERT
专知会员服务
24+阅读 · 2019年11月4日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员