Recent years have seen the ever-increasing importance of pre-trained models and their downstream training in deep learning research and applications. At the same time, the defense for adversarial examples has been mainly investigated in the context of training from random initialization on simple classification tasks. To better exploit the potential of pre-trained models in adversarial robustness, this paper focuses on the fine-tuning of an adversarially pre-trained model in various classification tasks. Existing research has shown that since the robust pre-trained model has already learned a robust feature extractor, the crucial question is how to maintain the robustness in the pre-trained model when learning the downstream task. We study the model-based and data-based approaches for this goal and find that the two common approaches cannot achieve the objective of improving both generalization and adversarial robustness. Thus, we propose a novel statistics-based approach, Two-WIng NormliSation (TWINS) fine-tuning framework, which consists of two neural networks where one of them keeps the population means and variances of pre-training data in the batch normalization layers. Besides the robust information transfer, TWINS increases the effective learning rate without hurting the training stability since the relationship between a weight norm and its gradient norm in standard batch normalization layer is broken, resulting in a faster escape from the sub-optimal initialization and alleviating the robust overfitting. Finally, TWINS is shown to be effective on a wide range of image classification datasets in terms of both generalization and robustness. Our code is available at https://github.com/ziquanliu/CVPR2023-TWINS.


翻译:近年来,预训练模型及其下游训练在深度学习研究与应用中日益重要。与此同时,针对对抗样本的防御研究主要集中于在简单分类任务上从随机初始化训练的场景。为更好发掘预训练模型在对抗鲁棒性中的潜力,本文聚焦于将对抗预训练模型微调至各类分类任务。现有研究表明,由于鲁棒预训练模型已学习到鲁棒特征提取器,关键问题在于学习下游任务时如何保持预训练模型中的鲁棒性。我们为此目标研究了基于模型和基于数据的方法,发现这两种常见方法无法同时提升泛化性与对抗鲁棒性。因此,我们提出一种新颖的基于统计的方法——双翼归一化(TWINS)微调框架,该框架包含两个神经网络,其中一个在批归一化层中保留预训练数据的总体均值与方差。除鲁棒信息迁移外,TWINS通过打破标准批归一化层中权重范数与其梯度范数之间的关联,在不损害训练稳定性的前提下提升有效学习率,从而加速逃离次优初始化并缓解鲁棒过拟合。最后,TWINS在多种图像分类数据集上展现出了泛化性与鲁棒性的双重有效性。我们的代码已开源至https://github.com/ziquanliu/CVPR2023-TWINS。

0
下载
关闭预览

相关内容

《探索具有对抗性混合的神经网络防御》2023最新79页论文
【AAAI2023】对抗性权重扰动提高图神经网络的泛化能力
专知会员服务
19+阅读 · 2022年12月12日
【AAAI2023】FacT:视觉Transformer上轻量级自适应的因子精调
专知会员服务
17+阅读 · 2022年12月8日
【NeurIPS2022】隐空间变换解决GAN生成分布的非连续性问题
专知会员服务
26+阅读 · 2022年11月30日
DeepMind | 通过去噪来进行分子性质预测的预训练
专知会员服务
13+阅读 · 2022年6月27日
对抗训练理论分析:自适应步长快速对抗训练
PaperWeekly
2+阅读 · 2022年6月23日
探幽深度生成模型的两种方法:VAE和GAN
AI前线
15+阅读 · 2018年3月10日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
Arxiv
12+阅读 · 2018年9月5日
VIP会员
最新内容
AUTOLAB:86亿Token实测前沿模型的长程自动科研能力
乌克兰战场背后的新武器
专知会员服务
4+阅读 · 今天4:55
基于博弈论的陆军人机协同(长文报告)
专知会员服务
10+阅读 · 今天1:54
美国陆军航空兵:以愿景引领转型
专知会员服务
6+阅读 · 今天1:38
《多域战场上反制小型无人机系统》150页
专知会员服务
16+阅读 · 6月11日
战场人工智能:增强陆地作战能力的发现与要求
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员