无需额外数据、Tricks、架构调整，CMU开源首个将ResNet50精度提升至80%+新方法 - 专知VIP

会员服务 ·

0

ResNet · ImageNet (数据集) ·

2020 年 9 月 20 日

无需额外数据、Tricks、架构调整，CMU开源首个将ResNet50精度提升至80%+新方法

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

该文提出一种简单而有效的方法，无需任何tricks，它可以将标准ResNet50的Top1精度提升到80%+。该方法是基于作者之前MEAL(通过判别方式进行知识蒸馏集成)改进而来，作者对MEAL进行了以下两点改进：

(1) 仅在最后的输出部分使用相似性损失与判别损失；

(2) 采用所有老师模型的平均概率作为更强的监督信息进行蒸馏。

该文提到一个非常重要的发现：在蒸馏阶段不应当使用one-hot方式的标签编码。这样一种简单的方案可以取得SOTA性能，且并未用到以下几种常见涨点tricks：(1)类似ResNet50-D的架构改进；(2)额外训练数据；(3) AutoAug、RandAug等；(4)cosine学习率机制；(5)mixup/cutmix数据增广策略；(6) 标签平滑。

在ImageNet数据集上，本文所提方法取得了80.67%的Top1精度(single crop@224)，以极大的优势超越其他同架构方案。该方法可以视作采用知识蒸馏对ResNet50涨点的一个新的基准，该文可谓首个在不改变网路架构、无需额外训练数据的前提下将ResNet提升到超过80%Top1精度的方法。

成为VIP会员查看完整内容

14

相关内容

ResNet

深度学习目标检测方法综述

深度学习目标检测方法综述

专知会员服务

280+阅读 · 2020年8月1日

基于改进卷积神经网络的短文本分类模型

基于改进卷积神经网络的短文本分类模型

专知会员服务

26+阅读 · 2020年7月22日

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

专知会员服务

41+阅读 · 2020年7月21日

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

26+阅读 · 2020年5月7日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

96+阅读 · 2020年3月12日

【Amazon】使用预先训练的Transformer模型进行数据增强，Data Augmentation using Pre-trained Transformer Models

【Amazon】使用预先训练的Transformer模型进行数据增强，Data Augmentation using Pre-trained Transformer Models

专知会员服务

51+阅读 · 2020年3月7日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

【Amazon】使用预先训练的Transformer模型进行数据增强

【Amazon】使用预先训练的Transformer模型进行数据增强

专知会员服务

58+阅读 · 2020年3月6日

【综述】图像分类中的半监督、自监督和非监督技术综述相同点，不同点和组合

【综述】图像分类中的半监督、自监督和非监督技术综述相同点，不同点和组合

专知会员服务

49+阅读 · 2020年2月23日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

伯克利提出数据增强新方法，计算速度提升1000倍

伯克利提出数据增强新方法，计算速度提升1000倍

AI前线

12+阅读 · 2019年6月21日

【学界】大幅减少训练迭代次数，提高泛化能力：IBM提出「新版Dropout」

【学界】大幅减少训练迭代次数，提高泛化能力：IBM提出「新版Dropout」

GAN生成式对抗网络

7+阅读 · 2019年6月7日

谷歌提出新型自动语音识别数据增强大法，直接对频谱图“动刀”，提升模型表现

谷歌提出新型自动语音识别数据增强大法，直接对频谱图“动刀”，提升模型表现

量子位

8+阅读 · 2019年4月28日

提高GAN训练稳定性的9大tricks

提高GAN训练稳定性的9大tricks

人工智能前沿讲习班

13+阅读 · 2019年3月19日

【干货】深度神经网络模型训练中的最新tricks总结(原理与代码汇总)

【干货】深度神经网络模型训练中的最新tricks总结(原理与代码汇总)

GAN生成式对抗网络

37+阅读 · 2019年3月7日

深度神经网络模型训练中的最新tricks总结【原理与代码汇总】

深度神经网络模型训练中的最新tricks总结【原理与代码汇总】

人工智能前沿讲习班

172+阅读 · 2019年3月6日

【学界】李沐等将目标检测绝对精度提升 4%，不牺牲推理速度

【学界】李沐等将目标检测绝对精度提升 4%，不牺牲推理速度

GAN生成式对抗网络

7+阅读 · 2019年2月15日

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

GAN生成式对抗网络

11+阅读 · 2018年6月5日

一文简述ResNet及其多种变体

一文简述ResNet及其多种变体

机器之心

23+阅读 · 2018年4月22日

无需数学背景，读懂ResNet、Inception和Xception三大变革性架构

无需数学背景，读懂ResNet、Inception和Xception三大变革性架构

MOOC

8+阅读 · 2017年8月30日

Revisiting Metric Learning for Few-Shot Image Classification

Arxiv

5+阅读 · 2020年4月16日

A Survey of Methods for Low-Power Deep Learning and Computer Vision

A Survey of Methods for Low-Power Deep Learning and Computer Vision

Arxiv

14+阅读 · 2020年3月24日

A Simple Framework for Contrastive Learning of Visual Representations

Arxiv

21+阅读 · 2020年2月13日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Fast AutoAugment

Fast AutoAugment

Arxiv

5+阅读 · 2019年5月1日

Multi-Head Attention with Disagreement Regularization

Arxiv

9+阅读 · 2018年10月24日

Better and Faster: Knowledge Transfer from Multiple Self-supervised Learning Tasks via Graph Distillation for Video Classification

Arxiv

3+阅读 · 2018年4月26日

No Metrics Are Perfect: Adversarial Reward Learning for Visual Storytelling

Arxiv

7+阅读 · 2018年4月24日

Deep Predictive Coding Network for Object Recognition

Arxiv

6+阅读 · 2018年2月13日

VIP会员

相关主题

ImageNet (数据集)

最新内容

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

3+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

2+阅读 · 6月24日

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

8+阅读 · 6月24日

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

6+阅读 · 6月24日

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

5+阅读 · 6月24日

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

6+阅读 · 6月24日

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

6+阅读 · 6月24日

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

5+阅读 · 6月24日

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

7+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

12+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

6+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

9+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

8+阅读 · 6月23日

相关VIP内容

深度学习目标检测方法综述

深度学习目标检测方法综述

专知会员服务

280+阅读 · 2020年8月1日

基于改进卷积神经网络的短文本分类模型

基于改进卷积神经网络的短文本分类模型

专知会员服务

26+阅读 · 2020年7月22日

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

专知会员服务

41+阅读 · 2020年7月21日

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

26+阅读 · 2020年5月7日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

96+阅读 · 2020年3月12日

【Amazon】使用预先训练的Transformer模型进行数据增强，Data Augmentation using Pre-trained Transformer Models

【Amazon】使用预先训练的Transformer模型进行数据增强，Data Augmentation using Pre-trained Transformer Models

专知会员服务

51+阅读 · 2020年3月7日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

【Amazon】使用预先训练的Transformer模型进行数据增强

【Amazon】使用预先训练的Transformer模型进行数据增强

专知会员服务

58+阅读 · 2020年3月6日

【综述】图像分类中的半监督、自监督和非监督技术综述相同点，不同点和组合

【综述】图像分类中的半监督、自监督和非监督技术综述相同点，不同点和组合

专知会员服务

49+阅读 · 2020年2月23日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

热门VIP内容

开通专知VIP会员享更多权益服务

Agentic RL：框架、实践与长程智能体训练

重新思考无人机时代的生存能力

综述 | 从问答到任务完成：Agent系统与Harness设计

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

相关资讯

伯克利提出数据增强新方法，计算速度提升1000倍

伯克利提出数据增强新方法，计算速度提升1000倍

AI前线

12+阅读 · 2019年6月21日

【学界】大幅减少训练迭代次数，提高泛化能力：IBM提出「新版Dropout」

【学界】大幅减少训练迭代次数，提高泛化能力：IBM提出「新版Dropout」

GAN生成式对抗网络

7+阅读 · 2019年6月7日

谷歌提出新型自动语音识别数据增强大法，直接对频谱图“动刀”，提升模型表现

谷歌提出新型自动语音识别数据增强大法，直接对频谱图“动刀”，提升模型表现

量子位

8+阅读 · 2019年4月28日

提高GAN训练稳定性的9大tricks

提高GAN训练稳定性的9大tricks

人工智能前沿讲习班

13+阅读 · 2019年3月19日

【干货】深度神经网络模型训练中的最新tricks总结(原理与代码汇总)

【干货】深度神经网络模型训练中的最新tricks总结(原理与代码汇总)

GAN生成式对抗网络

37+阅读 · 2019年3月7日

深度神经网络模型训练中的最新tricks总结【原理与代码汇总】

深度神经网络模型训练中的最新tricks总结【原理与代码汇总】

人工智能前沿讲习班

172+阅读 · 2019年3月6日

【学界】李沐等将目标检测绝对精度提升 4%，不牺牲推理速度

【学界】李沐等将目标检测绝对精度提升 4%，不牺牲推理速度

GAN生成式对抗网络

7+阅读 · 2019年2月15日

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

GAN生成式对抗网络

11+阅读 · 2018年6月5日

一文简述ResNet及其多种变体

一文简述ResNet及其多种变体

机器之心

23+阅读 · 2018年4月22日

无需数学背景，读懂ResNet、Inception和Xception三大变革性架构

无需数学背景，读懂ResNet、Inception和Xception三大变革性架构

MOOC

8+阅读 · 2017年8月30日

相关论文

Revisiting Metric Learning for Few-Shot Image Classification

Arxiv

5+阅读 · 2020年4月16日

A Survey of Methods for Low-Power Deep Learning and Computer Vision

A Survey of Methods for Low-Power Deep Learning and Computer Vision

Arxiv

14+阅读 · 2020年3月24日

A Simple Framework for Contrastive Learning of Visual Representations

Arxiv

21+阅读 · 2020年2月13日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Fast AutoAugment

Fast AutoAugment

Arxiv

5+阅读 · 2019年5月1日

Multi-Head Attention with Disagreement Regularization

Arxiv

9+阅读 · 2018年10月24日

Better and Faster: Knowledge Transfer from Multiple Self-supervised Learning Tasks via Graph Distillation for Video Classification

Arxiv

3+阅读 · 2018年4月26日

No Metrics Are Perfect: Adversarial Reward Learning for Visual Storytelling

Arxiv

7+阅读 · 2018年4月24日

Deep Predictive Coding Network for Object Recognition

Arxiv

6+阅读 · 2018年2月13日

微信扫码咨询专知VIP会员