Neural Architecture Search (NAS), together with model scaling, has shown remarkable progress in designing high accuracy and fast convolutional architecture families. However, as neither NAS nor model scaling considers sufficient hardware architecture details, they do not take full advantage of the emerging datacenter (DC) accelerators. In this paper, we search for fast and accurate CNN model families for efficient inference on DC accelerators. We first analyze DC accelerators and find that existing CNNs suffer from insufficient operational intensity, parallelism, and execution efficiency. These insights let us create a DC-accelerator-optimized search space, with space-to-depth, space-to-batch, hybrid fused convolution structures with vanilla and depthwise convolutions, and block-wise activation functions. On top of our DC accelerator optimized neural architecture search space, we further propose a latency-aware compound scaling (LACS), the first multi-objective compound scaling method optimizing both accuracy and latency. Our LACS discovers that network depth should grow much faster than image size and network width, which is quite different from previous compound scaling results. With the new search space and LACS, our search and scaling on datacenter accelerators results in a new model series named EfficientNet-X. EfficientNet-X is up to more than 2X faster than EfficientNet (a model series with state-of-the-art trade-off on FLOPs and accuracy) on TPUv3 and GPUv100, with comparable accuracy. EfficientNet-X is also up to 7X faster than recent RegNet and ResNeSt on TPUv3 and GPUv100.


翻译:在设计高精度和快速进化建筑家庭方面,NAS(NAS)和模型缩放显示在设计高精度和快速进化建筑家庭方面取得了显著进展。然而,由于NAS(NAS)和模型缩放都不考虑足够的硬件结构细节,它们并没有充分利用新兴的数据中心(DC)加速器。在本文中,我们搜索快速和准确的CNN模型家庭,以便在DC加速器上高效推断。我们首先分析DC加速器,发现现有CNN的操作强度、平行度和执行效率不足。这些洞察让我们创建一个DC加速器优化搜索空间空间结构,空间到深度的硬件结构细节,以及混合的组合变速器加速器加速器。在我们的DC加速器顶端,优化电动加速器建筑搜索空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间空间网络,其最新搜索速度和速度比图像快速的搜索速度要快得多。我们LACS发现网络网络的网络深度比图像搜索和高,而最新的搜索和空间网络空间空间网络空间空间网络的深度也比新的搜索速度要大。

0
下载
关闭预览

相关内容

机器学习系统设计系统评估标准
专知会员服务
46+阅读 · 2020年10月31日
专知会员服务
61+阅读 · 2020年3月19日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
32+阅读 · 2019年10月17日
计算机 | 国际会议信息5条
Call4Papers
3+阅读 · 2019年7月3日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Deep Compression/Acceleration:模型压缩加速论文汇总
极市平台
14+阅读 · 2019年5月15日
目标检测中的Consistent Optimization
极市平台
6+阅读 · 2019年4月23日
图像分类论文与代码大列表
专知
6+阅读 · 2019年2月16日
Faster R-CNN
数据挖掘入门与实战
4+阅读 · 2018年4月20日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Arxiv
0+阅读 · 2021年3月31日
Arxiv
6+阅读 · 2020年10月8日
Arxiv
5+阅读 · 2020年3月16日
Arxiv
6+阅读 · 2018年4月24日
VIP会员
最新内容
非对称优势:美海军开发低成本反无人机技术
专知会员服务
1+阅读 · 40分钟前
《美战争部小企业创新研究(SBIR)计划》
专知会员服务
3+阅读 · 今天2:48
《军事模拟:将军事条令与目标融入AI智能体》
专知会员服务
5+阅读 · 今天2:43
【NTU博士论文】3D人体动作生成
专知会员服务
5+阅读 · 4月24日
以色列军事技术对美国军力发展的持续性赋能
专知会员服务
8+阅读 · 4月24日
《深度强化学习在兵棋推演中的应用》40页报告
专知会员服务
12+阅读 · 4月24日
《多域作战面临复杂现实》
专知会员服务
9+阅读 · 4月24日
《印度的多域作战:条令与能力发展》报告
专知会员服务
4+阅读 · 4月24日
相关资讯
计算机 | 国际会议信息5条
Call4Papers
3+阅读 · 2019年7月3日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Deep Compression/Acceleration:模型压缩加速论文汇总
极市平台
14+阅读 · 2019年5月15日
目标检测中的Consistent Optimization
极市平台
6+阅读 · 2019年4月23日
图像分类论文与代码大列表
专知
6+阅读 · 2019年2月16日
Faster R-CNN
数据挖掘入门与实战
4+阅读 · 2018年4月20日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
【推荐】深度学习目标检测全面综述
机器学习研究会
21+阅读 · 2017年9月13日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Top
微信扫码咨询专知VIP会员