CATRO: Channel Pruning via Class-Aware Trace Ratio Optimization - 专知论文

会员服务 ·

0

剪枝 · 通道 · 计算成本 · 类别 · 迭代优化 ·

2023 年 3 月 30 日

CATRO: Channel Pruning via Class-Aware Trace Ratio Optimization

翻译：CATRO：基于类别感知迹比优化的通道剪枝

Wenzheng Hu,Zhengping Che,Ning Liu,Mingyang Li,Jian Tang,Changshui Zhang,Jianqiang Wang

from arxiv, Paper accepted by IEEE Transactions on Neural Networks and Learning Systems (TNNLS)

Deep convolutional neural networks are shown to be overkill with high parametric and computational redundancy in many application scenarios, and an increasing number of works have explored model pruning to obtain lightweight and efficient networks. However, most existing pruning approaches are driven by empirical heuristic and rarely consider the joint impact of channels, leading to unguaranteed and suboptimal performance. In this paper, we propose a novel channel pruning method via Class-Aware Trace Ratio Optimization (CATRO) to reduce the computational burden and accelerate the model inference. Utilizing class information from a few samples, CATRO measures the joint impact of multiple channels by feature space discriminations and consolidates the layer-wise impact of preserved channels. By formulating channel pruning as a submodular set function maximization problem, CATRO solves it efficiently via a two-stage greedy iterative optimization procedure. More importantly, we present theoretical justifications on convergence of CATRO and performance of pruned networks. Experimental results demonstrate that CATRO achieves higher accuracy with similar computation cost or lower computation cost with similar accuracy than other state-of-the-art channel pruning algorithms. In addition, because of its class-aware property, CATRO is suitable to prune efficient networks adaptively for various classification subtasks, enhancing handy deployment and usage of deep networks in real-world applications.

翻译：深度卷积神经网络在许多应用场景中被证明存在参数和计算冗余过高的问题，越来越多的研究通过模型剪枝来获得轻量高效的网络。然而，现有大多数剪枝方法依赖经验启发式策略，且很少考虑通道间的联合影响，导致性能无法保证且非最优。本文提出一种新颖的基于类别感知迹比优化（CATRO）的通道剪枝方法，旨在降低计算负担并加速模型推理。通过利用少量样本的类别信息，CATRO 借助特征空间判别性度量多个通道的联合影响，并整合保留通道的逐层影响。将通道剪枝建模为子模集函数最大化问题后，CATRO 通过两阶段贪心迭代优化过程高效求解。更重要的是，我们给出了 CATRO 收敛性及剪枝网络性能的理论证明。实验结果表明，与其他先进通道剪枝算法相比，CATRO 在相近计算成本下实现更高精度，或在相近精度下实现更低计算成本。此外，因其类别感知特性，CATRO 能够自适应地为各种分类子任务剪枝高效网络，从而促进深度网络在现实应用中的便捷部署与使用。

0

相关内容

深度学习如何用在边缘设备上？苏黎世联邦理工Zhongnan博士论文《在边缘设备上使用深度学习》，182页pdf

深度学习如何用在边缘设备上？苏黎世联邦理工Zhongnan博士论文《在边缘设备上使用深度学习》，182页pdf

专知会员服务

91+阅读 · 2022年10月22日

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

专知会员服务

30+阅读 · 2022年7月15日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

【SIGGRAPH 2022】域增强的任意图像风格对比迁移方法

【SIGGRAPH 2022】域增强的任意图像风格对比迁移方法

专知会员服务

26+阅读 · 2022年4月20日

【CVPR2022】MSDN: 零样本学习的互语义蒸馏网络

【CVPR2022】MSDN: 零样本学习的互语义蒸馏网络

专知会员服务

21+阅读 · 2022年3月8日

【AAAI2022】跨域少样本图分类

【AAAI2022】跨域少样本图分类

专知会员服务

30+阅读 · 2022年1月22日

WSDM2022 | DualDE：基于知识图谱蒸馏的低成本推理

WSDM2022 | DualDE：基于知识图谱蒸馏的低成本推理

专知会员服务

19+阅读 · 2022年1月20日

【CVPR2021】基于跨任务场景结构知识迁移的单张深度图像超分辨率方法

专知会员服务

18+阅读 · 2021年3月23日

【CVPR 2020 Oral】小样本类增量学习

专知会员服务

112+阅读 · 2020年6月26日

【ICCV 2019】基于元学习的自动化神经网络通道 MetaPruning: Meta Learning for Automatic Neural Network Channel Pruning

【ICCV 2019】基于元学习的自动化神经网络通道 MetaPruning: Meta Learning for Automatic Neural Network Channel Pruning

专知会员服务

17+阅读 · 2019年11月17日

深度学习如何用在边缘设备上？苏黎世联邦理工Zhongnan博士论文《在边缘设备上使用深度学习》，182页pdf

深度学习如何用在边缘设备上？苏黎世联邦理工Zhongnan博士论文《在边缘设备上使用深度学习》，182页pdf

专知

4+阅读 · 2022年10月22日

论文浅尝 | 记忆推理：最近邻知识图谱嵌入

论文浅尝 | 记忆推理：最近邻知识图谱嵌入

开放知识图谱

2+阅读 · 2022年7月23日

卷积核扩大到51x51，新型CNN架构SLaK反击Transformer

卷积核扩大到51x51，新型CNN架构SLaK反击Transformer

PaperWeekly

0+阅读 · 2022年7月20日

谁说学生模型就得小？稀疏化DAN模型推理可提速600倍

谁说学生模型就得小？稀疏化DAN模型推理可提速600倍

PaperWeekly

0+阅读 · 2022年6月3日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

【CVPR 2020 Oral】小样本类增量学习

【CVPR 2020 Oral】小样本类增量学习

专知

20+阅读 · 2020年6月26日

灾难性遗忘问题新视角：迁移-干扰平衡

灾难性遗忘问题新视角：迁移-干扰平衡

CreateAMind

17+阅读 · 2019年7月6日

用孪生网络、对比损失和三重损失进行人脸识别的单样本学习

用孪生网络、对比损失和三重损失进行人脸识别的单样本学习

AI前线

16+阅读 · 2019年6月17日

南邮提出实时语义分割的轻量级网络：LEDNET，可达 71 FPS！70.6% class mIoU！即将开源

南邮提出实时语义分割的轻量级网络：LEDNET，可达 71 FPS！70.6% class mIoU！即将开源

极市平台

17+阅读 · 2019年5月10日

深度网络自我学习，最终实现更少样本的学习

深度网络自我学习，最终实现更少样本的学习

计算机视觉战队

12+阅读 · 2018年7月30日

总变差正则化模型的区域分解算法及其医学图像应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于多通道深度卷积神经网络的人体行为分析研究

国家自然科学基金

6+阅读 · 2015年12月31日

多任务学习的理论分析与应用

国家自然科学基金

6+阅读 · 2013年12月31日

适应大数据处理的概率特征映射研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于超稀疏结构学习的压缩感知重建研究

国家自然科学基金

5+阅读 · 2013年12月31日

具有不确定性信息的一分类和多分类算法的研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于流程模拟器和列队竞争算法的并行优化方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

无线传感器网络中的若干计算几何问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于改进的概率神经网络的分类预测方法的理论、算法与应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于谓词规划树的规划方法的研究

国家自然科学基金

1+阅读 · 2009年12月31日

A Comprehensive Review of YOLO: From YOLOv1 and Beyond

Arxiv

0+阅读 · 2023年5月19日

Non-Orthogonal Multiple Access For Near-Field Communications

Arxiv

0+阅读 · 2023年5月19日

Worst-Case VCG Redistribution Mechanism Design Based on the Lottery Ticket Hypothesis

Arxiv

0+阅读 · 2023年5月18日

Robust Power Allocation for Integrated Visible Light Positioning and Communication Networks

Arxiv

0+阅读 · 2023年5月17日

Measuring ancient technological complexity and its cognitive implications using Petri nets

Arxiv

0+阅读 · 2023年5月16日

A Survey of Quantization Methods for Efficient Neural Network Inference

Arxiv

22+阅读 · 2021年6月21日

L^2-GCN: Layer-Wise and Learned Efficient Training of Graph Convolutional Networks

L^2-GCN: Layer-Wise and Learned Efficient Training of Graph Convolutional Networks

Arxiv

16+阅读 · 2020年3月30日

Dynamic Graph Neural Networks

Arxiv

24+阅读 · 2018年10月24日

Graph Convolutional Networks for Text Classification

Arxiv

12+阅读 · 2018年9月15日

Contextual and Position-Aware Factorization Machines for Sentiment Classification

Arxiv

13+阅读 · 2018年1月18日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

2+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

4+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

3+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

深度学习如何用在边缘设备上？苏黎世联邦理工Zhongnan博士论文《在边缘设备上使用深度学习》，182页pdf

深度学习如何用在边缘设备上？苏黎世联邦理工Zhongnan博士论文《在边缘设备上使用深度学习》，182页pdf

专知会员服务

91+阅读 · 2022年10月22日

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

专知会员服务

30+阅读 · 2022年7月15日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

【SIGGRAPH 2022】域增强的任意图像风格对比迁移方法

【SIGGRAPH 2022】域增强的任意图像风格对比迁移方法

专知会员服务

26+阅读 · 2022年4月20日

【CVPR2022】MSDN: 零样本学习的互语义蒸馏网络

【CVPR2022】MSDN: 零样本学习的互语义蒸馏网络

专知会员服务

21+阅读 · 2022年3月8日

【AAAI2022】跨域少样本图分类

【AAAI2022】跨域少样本图分类

专知会员服务

30+阅读 · 2022年1月22日

WSDM2022 | DualDE：基于知识图谱蒸馏的低成本推理

WSDM2022 | DualDE：基于知识图谱蒸馏的低成本推理

专知会员服务

19+阅读 · 2022年1月20日

【CVPR2021】基于跨任务场景结构知识迁移的单张深度图像超分辨率方法

专知会员服务

18+阅读 · 2021年3月23日

【CVPR 2020 Oral】小样本类增量学习

专知会员服务

112+阅读 · 2020年6月26日

【ICCV 2019】基于元学习的自动化神经网络通道 MetaPruning: Meta Learning for Automatic Neural Network Channel Pruning

【ICCV 2019】基于元学习的自动化神经网络通道 MetaPruning: Meta Learning for Automatic Neural Network Channel Pruning

专知会员服务

17+阅读 · 2019年11月17日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

深度学习如何用在边缘设备上？苏黎世联邦理工Zhongnan博士论文《在边缘设备上使用深度学习》，182页pdf

深度学习如何用在边缘设备上？苏黎世联邦理工Zhongnan博士论文《在边缘设备上使用深度学习》，182页pdf

专知

4+阅读 · 2022年10月22日

论文浅尝 | 记忆推理：最近邻知识图谱嵌入

论文浅尝 | 记忆推理：最近邻知识图谱嵌入

开放知识图谱

2+阅读 · 2022年7月23日

卷积核扩大到51x51，新型CNN架构SLaK反击Transformer

卷积核扩大到51x51，新型CNN架构SLaK反击Transformer

PaperWeekly

0+阅读 · 2022年7月20日

谁说学生模型就得小？稀疏化DAN模型推理可提速600倍

谁说学生模型就得小？稀疏化DAN模型推理可提速600倍

PaperWeekly

0+阅读 · 2022年6月3日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

【CVPR 2020 Oral】小样本类增量学习

【CVPR 2020 Oral】小样本类增量学习

专知

20+阅读 · 2020年6月26日

灾难性遗忘问题新视角：迁移-干扰平衡

灾难性遗忘问题新视角：迁移-干扰平衡

CreateAMind

17+阅读 · 2019年7月6日

用孪生网络、对比损失和三重损失进行人脸识别的单样本学习

用孪生网络、对比损失和三重损失进行人脸识别的单样本学习

AI前线

16+阅读 · 2019年6月17日

南邮提出实时语义分割的轻量级网络：LEDNET，可达 71 FPS！70.6% class mIoU！即将开源

南邮提出实时语义分割的轻量级网络：LEDNET，可达 71 FPS！70.6% class mIoU！即将开源

极市平台

17+阅读 · 2019年5月10日

深度网络自我学习，最终实现更少样本的学习

深度网络自我学习，最终实现更少样本的学习

计算机视觉战队

12+阅读 · 2018年7月30日

相关论文

A Comprehensive Review of YOLO: From YOLOv1 and Beyond

Arxiv

0+阅读 · 2023年5月19日

Non-Orthogonal Multiple Access For Near-Field Communications

Arxiv

0+阅读 · 2023年5月19日

Worst-Case VCG Redistribution Mechanism Design Based on the Lottery Ticket Hypothesis

Arxiv

0+阅读 · 2023年5月18日

Robust Power Allocation for Integrated Visible Light Positioning and Communication Networks

Arxiv

0+阅读 · 2023年5月17日

Measuring ancient technological complexity and its cognitive implications using Petri nets

Arxiv

0+阅读 · 2023年5月16日

A Survey of Quantization Methods for Efficient Neural Network Inference

Arxiv

22+阅读 · 2021年6月21日

L^2-GCN: Layer-Wise and Learned Efficient Training of Graph Convolutional Networks

L^2-GCN: Layer-Wise and Learned Efficient Training of Graph Convolutional Networks

Arxiv

16+阅读 · 2020年3月30日

Dynamic Graph Neural Networks

Arxiv

24+阅读 · 2018年10月24日

Graph Convolutional Networks for Text Classification

Arxiv

12+阅读 · 2018年9月15日

Contextual and Position-Aware Factorization Machines for Sentiment Classification

Arxiv

13+阅读 · 2018年1月18日

相关基金

总变差正则化模型的区域分解算法及其医学图像应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于多通道深度卷积神经网络的人体行为分析研究

国家自然科学基金

6+阅读 · 2015年12月31日

多任务学习的理论分析与应用

国家自然科学基金

6+阅读 · 2013年12月31日

适应大数据处理的概率特征映射研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于超稀疏结构学习的压缩感知重建研究

国家自然科学基金

5+阅读 · 2013年12月31日

具有不确定性信息的一分类和多分类算法的研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于流程模拟器和列队竞争算法的并行优化方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

无线传感器网络中的若干计算几何问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于改进的概率神经网络的分类预测方法的理论、算法与应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于谓词规划树的规划方法的研究

国家自然科学基金

1+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员