SlimEdge：面向资源受限边缘硬件的性能与设备感知分布式DNN部署 (SlimEdge: Performance and Device Aware Distributed DNN Deployment on Resource-Constrained Edge Hardware) - 专知论文

会员服务 ·

0

边缘 · 资源受限 · 分布式DNN · DNN · 剪枝 ·

SlimEdge: Performance and Device Aware Distributed DNN Deployment on Resource-Constrained Edge Hardware

翻译：SlimEdge：面向资源受限边缘硬件的性能与设备感知分布式DNN部署

Mahadev Sunil Kumar,Arnab Raha,Debayan Das,Gopakumar G,Rounak Chatterjee,Amitava Mukherjee

Distributed deep neural networks (DNNs) have become central to modern computer vision, yet their deployment on resource-constrained edge devices remains hindered by substantial parameter counts, computational demands, and the probability of device failure. Here, we present an approach to the efficient deployment of distributed DNNs that jointly respect hardware limitations, preserve task performance, and remain robust to partial system failures. Our method integrates structured model pruning with a multi-objective optimization framework to tailor network capacity for heterogeneous device constraints, while explicitly accounting for device availability and failure probability during deployment. We demonstrate this framework using Multi-View Convolutional Neural Networks (MVCNN), a state-of-the-art architecture for 3D object recognition, by quantifying the contribution of individual views to classification accuracy and allocating pruning budgets accordingly. Experimental results show that the resulting models satisfy user-specified bounds on accuracy and memory footprint, even under multiple simultaneous device failures. The inference time is reduced by factors up to 4.7x across diverse simulated device configurations. These findings suggest that performance-aware, view-adaptive, and failure-resilient compression provides a viable pathway for deploying complex vision models in distributed edge environments.

翻译：分布式深度神经网络已成为现代计算机视觉的核心，但其在资源受限边缘设备上的部署仍受参数量庞大、计算需求高以及设备故障概率等因素的制约。本文提出一种分布式深度神经网络的高效部署方法，该方法在协同兼顾硬件限制的同时保持任务性能，并对局部系统故障具备鲁棒性。本方法将结构化模型剪枝与多目标优化框架相结合，根据异构设备约束定制网络容量，并在部署过程中显式考虑设备可用性与故障概率。我们采用三维物体识别领域的先进架构——多视角卷积神经网络作为验证框架，通过量化单视角对分类精度的贡献度并相应分配剪枝预算进行实证研究。实验结果表明，即使在多设备并发故障场景下，所得模型仍能满足用户设定的精度与内存占用边界约束。在多种模拟设备配置中，推理时间最高可降低至原时间的4.7倍。这些发现表明，性能感知、视角自适应且具备故障恢复能力的压缩技术为复杂视觉模型在分布式边缘环境中的部署提供了可行路径。

0

相关内容

基于脉冲神经网络的边缘智能

基于脉冲神经网络的边缘智能

专知会员服务

20+阅读 · 2025年7月23日

《面向边缘AI应用的高性能高能效架构探索》156页

《面向边缘AI应用的高性能高能效架构探索》156页

专知会员服务

34+阅读 · 2025年4月12日

《鲁棒高效边缘人工智能：赋能边缘设备智能的新原理与框架》154页

《鲁棒高效边缘人工智能：赋能边缘设备智能的新原理与框架》154页

专知会员服务

31+阅读 · 2025年4月11日

【博士论文】边缘分布式深度神经网络推理

【博士论文】边缘分布式深度神经网络推理

专知会员服务

27+阅读 · 2025年2月26日

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

40+阅读 · 2022年11月14日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

「分布式机器学习系统网络性能优化」研究进展

「分布式机器学习系统网络性能优化」研究进展

专知会员服务

28+阅读 · 2022年10月1日

美国空军研究实验室《探索深度学习系统的脆弱性和稳健性》2022年最新85页技术报告

美国空军研究实验室《探索深度学习系统的脆弱性和稳健性》2022年最新85页技术报告

专知会员服务

110+阅读 · 2022年7月5日

分布式深度学习训练网络综述

专知会员服务

48+阅读 · 2021年2月2日

物联网时代分布式深度学习新方向

物联网时代分布式深度学习新方向

专知会员服务

55+阅读 · 2020年8月30日

分布式核心技术知识图谱，带走不谢

分布式核心技术知识图谱，带走不谢

架构师之路

12+阅读 · 2019年9月23日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

GitHub趋势榜第一！图深度学习数百篇顶会论文最全Get！

GitHub趋势榜第一！图深度学习数百篇顶会论文最全Get！

新智元

45+阅读 · 2019年7月8日

脉冲神经网络（SNN）概述

脉冲神经网络（SNN）概述

人工智能前沿讲习班

62+阅读 · 2019年5月30日

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

专知

28+阅读 · 2019年4月16日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

机器之心

11+阅读 · 2018年3月26日

基于智慧的下一代网络资源优化机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向有源配电网的数据传输优化及智能过滤机制

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心资源利用率敏感的编译方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向绿色数据中心的高效能分布式储能技术

国家自然科学基金

1+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向流程工业的分布式状态估计与输出反馈控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

云架构接入网中面向多业务的计算与无线资源分配研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于认知技术的分层异构网络能效分析与资源分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

DeepCompile: A Compiler-Driven Approach to Optimizing Distributed Deep Learning Training

Arxiv

0+阅读 · 2月19日

Knowledge Graphs-Driven Intelligence for Distributed Decision Systems

Arxiv

0+阅读 · 2月7日

Consensus Protocols for Entanglement-Aware Scheduling in Distributed Quantum Neural Networks

Arxiv

0+阅读 · 2月6日

Adaptive AI-based Decentralized Resource Management in the Cloud-Edge Continuum

Arxiv

0+阅读 · 2月6日

Optimizing Tensor Train Decomposition in DNNs for RISC-V Architectures Using Design Space Exploration and Compiler Optimizations

Arxiv

0+阅读 · 2月2日

Deep Ensembling with No Overhead for either Training or Testing: The All-Round Blessings of Dynamic Sparsity

Arxiv

0+阅读 · 1月27日

Stochastic Modeling and Resource Dimensioning of Multi-Cellular Edge Intelligent Systems

Arxiv

0+阅读 · 1月23日

WISP: Waste- and Interference-Suppressed Distributed Speculative LLM Serving at the Edge via Dynamic Drafting and SLO-Aware Batching

Arxiv

0+阅读 · 1月15日

Enhancing LUT-based Deep Neural Networks Inference through Architecture and Connectivity Optimization

Arxiv

0+阅读 · 1月14日

Where to Split? A Pareto-Front Analysis of DNN Partitioning for Edge Inference

Arxiv

0+阅读 · 1月12日

VIP会员

文章信息

相关主题

相关VIP内容

基于脉冲神经网络的边缘智能

基于脉冲神经网络的边缘智能

专知会员服务

20+阅读 · 2025年7月23日

《面向边缘AI应用的高性能高能效架构探索》156页

《面向边缘AI应用的高性能高能效架构探索》156页

专知会员服务

34+阅读 · 2025年4月12日

《鲁棒高效边缘人工智能：赋能边缘设备智能的新原理与框架》154页

《鲁棒高效边缘人工智能：赋能边缘设备智能的新原理与框架》154页

专知会员服务

31+阅读 · 2025年4月11日

【博士论文】边缘分布式深度神经网络推理

【博士论文】边缘分布式深度神经网络推理

专知会员服务

27+阅读 · 2025年2月26日

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

40+阅读 · 2022年11月14日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

「分布式机器学习系统网络性能优化」研究进展

「分布式机器学习系统网络性能优化」研究进展

专知会员服务

28+阅读 · 2022年10月1日

美国空军研究实验室《探索深度学习系统的脆弱性和稳健性》2022年最新85页技术报告

美国空军研究实验室《探索深度学习系统的脆弱性和稳健性》2022年最新85页技术报告

专知会员服务

110+阅读 · 2022年7月5日

分布式深度学习训练网络综述

专知会员服务

48+阅读 · 2021年2月2日

物联网时代分布式深度学习新方向

物联网时代分布式深度学习新方向

专知会员服务

55+阅读 · 2020年8月30日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

分布式核心技术知识图谱，带走不谢

分布式核心技术知识图谱，带走不谢

架构师之路

12+阅读 · 2019年9月23日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

GitHub趋势榜第一！图深度学习数百篇顶会论文最全Get！

GitHub趋势榜第一！图深度学习数百篇顶会论文最全Get！

新智元

45+阅读 · 2019年7月8日

脉冲神经网络（SNN）概述

脉冲神经网络（SNN）概述

人工智能前沿讲习班

62+阅读 · 2019年5月30日

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

专知

28+阅读 · 2019年4月16日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

机器之心

11+阅读 · 2018年3月26日

相关论文

DeepCompile: A Compiler-Driven Approach to Optimizing Distributed Deep Learning Training

Arxiv

0+阅读 · 2月19日

Knowledge Graphs-Driven Intelligence for Distributed Decision Systems

Arxiv

0+阅读 · 2月7日

Consensus Protocols for Entanglement-Aware Scheduling in Distributed Quantum Neural Networks

Arxiv

0+阅读 · 2月6日

Adaptive AI-based Decentralized Resource Management in the Cloud-Edge Continuum

Arxiv

0+阅读 · 2月6日

Optimizing Tensor Train Decomposition in DNNs for RISC-V Architectures Using Design Space Exploration and Compiler Optimizations

Arxiv

0+阅读 · 2月2日

Deep Ensembling with No Overhead for either Training or Testing: The All-Round Blessings of Dynamic Sparsity

Arxiv

0+阅读 · 1月27日

Stochastic Modeling and Resource Dimensioning of Multi-Cellular Edge Intelligent Systems

Arxiv

0+阅读 · 1月23日

WISP: Waste- and Interference-Suppressed Distributed Speculative LLM Serving at the Edge via Dynamic Drafting and SLO-Aware Batching

Arxiv

0+阅读 · 1月15日

Enhancing LUT-based Deep Neural Networks Inference through Architecture and Connectivity Optimization

Arxiv

0+阅读 · 1月14日

Where to Split? A Pareto-Front Analysis of DNN Partitioning for Edge Inference

Arxiv

0+阅读 · 1月12日

相关基金

基于智慧的下一代网络资源优化机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向有源配电网的数据传输优化及智能过滤机制

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心资源利用率敏感的编译方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向绿色数据中心的高效能分布式储能技术

国家自然科学基金

1+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向流程工业的分布式状态估计与输出反馈控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

云架构接入网中面向多业务的计算与无线资源分配研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于认知技术的分层异构网络能效分析与资源分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员