Deployment-Aligned Low-Precision Neural Architecture Search for Spaceborne Edge AI - 专知论文

会员服务 ·

0

精度 · 对齐 · 搜索 · 边缘 · 星载 ·

Deployment-Aligned Low-Precision Neural Architecture Search for Spaceborne Edge AI

翻译：面向星载边缘AI的部署对齐低精度神经架构搜索

Parampuneet Kaur Thind,Vaibhav Katturu,Giacomo Zema,Roberto Del Prete

Designing deep networks that meet strict latency and accuracy constraints on edge accelerators increasingly relies on hardware-aware optimization, including neural architecture search (NAS) guided by device-level metrics. Yet most hardware-aware NAS pipelines still optimize architectures under full-precision assumptions and apply low-precision adaptation only after the search, leading to a mismatch between optimization-time behavior and deployment-time execution on low-precision hardware that can substantially degrade accuracy. We address this limitation by integrating deployment-aligned low-precision training directly into hardware-aware NAS. Candidate architectures are exposed to FP16 numerical constraints during fine-tuning and evaluation, enabling joint optimization of architectural efficiency and numerical robustness without modifying the search space or evolutionary strategy. We evaluate the proposed framework on vessel segmentation for spaceborne maritime monitoring, targeting the Intel Movidius Myriad X Visual Processing Unit (VPU). While post-training precision conversion reduces on-device performance from 0.85 to 0.78 mIoU, deployment-aligned low-precision training achieves 0.826 mIoU on-device for the same architecture (95,791 parameters), recovering approximately two-thirds of deployment-induced accuracy gap without increasing model complexity. These results demonstrate that incorporating deployment-consistent numerical constraints into hardware-aware NAS substantially improves robustness and alignment between optimization and deployment for resource-constrained edge Artificial Intelligence (AI).

翻译：在边缘加速器上设计满足严格延迟和精度约束的深度网络，越来越依赖于硬件感知优化，包括基于设备级指标的神经架构搜索（NAS）。然而，大多数硬件感知NAS流程仍假设全精度条件优化架构，仅在搜索后应用低精度适配，导致优化阶段行为与低精度硬件部署执行不匹配，从而显著降低精度。我们通过将部署对齐的低精度训练直接集成到硬件感知NAS中来解决此限制。在微调和评估过程中，候选架构将暴露于FP16数值约束，从而在不修改搜索空间或进化策略的情况下实现架构效率与数值鲁棒性的联合优化。我们针对星载海事监测的血管分割任务评估所提框架，目标平台为Intel Movidius Myriad X视觉处理单元（VPU）。结果表明，后训练精度转换使设备性能从0.85 mIoU降至0.78 mIoU，而针对相同架构（95,791个参数）的部署对齐低精度训练在设备上达到0.826 mIoU，在无需增加模型复杂度的情况下恢复了约三分之二的部署精度差距。这些结果证明，将部署一致的数值约束纳入硬件感知NAS可显著提升资源受限边缘人工智能（AI）的鲁棒性及优化与部署之间的对齐度。

0

相关内容

基于脉冲神经网络的边缘智能

基于脉冲神经网络的边缘智能

专知会员服务

21+阅读 · 2025年7月23日

《面向边缘AI应用的高性能高能效架构探索》156页

《面向边缘AI应用的高性能高能效架构探索》156页

专知会员服务

37+阅读 · 2025年4月12日

《鲁棒高效边缘人工智能：赋能边缘设备智能的新原理与框架》154页

《鲁棒高效边缘人工智能：赋能边缘设备智能的新原理与框架》154页

专知会员服务

32+阅读 · 2025年4月11日

【博士论文】边缘分布式深度神经网络推理

【博士论文】边缘分布式深度神经网络推理

专知会员服务

27+阅读 · 2025年2月26日

【CMU博士论文】神经架构搜索的搜索算法和搜索空间，141页pdf

【CMU博士论文】神经架构搜索的搜索算法和搜索空间，141页pdf

专知会员服务

39+阅读 · 2022年12月7日

【ECCV2022】高效神经结构搜索的新前沿，106页pdf

【ECCV2022】高效神经结构搜索的新前沿，106页pdf

专知会员服务

29+阅读 · 2022年10月18日

【ICML2021】无训练神经架构搜索

专知会员服务

20+阅读 · 2021年9月16日

最新《神经架构搜索NAS》报告，附46页ppt与视频

最新《神经架构搜索NAS》报告，附46页ppt与视频

专知会员服务

37+阅读 · 2020年12月30日

【NeurIPS 2020 】神经网络结构生成优化

【NeurIPS 2020 】神经网络结构生成优化

专知会员服务

21+阅读 · 2020年10月24日

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

专知会员服务

31+阅读 · 2019年11月25日

《“边缘计算+”技术白皮书》，82页pdf

《“边缘计算+”技术白皮书》，82页pdf

专知

11+阅读 · 2022年8月28日

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

专知

27+阅读 · 2019年11月21日

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

专知

17+阅读 · 2019年9月20日

【NeurIPS 2019】7篇自动化神经网络搜索(NAS)论文简读

【NeurIPS 2019】7篇自动化神经网络搜索(NAS)论文简读

专知

31+阅读 · 2019年9月12日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

谷歌大脑重磅研究：神经结构搜索发现全新特征金字塔架构，超越Mask R-CNN等

谷歌大脑重磅研究：神经结构搜索发现全新特征金字塔架构，超越Mask R-CNN等

新智元

12+阅读 · 2019年4月19日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

机器之心

13+阅读 · 2018年9月1日

陈天奇团队推出开源AI芯片栈VTA，降低芯片设计门槛

陈天奇团队推出开源AI芯片栈VTA，降低芯片设计门槛

AI前线

15+阅读 · 2018年7月13日

高性能低比特视觉搜索及芯片结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于视频图像处理的神经导航空间配准方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Algorithm-hardware co-design of neuromorphic networks with dual memory pathways

Arxiv

0+阅读 · 5月2日

Hardware-Software Co-Design for Event-Driven SNN Deployment on Low-Cost Neuromorphic FPGAs

Arxiv

0+阅读 · 4月24日

MATCHA: Efficient Deployment of Deep Neural Networks on Multi-Accelerator Heterogeneous Edge SoCs

Arxiv

0+阅读 · 4月10日

G-ICSO-NAS: Shifting Gears between Gradient and Swarm for Robust Neural Architecture Search

Arxiv

0+阅读 · 4月1日

Hardware-Algorithm Co-Optimization of Early-Exit Neural Networks for Multi-Core Edge Accelerators

Arxiv

0+阅读 · 3月31日

PowerFlow-DNN: Compiler-Directed Fine-Grained Power Orchestration for End-to-End Edge AI Inference

Arxiv

0+阅读 · 3月25日

AgenticRS-EnsNAS: Ensemble-Decoupled Self-Evolving Architecture Search

Arxiv

0+阅读 · 3月20日

Brain-inspired AI for Edge Intelligence: a systematic review

Arxiv

0+阅读 · 3月19日

Hardware-Aware Neural Architecture Search for Encrypted Traffic Classification on Resource-Constrained Devices

Arxiv

0+阅读 · 3月18日

Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey

Arxiv

0+阅读 · 3月18日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

4+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

5+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

4+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

4+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

基于脉冲神经网络的边缘智能

基于脉冲神经网络的边缘智能

专知会员服务

21+阅读 · 2025年7月23日

《面向边缘AI应用的高性能高能效架构探索》156页

《面向边缘AI应用的高性能高能效架构探索》156页

专知会员服务

37+阅读 · 2025年4月12日

《鲁棒高效边缘人工智能：赋能边缘设备智能的新原理与框架》154页

《鲁棒高效边缘人工智能：赋能边缘设备智能的新原理与框架》154页

专知会员服务

32+阅读 · 2025年4月11日

【博士论文】边缘分布式深度神经网络推理

【博士论文】边缘分布式深度神经网络推理

专知会员服务

27+阅读 · 2025年2月26日

【CMU博士论文】神经架构搜索的搜索算法和搜索空间，141页pdf

【CMU博士论文】神经架构搜索的搜索算法和搜索空间，141页pdf

专知会员服务

39+阅读 · 2022年12月7日

【ECCV2022】高效神经结构搜索的新前沿，106页pdf

【ECCV2022】高效神经结构搜索的新前沿，106页pdf

专知会员服务

29+阅读 · 2022年10月18日

【ICML2021】无训练神经架构搜索

专知会员服务

20+阅读 · 2021年9月16日

最新《神经架构搜索NAS》报告，附46页ppt与视频

最新《神经架构搜索NAS》报告，附46页ppt与视频

专知会员服务

37+阅读 · 2020年12月30日

【NeurIPS 2020 】神经网络结构生成优化

【NeurIPS 2020 】神经网络结构生成优化

专知会员服务

21+阅读 · 2020年10月24日

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

专知会员服务

31+阅读 · 2019年11月25日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

《“边缘计算+”技术白皮书》，82页pdf

《“边缘计算+”技术白皮书》，82页pdf

专知

11+阅读 · 2022年8月28日

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

专知

27+阅读 · 2019年11月21日

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

专知

17+阅读 · 2019年9月20日

【NeurIPS 2019】7篇自动化神经网络搜索(NAS)论文简读

【NeurIPS 2019】7篇自动化神经网络搜索(NAS)论文简读

专知

31+阅读 · 2019年9月12日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

谷歌大脑重磅研究：神经结构搜索发现全新特征金字塔架构，超越Mask R-CNN等

谷歌大脑重磅研究：神经结构搜索发现全新特征金字塔架构，超越Mask R-CNN等

新智元

12+阅读 · 2019年4月19日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

机器之心

13+阅读 · 2018年9月1日

陈天奇团队推出开源AI芯片栈VTA，降低芯片设计门槛

陈天奇团队推出开源AI芯片栈VTA，降低芯片设计门槛

AI前线

15+阅读 · 2018年7月13日

相关论文

Algorithm-hardware co-design of neuromorphic networks with dual memory pathways

Arxiv

0+阅读 · 5月2日

Hardware-Software Co-Design for Event-Driven SNN Deployment on Low-Cost Neuromorphic FPGAs

Arxiv

0+阅读 · 4月24日

MATCHA: Efficient Deployment of Deep Neural Networks on Multi-Accelerator Heterogeneous Edge SoCs

Arxiv

0+阅读 · 4月10日

G-ICSO-NAS: Shifting Gears between Gradient and Swarm for Robust Neural Architecture Search

Arxiv

0+阅读 · 4月1日

Hardware-Algorithm Co-Optimization of Early-Exit Neural Networks for Multi-Core Edge Accelerators

Arxiv

0+阅读 · 3月31日

PowerFlow-DNN: Compiler-Directed Fine-Grained Power Orchestration for End-to-End Edge AI Inference

Arxiv

0+阅读 · 3月25日

AgenticRS-EnsNAS: Ensemble-Decoupled Self-Evolving Architecture Search

Arxiv

0+阅读 · 3月20日

Brain-inspired AI for Edge Intelligence: a systematic review

Arxiv

0+阅读 · 3月19日

Hardware-Aware Neural Architecture Search for Encrypted Traffic Classification on Resource-Constrained Devices

Arxiv

0+阅读 · 3月18日

Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey

Arxiv

0+阅读 · 3月18日

相关基金

高性能低比特视觉搜索及芯片结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于视频图像处理的神经导航空间配准方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员