Quantifying the Impact of Lossy Compression on Neural Generative Surrogate Modeling - 专知论文

会员服务 ·

0

有损压缩 · 存储 · 训练数据 · 数据集 · 神经网络 ·

Quantifying the Impact of Lossy Compression on Neural Generative Surrogate Modeling

翻译：量化有损压缩对神经生成式替代建模的影响

Zhimin Li,Harshitha Menon,Charles Jekel,Valerio Pascucci,Peter Lindstrom

Neural networks are used as generative surrogate models for scientific discovery, which are trainable approximations of scientific simulations. These models enable users to replace time-consuming numerical simulations with learned alternatives, providing quick solutions. However, high-fidelity generative surrogate models require massive training datasets, which can create storage and I/O challenges. Lossy compression is a promising way to reduce this burden, but compression errors may affect the model quality in subtle ways, making it challenging to quantify their impact. In this work, we examine how lossy compression of training data impacts the quality of generative surrogate models. We begin by characterizing the uncertainty inherent in training neural networks, showing that identical training configurations can produce different models. By exploiting this variability, we propose a method to estimate how much compression-induced error a surrogate model can tolerate without affecting its accuracy. Evaluation of two application simulations demonstrates that our approach significantly reduces memory/storage requirements and speeds up training while producing high-quality surrogate models. These results show that lossy compression saves data storage up to 23.7x and 39x with negligible impact on the quality of the surrogate model. Meanwhile, reducing the size of the training data set also enhances the data loading speed and reduces the training time by up to 3x.

翻译：神经网络被用作科学发现的生成式替代模型，这些模型是对科学模拟的可训练近似。它们使用户能够用学习到的替代方案取代耗时的数值模拟，从而提供快速解决方案。然而，高保真生成式替代模型需要大规模训练数据集，这可能导致存储和I/O方面的挑战。有损压缩是减轻这一负担的一种有前景的方法，但压缩误差可能以微妙的方式影响模型质量，使得量化其影响充满挑战。本研究探讨训练数据的有损压缩如何影响生成式替代模型的质量。我们首先刻画神经网络训练中固有的不确定性，表明相同的训练配置可能产生不同的模型。利用这种变异性，我们提出了一种方法，用于估计替代模型在不影响其精度的情况下所能容忍的压缩引入误差。对两个应用模拟的评估表明，我们的方法在生成高质量替代模型的同时，显著降低了内存/存储需求并加速了训练过程。这些结果显示，有损压缩可将数据存储节省高达23.7倍和39倍，而对替代模型质量的影响可忽略不计。同时，训练数据集规模的减小也提升了数据加载速度，并将训练时间缩短了高达3倍。

0

相关内容

有损压缩

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

专知会员服务

12+阅读 · 2025年6月15日

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

专知会员服务

83+阅读 · 2023年4月25日

能耗优化的神经网络轻量化方法研究进展

能耗优化的神经网络轻量化方法研究进展

专知会员服务

27+阅读 · 2023年1月29日

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

专知会员服务

38+阅读 · 2022年12月9日

最新《神经数据压缩导论》综述

最新《神经数据压缩导论》综述

专知会员服务

40+阅读 · 2022年7月19日

深度神经网络模型压缩综述

专知会员服务

118+阅读 · 2020年8月22日

紧凑的神经网络模型设计研究综述

专知会员服务

74+阅读 · 2020年5月21日

【NLP模型压缩方法综述】《A Survey of Methods for Model Compression in NLP》by Madison May

【NLP模型压缩方法综述】《A Survey of Methods for Model Compression in NLP》by Madison May

专知会员服务

43+阅读 · 2020年4月22日

模型压缩究竟在做什么？我们真的需要模型压缩么？

模型压缩究竟在做什么？我们真的需要模型压缩么？

专知会员服务

28+阅读 · 2020年1月16日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

130+阅读 · 2019年10月12日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

基于关系网络的视觉建模：有望替代卷积神经网络

基于关系网络的视觉建模：有望替代卷积神经网络

微软研究院AI头条

10+阅读 · 2019年7月12日

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

专知

28+阅读 · 2019年4月16日

2019年新书推荐-《神经网络与深度学习》-Michael Nielsen

2019年新书推荐-《神经网络与深度学习》-Michael Nielsen

深度学习与NLP

14+阅读 · 2019年2月21日

【最新综述】模型压缩与加速（附论文全文下载）

【最新综述】模型压缩与加速（附论文全文下载）

专知

28+阅读 · 2019年2月14日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

17+阅读 · 2018年9月20日

概览CVPR 2018神经网络图像压缩领域进展

概览CVPR 2018神经网络图像压缩领域进展

论智

13+阅读 · 2018年6月13日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

结构化压缩感知及其在盲信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

临界态对生物神经网络学习、记忆以及模式识别能力的影响

国家自然科学基金

0+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

面向可穿戴设备的压缩感知关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于压缩感知的高精度实时视觉跟踪方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

非线性压缩感知问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

一种低功耗高压缩率测试图形生成方法的实现与应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

Operator Boosting Produces Pareto-Efficient PDE Surrogates

Arxiv

0+阅读 · 6月16日

SAFformer:Improving Spiking Transformer via Active Predictive Filtering

Arxiv

0+阅读 · 6月12日

Can Deep Neural Networks Improve Compression of Very Large Scientific Data?

Arxiv

0+阅读 · 6月12日

Modelling and Verifying Neuronal Archetypes in Rocq

Arxiv

0+阅读 · 5月31日

Reducing the GPU Memory Bottleneck with Lossless Compression for ML -- Extended

Arxiv

0+阅读 · 5月29日

Memorisation, convergence and generalisation in generative models

Arxiv

0+阅读 · 5月20日

Proxy Compression for Language Modeling

Arxiv

0+阅读 · 5月14日

Reduced-order Neural Modeling with Differentiable Simulation for High-Detail Tactile Perception

Arxiv

0+阅读 · 5月6日

Neural networks as fuzzy logic formulas

Arxiv

0+阅读 · 5月4日

Evolutionary fine tuning of quantized convolution-based deep learning models

Arxiv

0+阅读 · 4月19日

VIP会员

文章信息

相关主题

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

0+阅读 · 今天2:42

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

1+阅读 · 今天2:37

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

2+阅读 · 今天2:23

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

5+阅读 · 今天2:21

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

2+阅读 · 今天1:46

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

8+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

相关VIP内容

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

专知会员服务

12+阅读 · 2025年6月15日

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

专知会员服务

83+阅读 · 2023年4月25日

能耗优化的神经网络轻量化方法研究进展

能耗优化的神经网络轻量化方法研究进展

专知会员服务

27+阅读 · 2023年1月29日

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

专知会员服务

38+阅读 · 2022年12月9日

最新《神经数据压缩导论》综述

最新《神经数据压缩导论》综述

专知会员服务

40+阅读 · 2022年7月19日

深度神经网络模型压缩综述

专知会员服务

118+阅读 · 2020年8月22日

紧凑的神经网络模型设计研究综述

专知会员服务

74+阅读 · 2020年5月21日

【NLP模型压缩方法综述】《A Survey of Methods for Model Compression in NLP》by Madison May

【NLP模型压缩方法综述】《A Survey of Methods for Model Compression in NLP》by Madison May

专知会员服务

43+阅读 · 2020年4月22日

模型压缩究竟在做什么？我们真的需要模型压缩么？

模型压缩究竟在做什么？我们真的需要模型压缩么？

专知会员服务

28+阅读 · 2020年1月16日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

130+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

基于关系网络的视觉建模：有望替代卷积神经网络

基于关系网络的视觉建模：有望替代卷积神经网络

微软研究院AI头条

10+阅读 · 2019年7月12日

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

专知

28+阅读 · 2019年4月16日

2019年新书推荐-《神经网络与深度学习》-Michael Nielsen

2019年新书推荐-《神经网络与深度学习》-Michael Nielsen

深度学习与NLP

14+阅读 · 2019年2月21日

【最新综述】模型压缩与加速（附论文全文下载）

【最新综述】模型压缩与加速（附论文全文下载）

专知

28+阅读 · 2019年2月14日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

17+阅读 · 2018年9月20日

概览CVPR 2018神经网络图像压缩领域进展

概览CVPR 2018神经网络图像压缩领域进展

论智

13+阅读 · 2018年6月13日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

相关论文

Operator Boosting Produces Pareto-Efficient PDE Surrogates

Arxiv

0+阅读 · 6月16日

SAFformer:Improving Spiking Transformer via Active Predictive Filtering

Arxiv

0+阅读 · 6月12日

Can Deep Neural Networks Improve Compression of Very Large Scientific Data?

Arxiv

0+阅读 · 6月12日

Modelling and Verifying Neuronal Archetypes in Rocq

Arxiv

0+阅读 · 5月31日

Reducing the GPU Memory Bottleneck with Lossless Compression for ML -- Extended

Arxiv

0+阅读 · 5月29日

Memorisation, convergence and generalisation in generative models

Arxiv

0+阅读 · 5月20日

Proxy Compression for Language Modeling

Arxiv

0+阅读 · 5月14日

Reduced-order Neural Modeling with Differentiable Simulation for High-Detail Tactile Perception

Arxiv

0+阅读 · 5月6日

Neural networks as fuzzy logic formulas

Arxiv

0+阅读 · 5月4日

Evolutionary fine tuning of quantized convolution-based deep learning models

Arxiv

0+阅读 · 4月19日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

结构化压缩感知及其在盲信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

临界态对生物神经网络学习、记忆以及模式识别能力的影响

国家自然科学基金

0+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

面向可穿戴设备的压缩感知关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于压缩感知的高精度实时视觉跟踪方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

非线性压缩感知问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

一种低功耗高压缩率测试图形生成方法的实现与应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员