Enabling Homomorphic Analytical Operations on Compressed Scientific Data with Multi-stage Decompression - 专知论文

会员服务 ·

0

操作 · 分析 · 同态 · 误差可控 · 可控 ·

Enabling Homomorphic Analytical Operations on Compressed Scientific Data with Multi-stage Decompression

翻译：支持多级解压缩的科学数据同态分析操作

Xuan Wu,Sheng Di,Tripti Agarwal,Kai Zhao,Xin Liang,Franck Cappello

from arxiv, ICDE 2026

Error-controlled lossy compressors have been widely used in scientific applications to reduce the unprecedented size of scientific data while keeping data distortion within a user-specified threshold. While they significantly mitigate the pressure for data storage and transmission, they prolong the time to access the data because decompression is required to transform the binary compressed data into meaningful floating-point numbers. This incurs noticeable overhead for common analytical operations on scientific data that extract or derive useful information, because the time cost of the operations could be much lower than that of decompression. In this work, we design an error-controlled lossy compression and analytical framework that features multi-stage decompression and homomorphic analytical operation algorithms on intermediate decompressed data for reduced data access latency. Our contributions are threefold. (1) We abstract a generic compression pipeline with partial decompression to multiple intermediate data representations and implement four instances based on state-of-the-art high-throughput scientific data compressors. (2) We carefully design homomorphic algorithms to enable direct operations on intermediate decompressed data for three types of analytical operations on scientific data. (3) We evaluate our approach using five real-world scientific datasets. Experimental evaluations demonstrate that our method achieves significant speedups when performing analytical operations on compressed scientific data across all three targeted analytical operation types.

翻译：误差可控的有损压缩器已广泛应用于科学应用中，以在保持数据失真在用户指定阈值内的前提下，减少科学数据前所未有的规模。虽然它们显著缓解了数据存储和传输的压力，但由于需要解压缩将二进制压缩数据转换为有意义的浮点数，从而延长了数据访问时间。这给常见的科学数据分析操作（提取或推导有用信息）带来了显著开销，因为操作的时间成本可能远低于解压缩。本研究设计了一种误差可控的有损压缩与分析框架，其特点在于多级解压缩以及对中间解压缩数据的同态分析操作算法，以降低数据访问延迟。我们的贡献包括三方面：（1）抽象出一个具有部分解压缩至多种中间数据表示的通用压缩管道，并基于最先进的高通量科学数据压缩器实现了四个实例；（2）精心设计了同态算法，实现对中间解压缩数据的直接操作，涵盖三种类型的科学数据分析操作；（3）使用五个真实科学数据集评估了该方法。实验评估表明，在所有三种目标分析操作类型上，该方法对压缩科学数据执行分析操作时均实现了显著加速。

0

相关内容

《可解释人工智能在人工智能辅助决策中的作用综述》

《可解释人工智能在人工智能辅助决策中的作用综述》

专知会员服务

62+阅读 · 2024年1月4日

【牛津大学博士论文】变分自编码器: 监督、校准和多模态学习的变分自编码器，179页pdf

【牛津大学博士论文】变分自编码器: 监督、校准和多模态学习的变分自编码器，179页pdf

专知会员服务

38+阅读 · 2023年6月21日

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

专知会员服务

83+阅读 · 2023年4月25日

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

专知会员服务

37+阅读 · 2022年12月9日

《用于增强压缩技术和计算机视觉应用的卷积神经网络的优化》美国空军研究实验室、戴顿大学2022最新85页论文

《用于增强压缩技术和计算机视觉应用的卷积神经网络的优化》美国空军研究实验室、戴顿大学2022最新85页论文

专知会员服务

25+阅读 · 2022年11月8日

《高压缩分支信道极化合成孔径雷达的理论与设计》2022最新180页博士论文，美国空军技术学院

《高压缩分支信道极化合成孔径雷达的理论与设计》2022最新180页博士论文，美国空军技术学院

专知会员服务

18+阅读 · 2022年10月22日

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

专知会员服务

24+阅读 · 2022年8月2日

最新《神经数据压缩导论》综述

最新《神经数据压缩导论》综述

专知会员服务

39+阅读 · 2022年7月19日

到底什么是有用的ML可解释性？伯克利郁彬高徒Singh68页博士论文《现实世界的机器学习中有用的可解释性》全面综述可解释性技术

到底什么是有用的ML可解释性？伯克利郁彬高徒Singh68页博士论文《现实世界的机器学习中有用的可解释性》全面综述可解释性技术

专知会员服务

119+阅读 · 2022年5月16日

【AAAI2020论文】小样本网络压缩，Few Shot Network Compression via Cross Distillation (附pdf）

专知会员服务

26+阅读 · 2019年11月23日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

简述多种降维算法

简述多种降维算法

算法与数学之美

11+阅读 · 2018年9月23日

一文读懂图像压缩算法

一文读懂图像压缩算法

七月在线实验室

17+阅读 · 2018年5月2日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于随机相位调制的自然场景压缩成像方法与实现研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于贝叶斯统计的遥感影像在轨特征提取与压缩传输

国家自然科学基金

0+阅读 · 2015年12月31日

可压缩多介质流体的真正多维高保真算法

国家自然科学基金

0+阅读 · 2015年12月31日

面向可穿戴设备的压缩感知关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据跨媒体检索的多模态哈希学习方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多数据中心环境中科学大数据应用的数据布局与执行优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性压缩感知问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

压缩感知与稀疏信号恢复

国家自然科学基金

2+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

Scale-Adaptive Generative Flows for Multiscale Scientific Data

Arxiv

0+阅读 · 6月4日

Diagonal Scaling: A Multi-Dimensional Resource Model and Optimization Framework for Distributed Databases

Diagonal Scaling: A Multi-Dimensional Resource Model and Optimization Framework for Distributed Databases

Arxiv

0+阅读 · 5月4日

Adaptive Transform Coding for Semantic Compression

Arxiv

0+阅读 · 4月29日

Calibrated Persistent Homology Tests for High-dimensional Collapse Detection

Arxiv

0+阅读 · 4月28日

Lossless Compression via Chained Lightweight Neural Predictors with Information Inheritance

Arxiv

0+阅读 · 4月16日

The Sample Complexity of Lossless Data Compression

Arxiv

0+阅读 · 4月10日

Preserving Discrete Morse-Smale Complexes in Error-Bounded Lossy Compression

Arxiv

0+阅读 · 4月8日

EXaCTz: Guaranteed Extremum Graph and Contour Tree Preservation for Distributed- and GPU-Parallel Lossy Compression

Arxiv

0+阅读 · 4月1日

Fast Topology-Aware Lossy Data Compression with Full Preservation of Critical Points and Local Order

Arxiv

0+阅读 · 3月27日

Analyzing Decoders for Quantum Error Correction

Arxiv

0+阅读 · 3月20日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

4+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

6+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

22+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

《可解释人工智能在人工智能辅助决策中的作用综述》

《可解释人工智能在人工智能辅助决策中的作用综述》

专知会员服务

62+阅读 · 2024年1月4日

【牛津大学博士论文】变分自编码器: 监督、校准和多模态学习的变分自编码器，179页pdf

【牛津大学博士论文】变分自编码器: 监督、校准和多模态学习的变分自编码器，179页pdf

专知会员服务

38+阅读 · 2023年6月21日

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

专知会员服务

83+阅读 · 2023年4月25日

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

专知会员服务

37+阅读 · 2022年12月9日

《用于增强压缩技术和计算机视觉应用的卷积神经网络的优化》美国空军研究实验室、戴顿大学2022最新85页论文

《用于增强压缩技术和计算机视觉应用的卷积神经网络的优化》美国空军研究实验室、戴顿大学2022最新85页论文

专知会员服务

25+阅读 · 2022年11月8日

《高压缩分支信道极化合成孔径雷达的理论与设计》2022最新180页博士论文，美国空军技术学院

《高压缩分支信道极化合成孔径雷达的理论与设计》2022最新180页博士论文，美国空军技术学院

专知会员服务

18+阅读 · 2022年10月22日

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

专知会员服务

24+阅读 · 2022年8月2日

最新《神经数据压缩导论》综述

最新《神经数据压缩导论》综述

专知会员服务

39+阅读 · 2022年7月19日

到底什么是有用的ML可解释性？伯克利郁彬高徒Singh68页博士论文《现实世界的机器学习中有用的可解释性》全面综述可解释性技术

到底什么是有用的ML可解释性？伯克利郁彬高徒Singh68页博士论文《现实世界的机器学习中有用的可解释性》全面综述可解释性技术

专知会员服务

119+阅读 · 2022年5月16日

【AAAI2020论文】小样本网络压缩，Few Shot Network Compression via Cross Distillation (附pdf）

专知会员服务

26+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

简述多种降维算法

简述多种降维算法

算法与数学之美

11+阅读 · 2018年9月23日

一文读懂图像压缩算法

一文读懂图像压缩算法

七月在线实验室

17+阅读 · 2018年5月2日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

相关论文

Scale-Adaptive Generative Flows for Multiscale Scientific Data

Arxiv

0+阅读 · 6月4日

Diagonal Scaling: A Multi-Dimensional Resource Model and Optimization Framework for Distributed Databases

Diagonal Scaling: A Multi-Dimensional Resource Model and Optimization Framework for Distributed Databases

Arxiv

0+阅读 · 5月4日

Adaptive Transform Coding for Semantic Compression

Arxiv

0+阅读 · 4月29日

Calibrated Persistent Homology Tests for High-dimensional Collapse Detection

Arxiv

0+阅读 · 4月28日

Lossless Compression via Chained Lightweight Neural Predictors with Information Inheritance

Arxiv

0+阅读 · 4月16日

The Sample Complexity of Lossless Data Compression

Arxiv

0+阅读 · 4月10日

Preserving Discrete Morse-Smale Complexes in Error-Bounded Lossy Compression

Arxiv

0+阅读 · 4月8日

EXaCTz: Guaranteed Extremum Graph and Contour Tree Preservation for Distributed- and GPU-Parallel Lossy Compression

Arxiv

0+阅读 · 4月1日

Fast Topology-Aware Lossy Data Compression with Full Preservation of Critical Points and Local Order

Arxiv

0+阅读 · 3月27日

Analyzing Decoders for Quantum Error Correction

Arxiv

0+阅读 · 3月20日

相关基金

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于随机相位调制的自然场景压缩成像方法与实现研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于贝叶斯统计的遥感影像在轨特征提取与压缩传输

国家自然科学基金

0+阅读 · 2015年12月31日

可压缩多介质流体的真正多维高保真算法

国家自然科学基金

0+阅读 · 2015年12月31日

面向可穿戴设备的压缩感知关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据跨媒体检索的多模态哈希学习方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多数据中心环境中科学大数据应用的数据布局与执行优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性压缩感知问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

压缩感知与稀疏信号恢复

国家自然科学基金

2+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员