Synchronizing Probabilities in Model-Driven Lossless Compression - 专知论文

会员服务 ·

0

概率 · 模型驱动 · 工具 · 算法 · 周知 ·

Synchronizing Probabilities in Model-Driven Lossless Compression

翻译：模型驱动无损压缩中的概率同步问题

Aviv Adler,Jennifer Tang

It is well-known in the field of lossless data compression that probabilistic next-symbol prediction can be used to compress sequences of symbols. Deep neural networks are able to capture rich dependencies in data, offering a powerful means of estimating these probabilities and hence an avenue towards more effective compression algorithms. However, both compressor and decompressor must have exactly matching predictions; even small differences from non-determinism (which often happen with learned models due to hardware, software, or computation order) can lead to cascading decoding failures. In this paper, we formalize the problem of prediction mismatch in model-driven compression, and introduce Probability Matching Interval Coding (PMATIC), a model-agnostic algorithm that tolerates bounded prediction mismatch with low overhead. PMATIC works with the predicted probabilities, making it compatible as a drop-in replacement for the arithmetic encoder in model-driven compression tools. We show theoretical correctness and performance bounds for PMATIC, and validate these results on text data. These results confirm that, when paired an advanced prediction model, PMATIC is robust to prediction mismatch while achieving compression rates that out-perform standard modern compression tools.

翻译：在无损数据压缩领域，众所周知，概率性下一符号预测可用于压缩符号序列。深度神经网络能够捕捉数据中丰富的依赖关系，为估计这些概率提供了强大手段，从而为实现更有效的压缩算法开辟了途径。然而，压缩器和解压器必须具有完全匹配的预测；即使由非确定性（在基于学习的模型中，由于硬件、软件或计算顺序的差异，这种情况经常发生）导致的微小差异，也可能引发级联的解码失败。在本文中，我们形式化了模型驱动压缩中的预测失配问题，并引入了概率匹配区间编码（PMATIC），这是一种模型无关的算法，能够以较低的开销容忍有界的预测失配。PMATIC基于预测的概率工作，使其可作为模型驱动压缩工具中算术编码器的即插即用替代方案。我们展示了PMATIC的理论正确性和性能界限，并在文本数据上验证了这些结果。这些结果证实，当与先进的预测模型配对时，PMATIC对预测失配具有鲁棒性，同时实现了优于标准现代压缩工具的压缩率。

0

相关内容

本话题关于日常用语「概率」，用于讨论生活中的运气、机会，及赌博、彩票、游戏中的「技巧」。关于抽象数学概念「概率」的讨论，请转概率（数学）话题。

【博士论文】深度序列模型中的概率学习与生成机制

【博士论文】深度序列模型中的概率学习与生成机制

专知会员服务

13+阅读 · 3月3日

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

专知会员服务

39+阅读 · 2024年6月22日

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

专知会员服务

83+阅读 · 2023年4月25日

【阿姆斯特丹博士论文】深度学习中不确定性与压缩的概率推理，155页pdf

【阿姆斯特丹博士论文】深度学习中不确定性与压缩的概率推理，155页pdf

专知会员服务

68+阅读 · 2023年3月24日

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

专知会员服务

37+阅读 · 2022年12月9日

最新《神经数据压缩导论》综述

最新《神经数据压缩导论》综述

专知会员服务

39+阅读 · 2022年7月19日

【伦敦大学皇家霍洛威学院博士论文】机器学习概率预测，171页pdf

【伦敦大学皇家霍洛威学院博士论文】机器学习概率预测，171页pdf

专知会员服务

35+阅读 · 2022年6月26日

模型压缩究竟在做什么？我们真的需要模型压缩么？

模型压缩究竟在做什么？我们真的需要模型压缩么？

专知会员服务

28+阅读 · 2020年1月16日

【AAAI2020论文】小样本网络压缩，Few Shot Network Compression via Cross Distillation (附pdf）

专知会员服务

26+阅读 · 2019年11月23日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

130+阅读 · 2019年10月12日

您可以相信模型的不确定性吗？

您可以相信模型的不确定性吗？

TensorFlow

14+阅读 · 2020年1月31日

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

专知

31+阅读 · 2019年10月6日

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

AI科技评论

10+阅读 · 2019年6月18日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

【最新综述】模型压缩与加速（附论文全文下载）

【最新综述】模型压缩与加速（附论文全文下载）

专知

28+阅读 · 2019年2月14日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

17+阅读 · 2018年9月20日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

随机动力系统的逼近和跑出问题

国家自然科学基金

0+阅读 · 2015年12月31日

结构化压缩感知及其在盲信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

压缩感知中正交匹配追踪算法的理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向可穿戴设备的压缩感知关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于脉冲系统方法的事件触发网络同步问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

非线性压缩感知问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

信号时频分析与包络的数学模型

国家自然科学基金

1+阅读 · 2014年12月31日

压缩感知与稀疏信号恢复

国家自然科学基金

2+阅读 · 2014年12月31日

Enforcing tail calibration when training probabilistic forecast models

Arxiv

0+阅读 · 5月4日

Stochastic Scaling Limits and Synchronization by Noise in Deep Transformer Models

Arxiv

0+阅读 · 4月29日

Lossless Compression via Chained Lightweight Neural Predictors with Information Inheritance

Arxiv

0+阅读 · 4月16日

The Sample Complexity of Lossless Data Compression

Arxiv

0+阅读 · 4月10日

Efficient Learned Data Compression via Dual-Stream Feature Decoupling

Arxiv

0+阅读 · 4月8日

Fast Topology-Aware Lossy Data Compression with Full Preservation of Critical Points and Local Order

Arxiv

0+阅读 · 3月27日

Enabling Homomorphic Analytical Operations on Compressed Scientific Data with Multi-stage Decompression

Arxiv

0+阅读 · 3月26日

Micro-Diffusion Compression - Binary Tree Tweedie Denoising for Online Probability Estimation

Arxiv

0+阅读 · 3月12日

Training-Free Rate-Distortion-Perception Traversal With Diffusion

Arxiv

0+阅读 · 3月4日

Cut Less, Fold More: Model Compression through the Lens of Projection Geometry

Arxiv

0+阅读 · 2月20日

VIP会员

文章信息

相关主题

最新内容

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

1+阅读 · 今天16:54

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

1+阅读 · 今天16:52

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

6+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

5+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

4+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

4+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

5+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

4+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

6+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

相关VIP内容

【博士论文】深度序列模型中的概率学习与生成机制

【博士论文】深度序列模型中的概率学习与生成机制

专知会员服务

13+阅读 · 3月3日

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

专知会员服务

39+阅读 · 2024年6月22日

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

专知会员服务

83+阅读 · 2023年4月25日

【阿姆斯特丹博士论文】深度学习中不确定性与压缩的概率推理，155页pdf

【阿姆斯特丹博士论文】深度学习中不确定性与压缩的概率推理，155页pdf

专知会员服务

68+阅读 · 2023年3月24日

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

专知会员服务

37+阅读 · 2022年12月9日

最新《神经数据压缩导论》综述

最新《神经数据压缩导论》综述

专知会员服务

39+阅读 · 2022年7月19日

【伦敦大学皇家霍洛威学院博士论文】机器学习概率预测，171页pdf

【伦敦大学皇家霍洛威学院博士论文】机器学习概率预测，171页pdf

专知会员服务

35+阅读 · 2022年6月26日

模型压缩究竟在做什么？我们真的需要模型压缩么？

模型压缩究竟在做什么？我们真的需要模型压缩么？

专知会员服务

28+阅读 · 2020年1月16日

【AAAI2020论文】小样本网络压缩，Few Shot Network Compression via Cross Distillation (附pdf）

专知会员服务

26+阅读 · 2019年11月23日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

130+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

Agentic RL：框架、实践与长程智能体训练

重新思考无人机时代的生存能力

综述 | 从问答到任务完成：Agent系统与Harness设计

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

相关资讯

您可以相信模型的不确定性吗？

您可以相信模型的不确定性吗？

TensorFlow

14+阅读 · 2020年1月31日

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

专知

31+阅读 · 2019年10月6日

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

AI科技评论

10+阅读 · 2019年6月18日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

【最新综述】模型压缩与加速（附论文全文下载）

【最新综述】模型压缩与加速（附论文全文下载）

专知

28+阅读 · 2019年2月14日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

17+阅读 · 2018年9月20日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

相关论文

Enforcing tail calibration when training probabilistic forecast models

Arxiv

0+阅读 · 5月4日

Stochastic Scaling Limits and Synchronization by Noise in Deep Transformer Models

Arxiv

0+阅读 · 4月29日

Lossless Compression via Chained Lightweight Neural Predictors with Information Inheritance

Arxiv

0+阅读 · 4月16日

The Sample Complexity of Lossless Data Compression

Arxiv

0+阅读 · 4月10日

Efficient Learned Data Compression via Dual-Stream Feature Decoupling

Arxiv

0+阅读 · 4月8日

Fast Topology-Aware Lossy Data Compression with Full Preservation of Critical Points and Local Order

Arxiv

0+阅读 · 3月27日

Enabling Homomorphic Analytical Operations on Compressed Scientific Data with Multi-stage Decompression

Arxiv

0+阅读 · 3月26日

Micro-Diffusion Compression - Binary Tree Tweedie Denoising for Online Probability Estimation

Arxiv

0+阅读 · 3月12日

Training-Free Rate-Distortion-Perception Traversal With Diffusion

Arxiv

0+阅读 · 3月4日

Cut Less, Fold More: Model Compression through the Lens of Projection Geometry

Arxiv

0+阅读 · 2月20日

相关基金

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

随机动力系统的逼近和跑出问题

国家自然科学基金

0+阅读 · 2015年12月31日

结构化压缩感知及其在盲信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

压缩感知中正交匹配追踪算法的理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向可穿戴设备的压缩感知关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于脉冲系统方法的事件触发网络同步问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

非线性压缩感知问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

信号时频分析与包络的数学模型

国家自然科学基金

1+阅读 · 2014年12月31日

压缩感知与稀疏信号恢复

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员