Micro-Diffusion Compression - Binary Tree Tweedie Denoising for Online Probability Estimation - 专知论文

会员服务 ·

0

去噪 · 概率 · 在线 · 系统 · 自适应 ·

Micro-Diffusion Compression - Binary Tree Tweedie Denoising for Online Probability Estimation

翻译：微扩散压缩——基于二叉树的Tweedie去噪在线概率估计

Roberto Tacconelli

from arxiv, 12 pages, 1 figure

We present Midicoth, a lossless compression system that introduces a micro-diffusion denoising layer for improving probability estimates produced by adaptive statistical models. In compressors such as Prediction by Partial Matching (PPM), probability estimates are smoothed by a prior to handle sparse observations. When contexts have been seen only a few times, this prior dominates the prediction and produces distributions that are significantly flatter than the true source distribution, leading to compression inefficiency. Midicoth addresses this limitation by treating prior smoothing as a shrinkage process and applying a reverse denoising step that corrects predicted probabilities using empirical calibration statistics. To make this correction data-efficient, the method decomposes each byte prediction into a hierarchy of binary decisions along a bitwise tree. This converts a single 256-way calibration problem into a sequence of binary calibration tasks, enabling reliable estimation of correction terms from relatively small numbers of observations. The denoising process is applied in multiple successive steps, allowing each stage to refine residual prediction errors left by the previous one. The micro-diffusion layer operates as a lightweight post-blend calibration stage applied after all model predictions have been combined, allowing it to correct systematic biases in the final probability distribution. Midicoth combines five fully online components: an adaptive PPM model, a long-range match model, a trie-based word model, a high-order context model, and the micro-diffusion denoiser applied as the final stage.

翻译：本文提出Midicoth，一种无损压缩系统，通过引入微扩散去噪层来改进自适应统计模型生成的概率估计。在诸如部分匹配预测（PPM）等压缩器中，概率估计通过先验进行平滑以处理稀疏观测。当上下文仅出现少数几次时，该先验主导预测并产生比真实信源分布显著平坦的分布，导致压缩效率低下。Midicoth通过将先验平滑视为收缩过程，并应用基于经验校准统计的反向去噪步骤来校正预测概率，从而解决此限制。为使校正过程数据高效，该方法将每个字节预测分解为沿比特树的二进制决策层次结构。这将单个256路校准问题转化为一系列二元校准任务，使得能够从相对较少的观测中可靠估计校正项。去噪过程以多步连续方式应用，允许每个阶段细化前一步遗留的残差预测误差。微扩散层作为轻量级后融合校准阶段，在所有模型预测组合后应用，使其能够校正最终概率分布中的系统性偏差。Midicoth整合了五个完全在线组件：自适应PPM模型、长程匹配模型、基于字典树的词模型、高阶上下文模型，以及作为最终阶段应用的微扩散去噪器。

0

相关内容

【ICML2025】用于概率时间序列预测的非平稳扩散方法

【ICML2025】用于概率时间序列预测的非平稳扩散方法

专知会员服务

10+阅读 · 2025年5月10日

【CVPR2025】在去噪扩散模型中优化最短路径

【CVPR2025】在去噪扩散模型中优化最短路径

专知会员服务

16+阅读 · 2025年3月10日

生成式人工智能的扩散模型概述

生成式人工智能的扩散模型概述

专知会员服务

66+阅读 · 2024年12月8日

【NeurIPS 2024】用于变分似然估计和图像去噪的扩散先验

【NeurIPS 2024】用于变分似然估计和图像去噪的扩散先验

专知会员服务

15+阅读 · 2024年10月26日

何恺明等最新步步解构扩散模型，最后竟成经典去噪自编码器

何恺明等最新步步解构扩散模型，最后竟成经典去噪自编码器

专知会员服务

33+阅读 · 2024年1月28日

去噪扩散概率模型，46页ppt

去噪扩散概率模型，46页ppt

专知会员服务

63+阅读 · 2023年1月4日

扩散模型数学太难？经典扩散模型DDPM手把手Pytorch代码实现，对照数学公式详解

扩散模型数学太难？经典扩散模型DDPM手把手Pytorch代码实现，对照数学公式详解

专知会员服务

124+阅读 · 2022年9月8日

图像去噪方法概述

专知会员服务

43+阅读 · 2021年8月30日

【论文推荐】NGBoost:用于概率预测的自然梯度增强（NGBoost: Natural Gradient Boosting for Probabilistic Prediction）

【论文推荐】NGBoost:用于概率预测的自然梯度增强（NGBoost: Natural Gradient Boosting for Probabilistic Prediction）

专知会员服务

18+阅读 · 2019年12月25日

【AAAI2020论文】小样本网络压缩，Few Shot Network Compression via Cross Distillation (附pdf）

专知会员服务

26+阅读 · 2019年11月23日

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

AI科技评论

10+阅读 · 2019年6月18日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

CVPR 2019 Oral 论文解读 | 百度提出关于网络压缩和加速的新剪枝算法

CVPR 2019 Oral 论文解读 | 百度提出关于网络压缩和加速的新剪枝算法

AI科技评论

11+阅读 · 2019年5月28日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

EKF常用于目标跟踪系统的扩展卡尔曼滤波器

EKF常用于目标跟踪系统的扩展卡尔曼滤波器

无人机

10+阅读 · 2017年7月25日

基于机器学习的微波土壤水分产品降尺度研究

国家自然科学基金

2+阅读 · 2017年12月31日

结构化压缩感知及其在盲信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

压缩感知中正交匹配追踪算法的理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于压缩感知的信号重建快速算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏理论和图Laplacian矩阵的图像去噪理论与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

带加法噪声高维密度的最优小波点态估计

国家自然科学基金

0+阅读 · 2015年12月31日

压缩感知和稀疏优化中的非凸优化算法设计

国家自然科学基金

2+阅读 · 2014年12月31日

压缩感知与稀疏信号恢复

国家自然科学基金

2+阅读 · 2014年12月31日

Denoising Diffusion Variational Inference: Diffusion Models as Expressive Variational Posteriors

Arxiv

0+阅读 · 3月13日

Synchronizing Probabilities in Model-Driven Lossless Compression

Arxiv

0+阅读 · 3月7日

Diffusion-EXR: Controllable Review Generation for Explainable Recommendation via Diffusion Models

Arxiv

0+阅读 · 3月3日

Mitigating Artifacts in Pre-quantization Based Scientific Data Compressors with Quantization-aware Interpolation

Arxiv

0+阅读 · 2月23日

Denoising diffusion probabilistic models are optimally adaptive to unknown low dimensionality

Arxiv

0+阅读 · 2月15日

Seq2Seq2Seq: Lossless Data Compression via Discrete Latent Transformers and Reinforcement Learning

Arxiv

0+阅读 · 2月12日

Universal Diffusion-Based Probabilistic Downscaling

Arxiv

0+阅读 · 2月12日

Joint Bayesian Parameter and Model Order Estimation for Low-Rank Probability Mass Tensors

Arxiv

0+阅读 · 2月2日

Generative quantum machine learning via denoising diffusion probabilistic models

Arxiv

0+阅读 · 1月30日

Denoising diffusion networks for normative modeling in neuroimaging

Arxiv

0+阅读 · 1月24日

VIP会员

文章信息

相关主题

最新内容

美国边境监控技术演变：无人机与人工智能系统（2001-2025年）（中文版下载，1.3万字）

美国边境监控技术演变：无人机与人工智能系统（2001-2025年）（中文版下载，1.3万字）

专知会员服务

4+阅读 · 今天6:24

技术突袭：俄乌战争中新型精确打击武器的战术与效应（中文版下载，2万字）

技术突袭：俄乌战争中新型精确打击武器的战术与效应（中文版下载，2万字）

专知会员服务

4+阅读 · 今天4:57

《基于生成式通信模型的分布式智能体学习》127页

《基于生成式通信模型的分布式智能体学习》127页

专知会员服务

6+阅读 · 今天3:38

《应对无人机威胁：欧洲反无人机系统》最新报告

《应对无人机威胁：欧洲反无人机系统》最新报告

专知会员服务

4+阅读 · 今天3:35

俄罗斯无人机战线实验

俄罗斯无人机战线实验

专知会员服务

5+阅读 · 今天3:29

高阶网络的表示：基于图的框架综述

高阶网络的表示：基于图的框架综述

专知会员服务

8+阅读 · 5月14日

【ICML2026】面向长上下文大语言模型的训练-推理一致性分段执行

【ICML2026】面向长上下文大语言模型的训练-推理一致性分段执行

专知会员服务

4+阅读 · 5月14日

俄乌冲突中的高超音速武器系统及效能评估（中文版PDF下载）

俄乌冲突中的高超音速武器系统及效能评估（中文版PDF下载）

专知会员服务

20+阅读 · 5月14日

《战略冲突的数学建模：基于变分不等式、不动点理论、间隙函数与微分博弈的美以伊冲突分析》

《战略冲突的数学建模：基于变分不等式、不动点理论、间隙函数与微分博弈的美以伊冲突分析》

专知会员服务

12+阅读 · 5月14日

《人工智能中的多智能体自主决策》380页博士论文

《人工智能中的多智能体自主决策》380页博士论文

专知会员服务

16+阅读 · 5月14日

《作战资源再分配的作战行动数学模型构建》

《作战资源再分配的作战行动数学模型构建》

专知会员服务

13+阅读 · 5月14日

乌克兰作为杀伤网实验室：情报监视侦察（ISR）网络赋能自适应无人机战争——经验分析

乌克兰作为杀伤网实验室：情报监视侦察（ISR）网络赋能自适应无人机战争——经验分析

专知会员服务

10+阅读 · 5月14日

【博士论文】面向可扩展且可信智能系统的强化学习

【博士论文】面向可扩展且可信智能系统的强化学习

专知会员服务

8+阅读 · 5月13日

世界动作模型: 具身AI的下一个前沿

世界动作模型: 具身AI的下一个前沿

专知会员服务

15+阅读 · 5月13日

全球十大防空反导系统：列表、射程与用途

全球十大防空反导系统：列表、射程与用途

专知会员服务

16+阅读 · 5月13日

相关VIP内容

【ICML2025】用于概率时间序列预测的非平稳扩散方法

【ICML2025】用于概率时间序列预测的非平稳扩散方法

专知会员服务

10+阅读 · 2025年5月10日

【CVPR2025】在去噪扩散模型中优化最短路径

【CVPR2025】在去噪扩散模型中优化最短路径

专知会员服务

16+阅读 · 2025年3月10日

生成式人工智能的扩散模型概述

生成式人工智能的扩散模型概述

专知会员服务

66+阅读 · 2024年12月8日

【NeurIPS 2024】用于变分似然估计和图像去噪的扩散先验

【NeurIPS 2024】用于变分似然估计和图像去噪的扩散先验

专知会员服务

15+阅读 · 2024年10月26日

何恺明等最新步步解构扩散模型，最后竟成经典去噪自编码器

何恺明等最新步步解构扩散模型，最后竟成经典去噪自编码器

专知会员服务

33+阅读 · 2024年1月28日

去噪扩散概率模型，46页ppt

去噪扩散概率模型，46页ppt

专知会员服务

63+阅读 · 2023年1月4日

扩散模型数学太难？经典扩散模型DDPM手把手Pytorch代码实现，对照数学公式详解

扩散模型数学太难？经典扩散模型DDPM手把手Pytorch代码实现，对照数学公式详解

专知会员服务

124+阅读 · 2022年9月8日

图像去噪方法概述

专知会员服务

43+阅读 · 2021年8月30日

【论文推荐】NGBoost:用于概率预测的自然梯度增强（NGBoost: Natural Gradient Boosting for Probabilistic Prediction）

【论文推荐】NGBoost:用于概率预测的自然梯度增强（NGBoost: Natural Gradient Boosting for Probabilistic Prediction）

专知会员服务

18+阅读 · 2019年12月25日

【AAAI2020论文】小样本网络压缩，Few Shot Network Compression via Cross Distillation (附pdf）

专知会员服务

26+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

技术突袭：俄乌战争中新型精确打击武器的战术与效应（中文版下载，2万字）

《应对无人机威胁：欧洲反无人机系统》最新报告

美国边境监控技术演变：无人机与人工智能系统（2001-2025年）（中文版下载，1.3万字）

《基于生成式通信模型的分布式智能体学习》127页

相关资讯

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

AI科技评论

10+阅读 · 2019年6月18日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

CVPR 2019 Oral 论文解读 | 百度提出关于网络压缩和加速的新剪枝算法

CVPR 2019 Oral 论文解读 | 百度提出关于网络压缩和加速的新剪枝算法

AI科技评论

11+阅读 · 2019年5月28日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

EKF常用于目标跟踪系统的扩展卡尔曼滤波器

EKF常用于目标跟踪系统的扩展卡尔曼滤波器

无人机

10+阅读 · 2017年7月25日

相关论文

Denoising Diffusion Variational Inference: Diffusion Models as Expressive Variational Posteriors

Arxiv

0+阅读 · 3月13日

Synchronizing Probabilities in Model-Driven Lossless Compression

Arxiv

0+阅读 · 3月7日

Diffusion-EXR: Controllable Review Generation for Explainable Recommendation via Diffusion Models

Arxiv

0+阅读 · 3月3日

Mitigating Artifacts in Pre-quantization Based Scientific Data Compressors with Quantization-aware Interpolation

Arxiv

0+阅读 · 2月23日

Denoising diffusion probabilistic models are optimally adaptive to unknown low dimensionality

Arxiv

0+阅读 · 2月15日

Seq2Seq2Seq: Lossless Data Compression via Discrete Latent Transformers and Reinforcement Learning

Arxiv

0+阅读 · 2月12日

Universal Diffusion-Based Probabilistic Downscaling

Arxiv

0+阅读 · 2月12日

Joint Bayesian Parameter and Model Order Estimation for Low-Rank Probability Mass Tensors

Arxiv

0+阅读 · 2月2日

Generative quantum machine learning via denoising diffusion probabilistic models

Arxiv

0+阅读 · 1月30日

Denoising diffusion networks for normative modeling in neuroimaging

Arxiv

0+阅读 · 1月24日

相关基金

基于机器学习的微波土壤水分产品降尺度研究

国家自然科学基金

2+阅读 · 2017年12月31日

结构化压缩感知及其在盲信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

压缩感知中正交匹配追踪算法的理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于压缩感知的信号重建快速算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏理论和图Laplacian矩阵的图像去噪理论与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

带加法噪声高维密度的最优小波点态估计

国家自然科学基金

0+阅读 · 2015年12月31日

压缩感知和稀疏优化中的非凸优化算法设计

国家自然科学基金

2+阅读 · 2014年12月31日

压缩感知与稀疏信号恢复

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员