Finite Block Length Rate-Distortion Theory for the Bernoulli Source with Hamming Distortion: A Tutorial - 专知论文

会员服务 ·

0

率失真 · 率失真理论 · 教程 · 香农 · 存储 ·

Finite Block Length Rate-Distortion Theory for the Bernoulli Source with Hamming Distortion: A Tutorial

翻译：有限块长率失真理论在汉明失真下的伯努利信源：一个教程

Bhaskar Krishnamachari

from arxiv, About 25 pages, 10 figures

Lossy data compression lies at the heart of modern communication and storage systems. Shannon's rate-distortion theory provides the fundamental limit on how much a source can be compressed at a given fidelity, but it assumes infinitely long block lengths that are never realized in practice. We present a self-contained tutorial on rate-distortion theory for the simplest non-trivial source: a Bernoulli$(p)$ sequence with Hamming distortion. We derive the classical rate-distortion function $RD = Hp - HD$ from first principles, illustrate its computation via the Blahut-Arimoto algorithm, and then develop the finite block length refinements that characterize how the minimum achievable rate approaches the Shannon limit as the block length $n$ grows. The central quantity in this refinement is the \emph{rate-distortion dispersion} $V(D)$, which governs the $O(1/\sqrt{n})$ penalty for operating at finite block lengths. We accompany all theoretical developments with numerical examples and figures generated by accompanying Python scripts.

翻译：有损数据压缩是现代通信与存储系统的核心。香农的率失真理论给出了在给定保真度下信源可压缩程度的基本极限，但该理论假设了无限长的块长度，而这在实践中永远无法实现。本文针对最简单的非平凡信源——具有汉明失真的伯努利$(p)$序列——提供了一个自包含的率失真理论教程。我们从基本原理推导出经典的率失真函数$RD = Hp - HD$，通过Blahut-Arimoto算法说明其计算过程，进而发展了有限块长细化理论，以刻画当块长度$n$增长时，最小可达速率如何逼近香农极限。这一细化理论的核心量是\emph{率失真弥散}$V(D)$，它主导了在有限块长下运行所带来的$O(1/\sqrt{n})$性能损失。所有的理论推导都辅以数值算例和由配套Python脚本生成的图表。

0

相关内容

率失真

【干货书】代数编码理论导论

【干货书】代数编码理论导论

专知会员服务

44+阅读 · 2023年9月13日

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

专知会员服务

38+阅读 · 2022年12月9日

《高压缩分支信道极化合成孔径雷达的理论与设计》2022最新180页博士论文，美国空军技术学院

《高压缩分支信道极化合成孔径雷达的理论与设计》2022最新180页博士论文，美国空军技术学院

专知会员服务

18+阅读 · 2022年10月22日

最新《神经数据压缩导论》综述

最新《神经数据压缩导论》综述

专知会员服务

40+阅读 · 2022年7月19日

如何理解信息论？伯克利最新《信息论》图文导论，43页pdf概述信息论中的熵、不确定、熵、互信息、编解码等基础概念

如何理解信息论？伯克利最新《信息论》图文导论，43页pdf概述信息论中的熵、不确定、熵、互信息、编解码等基础概念

专知会员服务

173+阅读 · 2022年7月17日

《通过最优传输失配措施进行鲁棒性贝叶斯推断：应用和算法》麻省理工学院2022最新博士论文

《通过最优传输失配措施进行鲁棒性贝叶斯推断：应用和算法》麻省理工学院2022最新博士论文

专知会员服务

15+阅读 · 2022年6月21日

【伯克利马毅老师】深度学习基本原理:从数学第一原则出发的深度网络，71页ppt与视频

【伯克利马毅老师】深度学习基本原理:从数学第一原则出发的深度网络，71页ppt与视频

专知会员服务

102+阅读 · 2021年4月18日

【斯坦福经典书】熵与信息论，311页pdf

专知会员服务

119+阅读 · 2021年3月23日

【伯克利】自回归模型的局部掩卷积，Locally Masked Convolution for Autoregressive Models

【伯克利】自回归模型的局部掩卷积，Locally Masked Convolution for Autoregressive Models

专知会员服务

20+阅读 · 2020年6月23日

【论文推荐】基于BERT修剪的问答模型（Pruning a BERT-based Question Answering Model）

【论文推荐】基于BERT修剪的问答模型（Pruning a BERT-based Question Answering Model）

专知会员服务

30+阅读 · 2019年11月22日

【经典书】概率论基础教程，A First Course in Probability，545页pdf

【经典书】概率论基础教程，A First Course in Probability，545页pdf

专知

21+阅读 · 2021年3月24日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

换个角度看GAN：另一种损失函数

换个角度看GAN：另一种损失函数

机器之心

16+阅读 · 2019年1月1日

元学习究竟是什么？这《基于梯度的元学习》199页伯克利博士论文带你回顾元学习最新发展脉络

元学习究竟是什么？这《基于梯度的元学习》199页伯克利博士论文带你回顾元学习最新发展脉络

专知

39+阅读 · 2018年12月27日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

概率论之概念解析：边缘化（Marginalisation）

概率论之概念解析：边缘化（Marginalisation）

专知

14+阅读 · 2018年1月31日

有限域上指数和的计算及其在序列设计中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

不可忽略缺失机制下的广义矩方法和调整经验似然方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

Birkhoff 动力学的非完整几何积分子及对称性理论的研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有大线性复杂度的最优部分汉明相关跳频序列集的构造研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Xampling的Gabor框架条件下的窄脉冲信号采集方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

有限环上自对偶码的构造研究

国家自然科学基金

0+阅读 · 2015年12月31日

有限域上的代数曲线在纠错码构造中的几点应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于Wyner-Ziv分布式编码的无线视频通信端到端失真度估算

国家自然科学基金

0+阅读 · 2014年12月31日

有限域上指数和与量子码的研究

国家自然科学基金

0+阅读 · 2014年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

A Finite-Blocklength Analysis for ORBGRAND

Arxiv

0+阅读 · 3月11日

Rate-Distortion Bounds for Heterogeneous Random Fields on Finite Lattices

Arxiv

0+阅读 · 3月10日

A Finite-Blocklength Analysis for ORBGRAND

Arxiv

0+阅读 · 3月8日

Finite Block Length Rate-Distortion Theory for the Bernoulli Source with Hamming Distortion: A Tutorial

Arxiv

0+阅读 · 3月6日

Training-Free Rate-Distortion-Perception Traversal With Diffusion

Arxiv

0+阅读 · 3月4日

Weighted Unequal Error Protection over a Rayleigh Fading Channel

Arxiv

0+阅读 · 2月27日

The Sample Complexity of Lossless Data Compression

Arxiv

0+阅读 · 2月19日

Model-Aware Rate-Distortion Limits for Task-Oriented Source Coding

Arxiv

0+阅读 · 2月13日

Dispersion of Gaussian Sources with Memory and an Extension to Abstract Sources

Arxiv

0+阅读 · 2月9日

Distortion of Metric Voting with Bounded Randomness

Arxiv

0+阅读 · 2月9日

VIP会员

文章信息

相关主题

率失真理论

最新内容

面向国防作战的最佳自主与蜂群无人机技术

面向国防作战的最佳自主与蜂群无人机技术

专知会员服务

3+阅读 · 今天8:04

《异构人类团队的协作决策过程混合建模研究》

《异构人类团队的协作决策过程混合建模研究》

专知会员服务

3+阅读 · 今天7:59

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

专知会员服务

3+阅读 · 今天7:56

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

专知会员服务

3+阅读 · 今天7:50

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

3+阅读 · 7月27日

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

4+阅读 · 7月27日

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

12+阅读 · 7月27日

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

7+阅读 · 7月27日

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

6+阅读 · 7月27日

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

4+阅读 · 7月27日

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

10+阅读 · 7月27日

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

6+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

9+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

8+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

11+阅读 · 7月26日

相关VIP内容

【干货书】代数编码理论导论

【干货书】代数编码理论导论

专知会员服务

44+阅读 · 2023年9月13日

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

深度学习如何用于压缩？UCI&谷歌这本《神经数据压缩导论》阐述最新进展，91页pdf

专知会员服务

38+阅读 · 2022年12月9日

《高压缩分支信道极化合成孔径雷达的理论与设计》2022最新180页博士论文，美国空军技术学院

《高压缩分支信道极化合成孔径雷达的理论与设计》2022最新180页博士论文，美国空军技术学院

专知会员服务

18+阅读 · 2022年10月22日

最新《神经数据压缩导论》综述

最新《神经数据压缩导论》综述

专知会员服务

40+阅读 · 2022年7月19日

如何理解信息论？伯克利最新《信息论》图文导论，43页pdf概述信息论中的熵、不确定、熵、互信息、编解码等基础概念

如何理解信息论？伯克利最新《信息论》图文导论，43页pdf概述信息论中的熵、不确定、熵、互信息、编解码等基础概念

专知会员服务

173+阅读 · 2022年7月17日

《通过最优传输失配措施进行鲁棒性贝叶斯推断：应用和算法》麻省理工学院2022最新博士论文

《通过最优传输失配措施进行鲁棒性贝叶斯推断：应用和算法》麻省理工学院2022最新博士论文

专知会员服务

15+阅读 · 2022年6月21日

【伯克利马毅老师】深度学习基本原理:从数学第一原则出发的深度网络，71页ppt与视频

【伯克利马毅老师】深度学习基本原理:从数学第一原则出发的深度网络，71页ppt与视频

专知会员服务

102+阅读 · 2021年4月18日

【斯坦福经典书】熵与信息论，311页pdf

专知会员服务

119+阅读 · 2021年3月23日

【伯克利】自回归模型的局部掩卷积，Locally Masked Convolution for Autoregressive Models

【伯克利】自回归模型的局部掩卷积，Locally Masked Convolution for Autoregressive Models

专知会员服务

20+阅读 · 2020年6月23日

【论文推荐】基于BERT修剪的问答模型（Pruning a BERT-based Question Answering Model）

【论文推荐】基于BERT修剪的问答模型（Pruning a BERT-based Question Answering Model）

专知会员服务

30+阅读 · 2019年11月22日

热门VIP内容

开通专知VIP会员享更多权益服务

《异构人类团队的协作决策过程混合建模研究》

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

面向国防作战的最佳自主与蜂群无人机技术

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

相关资讯

【经典书】概率论基础教程，A First Course in Probability，545页pdf

【经典书】概率论基础教程，A First Course in Probability，545页pdf

专知

21+阅读 · 2021年3月24日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

换个角度看GAN：另一种损失函数

换个角度看GAN：另一种损失函数

机器之心

16+阅读 · 2019年1月1日

元学习究竟是什么？这《基于梯度的元学习》199页伯克利博士论文带你回顾元学习最新发展脉络

元学习究竟是什么？这《基于梯度的元学习》199页伯克利博士论文带你回顾元学习最新发展脉络

专知

39+阅读 · 2018年12月27日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

概率论之概念解析：边缘化（Marginalisation）

概率论之概念解析：边缘化（Marginalisation）

专知

14+阅读 · 2018年1月31日

相关论文

A Finite-Blocklength Analysis for ORBGRAND

Arxiv

0+阅读 · 3月11日

Rate-Distortion Bounds for Heterogeneous Random Fields on Finite Lattices

Arxiv

0+阅读 · 3月10日

A Finite-Blocklength Analysis for ORBGRAND

Arxiv

0+阅读 · 3月8日

Finite Block Length Rate-Distortion Theory for the Bernoulli Source with Hamming Distortion: A Tutorial

Arxiv

0+阅读 · 3月6日

Training-Free Rate-Distortion-Perception Traversal With Diffusion

Arxiv

0+阅读 · 3月4日

Weighted Unequal Error Protection over a Rayleigh Fading Channel

Arxiv

0+阅读 · 2月27日

The Sample Complexity of Lossless Data Compression

Arxiv

0+阅读 · 2月19日

Model-Aware Rate-Distortion Limits for Task-Oriented Source Coding

Arxiv

0+阅读 · 2月13日

Dispersion of Gaussian Sources with Memory and an Extension to Abstract Sources

Arxiv

0+阅读 · 2月9日

Distortion of Metric Voting with Bounded Randomness

Arxiv

0+阅读 · 2月9日

相关基金

有限域上指数和的计算及其在序列设计中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

不可忽略缺失机制下的广义矩方法和调整经验似然方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

Birkhoff 动力学的非完整几何积分子及对称性理论的研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有大线性复杂度的最优部分汉明相关跳频序列集的构造研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Xampling的Gabor框架条件下的窄脉冲信号采集方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

有限环上自对偶码的构造研究

国家自然科学基金

0+阅读 · 2015年12月31日

有限域上的代数曲线在纠错码构造中的几点应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于Wyner-Ziv分布式编码的无线视频通信端到端失真度估算

国家自然科学基金

0+阅读 · 2014年12月31日

有限域上指数和与量子码的研究

国家自然科学基金

0+阅读 · 2014年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员