The LZ78 Source - 专知论文

会员服务 ·

0

序列 · 几乎必然 · 概率 · 经验分布 · 近似 ·

The LZ78 Source

翻译：LZ78信源

Naomi Sagan,Amir Dembo,Matthew Ho,Tsachy Weissman

from arxiv, 41 pages, 15 figures, submitted to IEEE Transactions on Information Theory

We study a family of processes generated according to sequential probability assignments induced by the LZ78 universal compressor. We characterize entropic and distributional properties such as their entropy and relative entropy rates, finite-state compressibility and log loss of their realizations, and the empirical distributions that they induce. Though not quite stationary, these sources are "almost stationary and ergodic;" similar to stationary and ergodic processes, they satisfy a Shannon-McMillan-Breiman-type property: the normalized log probability of their realizations converges almost surely to their entropy rate. Further, they are locally "almost i.i.d." in the sense that the finite-dimensional empirical distributions of their realizations converge almost surely to a deterministic i.i.d. law. However, unlike stationary ergodic sources, the finite-state compressibility of their realizations is almost surely strictly larger than their entropy rate by a "Jensen gap". We present simulations demonstrating the theoretical results. These sources allow to gauge the performance of sequential probability models, both classical and deep learning-based, on non-Markovian non-stationary data. As such, we apply realizations of the LZ78 source to the study of in-context learning in transformer models.

翻译：我们研究了一类由LZ78通用压缩器导出的序列概率分配所生成的随机过程。我们刻画了其熵与相对熵率、实现序列的有限状态可压缩性与对数损失、以及它们所诱导的经验分布等熵与分布特性。尽管这些信源并非完全平稳，但它们具有“近似平稳且遍历”的性质：类似于平稳遍历过程，它们满足香农-麦克米伦-布雷曼型性质——其实现序列的归一化对数概率几乎必然收敛于熵率。此外，它们在局部上“近似独立同分布”，即实现序列的有限维经验分布几乎必然收敛于一个确定性的独立同分布律。然而，与平稳遍历信源不同，其实现序列的有限状态可压缩性几乎必然严格大于熵率，其差值表现为“詹森间隙”。我们通过仿真实验验证了理论结果。这类信源可用于评估序列概率模型（包括经典方法与基于深度学习的方法）在非马尔可夫非平稳数据上的性能表现。基于此，我们将LZ78信源的实现序列应用于Transformer模型的情境学习研究。

0

相关内容

数学上，序列是被排成一列的对象（或事件）；这样每个元素不是在其他元素之前，就是在其他元素之后。这里，元素之间的顺序非常重要。

【剑桥大学博士论文】推进归一化流模型以模拟玻尔兹曼分布，187页pdf

【剑桥大学博士论文】推进归一化流模型以模拟玻尔兹曼分布，187页pdf

专知会员服务

26+阅读 · 2024年8月22日

【经典书】随机矩阵理论与无线网络，186和pdf

【经典书】随机矩阵理论与无线网络，186和pdf

专知会员服务

52+阅读 · 2021年12月21日

【斯坦福经典书】熵与信息论，311页pdf

专知会员服务

119+阅读 · 2021年3月23日

【经典书】信息论原理，774页pdf

【经典书】信息论原理，774页pdf

专知会员服务

265+阅读 · 2021年3月22日

【哈佛大学干货书】概率导论，589页pdf，Introduction to Probability

【哈佛大学干货书】概率导论，589页pdf，Introduction to Probability

专知会员服务

141+阅读 · 2021年1月24日

【伯克利Payam博士论文】大规模稀疏图的问题探究: 图压缩与负载均衡，268页pdf

【伯克利Payam博士论文】大规模稀疏图的问题探究: 图压缩与负载均衡，268页pdf

专知会员服务

20+阅读 · 2020年11月4日

【干货书】贝叶斯推断随机过程，449页pdf

【干货书】贝叶斯推断随机过程，449页pdf

专知会员服务

156+阅读 · 2020年8月27日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知会员服务

124+阅读 · 2020年5月30日

【硬核书】信息论，528页pdf，Information Theory and Coding by Example

【硬核书】信息论，528页pdf，Information Theory and Coding by Example

专知会员服务

150+阅读 · 2020年4月20日

最新「因果推断Causal Inference」综述论文38页pdf，Buffalo、Georgia、阿里巴巴、Virginia

专知会员服务

183+阅读 · 2020年2月11日

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AINLP

10+阅读 · 2021年2月6日

【干货书】贝叶斯推断随机过程，449页pdf

【干货书】贝叶斯推断随机过程，449页pdf

专知

31+阅读 · 2020年8月27日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

图分类相关资源大列表

图分类相关资源大列表

专知

11+阅读 · 2019年7月18日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

一份超全的PyTorch资源列表（Github 2.2K星）

一份超全的PyTorch资源列表（Github 2.2K星）

黑龙江大学自然语言处理实验室

25+阅读 · 2018年10月26日

【干货】库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）

【干货】库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）

GAN生成式对抗网络

10+阅读 · 2018年10月21日

放弃 RNN/LSTM 吧，因为真的不好用！望周知~

放弃 RNN/LSTM 吧，因为真的不好用！望周知~

人工智能头条

19+阅读 · 2018年4月24日

【直观详解】信息熵、交叉熵和相对熵

【直观详解】信息熵、交叉熵和相对熵

机器学习研究会

10+阅读 · 2017年11月7日

随机图和随机环境中的接触过程、选举模型、排他过程

国家自然科学基金

0+阅读 · 2015年12月31日

随机动力系统的逼近和跑出问题

国家自然科学基金

0+阅读 · 2015年12月31日

广义双随机相位编码系统中以QR码为载体的信息加密及无损恢复

国家自然科学基金

0+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

若干类ABSDEs以及其他类型BSDEs的研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机波动率模型的统计推断及数值解

国家自然科学基金

1+阅读 · 2015年12月31日

高维高频数据下金融资产积分波动率矩阵的统计分析

国家自然科学基金

2+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

离散时间马氏链的泛函不等式及遍历性

国家自然科学基金

0+阅读 · 2014年12月31日

Incongruity-sensitive access to highly compressed strings

Arxiv

0+阅读 · 2月4日

Belief-Combining Framework for Multi-Trace Reconstruction over Channels with Insertions, Deletions, and Substitutions

Arxiv

0+阅读 · 1月26日

Stable Source Coding

Arxiv

0+阅读 · 1月23日

LZBE: an LZ-style compressor supporting $O(\log n)$-time random access

Arxiv

0+阅读 · 1月21日

Rate-Distortion-Classification Representation Theory for Bernoulli Sources

Arxiv

0+阅读 · 1月17日

On the Entropy Calibration of Language Models

Arxiv

0+阅读 · 1月13日

The many faces of multivariate information

Arxiv

0+阅读 · 1月12日

Lossy Source Coding with Broadcast Side Information

Arxiv

0+阅读 · 1月12日

Multiperiodic Processes: Ergodic Sources with a Sublinear Entropy

Arxiv

0+阅读 · 1月12日

Gibbs randomness-compression proposition: An efficient deep learning

Arxiv

0+阅读 · 1月5日

VIP会员

文章信息

相关主题

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

3+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

5+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

3+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

2+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

10+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

7+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

5+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

3+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

7+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

3+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

3+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

7+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

6+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

10+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

5+阅读 · 4月20日

相关VIP内容

【剑桥大学博士论文】推进归一化流模型以模拟玻尔兹曼分布，187页pdf

【剑桥大学博士论文】推进归一化流模型以模拟玻尔兹曼分布，187页pdf

专知会员服务

26+阅读 · 2024年8月22日

【经典书】随机矩阵理论与无线网络，186和pdf

【经典书】随机矩阵理论与无线网络，186和pdf

专知会员服务

52+阅读 · 2021年12月21日

【斯坦福经典书】熵与信息论，311页pdf

专知会员服务

119+阅读 · 2021年3月23日

【经典书】信息论原理，774页pdf

【经典书】信息论原理，774页pdf

专知会员服务

265+阅读 · 2021年3月22日

【哈佛大学干货书】概率导论，589页pdf，Introduction to Probability

【哈佛大学干货书】概率导论，589页pdf，Introduction to Probability

专知会员服务

141+阅读 · 2021年1月24日

【伯克利Payam博士论文】大规模稀疏图的问题探究: 图压缩与负载均衡，268页pdf

【伯克利Payam博士论文】大规模稀疏图的问题探究: 图压缩与负载均衡，268页pdf

专知会员服务

20+阅读 · 2020年11月4日

【干货书】贝叶斯推断随机过程，449页pdf

【干货书】贝叶斯推断随机过程，449页pdf

专知会员服务

156+阅读 · 2020年8月27日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知会员服务

124+阅读 · 2020年5月30日

【硬核书】信息论，528页pdf，Information Theory and Coding by Example

【硬核书】信息论，528页pdf，Information Theory and Coding by Example

专知会员服务

150+阅读 · 2020年4月20日

最新「因果推断Causal Inference」综述论文38页pdf，Buffalo、Georgia、阿里巴巴、Virginia

专知会员服务

183+阅读 · 2020年2月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AINLP

10+阅读 · 2021年2月6日

【干货书】贝叶斯推断随机过程，449页pdf

【干货书】贝叶斯推断随机过程，449页pdf

专知

31+阅读 · 2020年8月27日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

图分类相关资源大列表

图分类相关资源大列表

专知

11+阅读 · 2019年7月18日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

一份超全的PyTorch资源列表（Github 2.2K星）

一份超全的PyTorch资源列表（Github 2.2K星）

黑龙江大学自然语言处理实验室

25+阅读 · 2018年10月26日

【干货】库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）

【干货】库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）

GAN生成式对抗网络

10+阅读 · 2018年10月21日

放弃 RNN/LSTM 吧，因为真的不好用！望周知~

放弃 RNN/LSTM 吧，因为真的不好用！望周知~

人工智能头条

19+阅读 · 2018年4月24日

【直观详解】信息熵、交叉熵和相对熵

【直观详解】信息熵、交叉熵和相对熵

机器学习研究会

10+阅读 · 2017年11月7日

相关论文

Incongruity-sensitive access to highly compressed strings

Arxiv

0+阅读 · 2月4日

Belief-Combining Framework for Multi-Trace Reconstruction over Channels with Insertions, Deletions, and Substitutions

Arxiv

0+阅读 · 1月26日

Stable Source Coding

Arxiv

0+阅读 · 1月23日

LZBE: an LZ-style compressor supporting $O(\log n)$-time random access

Arxiv

0+阅读 · 1月21日

Rate-Distortion-Classification Representation Theory for Bernoulli Sources

Arxiv

0+阅读 · 1月17日

On the Entropy Calibration of Language Models

Arxiv

0+阅读 · 1月13日

The many faces of multivariate information

Arxiv

0+阅读 · 1月12日

Lossy Source Coding with Broadcast Side Information

Arxiv

0+阅读 · 1月12日

Multiperiodic Processes: Ergodic Sources with a Sublinear Entropy

Arxiv

0+阅读 · 1月12日

Gibbs randomness-compression proposition: An efficient deep learning

Arxiv

0+阅读 · 1月5日

相关基金

随机图和随机环境中的接触过程、选举模型、排他过程

国家自然科学基金

0+阅读 · 2015年12月31日

随机动力系统的逼近和跑出问题

国家自然科学基金

0+阅读 · 2015年12月31日

广义双随机相位编码系统中以QR码为载体的信息加密及无损恢复

国家自然科学基金

0+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

若干类ABSDEs以及其他类型BSDEs的研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机波动率模型的统计推断及数值解

国家自然科学基金

1+阅读 · 2015年12月31日

高维高频数据下金融资产积分波动率矩阵的统计分析

国家自然科学基金

2+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

离散时间马氏链的泛函不等式及遍历性

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员