We introduce the Random Subsequence Model, a spin glass model on pairs of random strings $(X,Y) \in \{0,1\}^N \times \{0,1\}^M$ whose partition function counts subsequence embeddings of $Y$ into $X$. We study two variants: the null model, where $X$ and $Y$ are independent and uniform, and the planted model, where $X$ is uniform and $Y$ is a uniformly-random length-$M$ subsequence of $X$. We connect the Random Subsequence Model to longstanding problems in various fields, including the best rate achievable by uniformly-random codes in the deletion channel, the longest common subsequence problem between two random strings, and models of directed polymers in statistical physics. In the regime where $N,M\to\infty$ at a fixed ratio $α= M/N \in (0,1)$, we exhibit strict asymptotic separations between the null annealed free energy and the quenched free energies of the null and planted models at all values of the density parameter $α$. This suggests that these models are in a spin glass phase at zero temperature throughout the entire dense regime. As a consequence, we show that uniformly-random codes achieve a positive rate in the deletion channel for all deletion probabilities $p\in [0,1),$ settling multiple conjectures of the second author, Isik and Weissman (2024) and proving the first such positive rate result for the regime $p \geq 1/2$. We also give an exact analytic formula for the annealed free energy of the planted model for all values of the density parameter. This implies a corresponding analytic upper bound on the best rate achievable by uniformly-random codes in the deletion channel, complementing the lower bound from our first result. Our upper and lower bounds for the capacity of the deletion channel under uniform codes are far closer to each other than the best known upper and lower bounds for the capacity of the deletion channel.


翻译:我们引入随机子序列模型(Random Subsequence Model),这是一个针对随机字符串对 $(X,Y) \in \{0,1\}^N \times \{0,1\}^M$ 的自旋玻璃模型,其配分函数统计将 $Y$ 嵌入 $X$ 的子序列方式。我们研究两种变体:零模型(null model),其中 $X$ 和 $Y$ 独立且均匀分布;以及植入模型(planted model),其中 $X$ 均匀分布,$Y$ 是 $X$ 中均匀随机选取的长度为 $M$ 的子序列。我们将随机子序列模型与多个领域的长期问题联系起来,包括删除信道中均匀编码可达的最佳速率、两个随机字符串之间的最长公共子序列问题,以及统计物理中的有向聚合物模型。在 $N,M\to\infty$ 且固定比例 $\alpha = M/N \in (0,1)$ 的范围内,我们展示了在密度参数 $\alpha$ 的所有取值下,零模型的退火自由能与零模型及植入模型的淬火自由能之间存在严格的渐近分离。这表明这些模型在整个稠密区域处于零温自旋玻璃相。作为推论,我们证明了对于所有删除概率 $p\in [0,1)$,均匀编码在删除信道中实现正速率,从而解决了第二作者、Isik 和 Weissman (2024) 的多个猜想,并首次证明了 $p \geq 1/2$ 区域的正速率结果。我们还给出了植入模型退火自由能在所有密度参数取值下的精确解析公式。这为均匀编码在删除信道中的最佳可达速率提供了相应的解析上界,补充了我们第一个结果中的下界。我们的均匀编码删除信道容量的上下界,比已知的删除信道容量上下界相互之间更为接近。

0
下载
关闭预览

相关内容

【经典书】随机矩阵理论与无线网络,186和pdf
专知会员服务
52+阅读 · 2021年12月21日
自动结构变分推理,Automatic structured variational inference
专知会员服务
41+阅读 · 2020年2月10日
【干货书】贝叶斯推断随机过程,449页pdf
专知
31+阅读 · 2020年8月27日
超全总结:神经网络加速之量化模型 | 附带代码
一文读懂FM算法优势,并用python实现!(附代码)
绝对干货 | 随机梯度下降算法综述
菜鸟的机器学习
15+阅读 · 2017年10月30日
从点到线:逻辑回归到条件随机场
夕小瑶的卖萌屋
15+阅读 · 2017年7月22日
精品公开课 | 随机梯度下降算法综述
七月在线实验室
13+阅读 · 2017年7月11日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月18日
VIP会员
相关主题
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
【经典书】随机矩阵理论与无线网络,186和pdf
专知会员服务
52+阅读 · 2021年12月21日
自动结构变分推理,Automatic structured variational inference
专知会员服务
41+阅读 · 2020年2月10日
相关资讯
【干货书】贝叶斯推断随机过程,449页pdf
专知
31+阅读 · 2020年8月27日
超全总结:神经网络加速之量化模型 | 附带代码
一文读懂FM算法优势,并用python实现!(附代码)
绝对干货 | 随机梯度下降算法综述
菜鸟的机器学习
15+阅读 · 2017年10月30日
从点到线:逻辑回归到条件随机场
夕小瑶的卖萌屋
15+阅读 · 2017年7月22日
精品公开课 | 随机梯度下降算法综述
七月在线实验室
13+阅读 · 2017年7月11日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员