We study successor right-special strings over an alphabet $Σ$ of size $σ$, a minimal-branching analogue of de Bruijn strings, and ask how few Burrows--Wheeler transform (BWT) runs are possible. In a de Bruijn string of order $k$, every $(k-1)$-context has all $σ$ right-extensions; here, every context is still right-special but has exactly two right-extensions, chosen by a successor rule. For order $3$, we construct an explicit family $B_σ^{(3)}$, for every $σ\geq 2$, whose cyclic BWT has $r_c = σ^2 + 2$ runs. A suitable terminated linearization has the same run count, $r = r_c = σ^2 + 2$, while the smallest suffixient set has size $χ= 2σ^2 + 1$. The ratio $χ/r = 2 - 3/(σ^2 + 2)$ then quantifies how nearly this forced branching saturates the known bound $χ/r \leq 2$, which we have previously shown to be asymptotically tight. Compared with our earlier alphabet-growing construction, this improves the gap from $O(1/σ)$ to $O(1/σ^2)$. We also show that the order-$3$ pattern appears as a blockwise two-row projection of normalized linear-feedback shift register (LFSR) de Bruijn sequences over $\mathbb F_q$, when such primitive trinomials $x^3 - x + c$ exist. For higher orders, we analyze the natural boundary-merged candidate $L_{σ,k}$ using the last-to-first (LF) permutation: it fails for $k = 4$ and all $σ\geq 3$, while verified $k = 5$ instances for $σ\in {3,4}$ yield $χ/r$ ratios exceeding $1.96$.


翻译:本文研究字母表$Σ$(大小为$σ$)上的后继右特殊字符串——de Bruijn字符串在最小分支意义下的类比,并探究其Burrows-Wheeler变换(BWT)游程数的最小可能值。在$k$阶de Bruijn字符串中,每个$(k-1)$阶上下文具有全部$σ$种右扩展;而此处每个上下文虽仍为右特殊,但仅由后继规则选定恰好两种右扩展。对于$3$阶情形,我们为每个$σ\geq 2$构造了一个显式族$B_σ^{(3)}$,其循环BWT的游程数$r_c = σ^2 + 2$。合适的带终止线性化版本拥有相同游程数$r = r_c = σ^2 + 2$,而最小后缀集的大小为$χ= 2σ^2 + 1$。比值$χ/r = 2 - 3/(σ^2 + 2)$量化了这种强制分支在多大程度上趋近已知界$χ/r \leq 2$——我们此前已证明该界渐近紧确。与早期字母表增长构造相比,本方法将差距从$O(1/σ)$改进至$O(1/σ^2)$。我们还证明,当原始三项式$x^3 - x + c$存在时,$3$阶模式可表现为$\mathbb F_q$上归一化线性反馈移位寄存器(LFSR)de Bruijn序列的块状两行投影。对于更高阶情形,我们利用最后一列到第一列(LF)置换分析了自然边界合并候选序列$L_{σ,k}$:该方案在$k=4$且所有$σ\geq 3$时失败,而$k=5$时对$σ\in {3,4}$验证的实例中$χ/r$比值超过$1.96$。

0
下载
关闭预览

相关内容

代码注释最详细的Transformer
专知会员服务
113+阅读 · 2022年6月30日
从头开始了解Transformer
AI科技评论
25+阅读 · 2019年8月28日
BERT/Transformer/迁移学习NLP资源大列表
专知
19+阅读 · 2019年6月9日
百闻不如一码!手把手教你用Python搭一个Transformer
大数据文摘
18+阅读 · 2019年4月22日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 5月8日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
3+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
代码注释最详细的Transformer
专知会员服务
113+阅读 · 2022年6月30日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员