Fluorescent labeling is a cornerstone of DNA visualization and a key enabler of random access in DNA-based data storage. However, the stochastic nature of biochemical processes, including synthesis, hybridization, and optical readout, induces \emph{burst} synchronization errors within the resulting labeling sequences. To address this critical challenge, we formally introduce \emph{burst $t$-deletion/insertion $\mathcal{A}$-labeling codes,} designed to correct a single burst of $t$ deletions or insertions in the label domain. Our contributions are threefold. \begin{itemize} \item \textbf{Fundamental limit.} We establish an information-theoretic lower bound of $\log_4 n + \mathcal{O}(1)$ on the redundancy of any such code for all $t \ge 1$ with $t \mid n$. To the best of our knowledge, this resolves the first information-theoretic lower bound even for the single-error case \(t=1\). \item \textbf{Explicit construction.} For $t \ge 2$, $t \mid n$, and $n \ge 7t + 3$, we propose explicit encoding and decoding algorithms, both running in $\mathcal{O}(n^2)$ time. A novel generalized Run-Length Limited (RLL) constraint is introduced to bridge the structural mismatch between the DNA encoding domain and the label error domain. \item \textbf{Asymptotic optimality.} The proposed scheme achieves redundancy $\log_4 n + (t-1)\log_4 \log_{8/3} n + \mathcal{O}(1)$, matching the dominant term of the lower bound up to a small $\mathcal{O}(\log\log n)$ overhead, rendering the construction asymptotically optimal for fixed $t$. \end{itemize}


翻译:暂无翻译

0
下载
关闭预览

相关内容

Nat. Biotechnol. | 用机器学习预测多肽质谱库
专知会员服务
18+阅读 · 2022年9月12日
【Nature.Mac.Intel】基于DNA调控电路的分子卷积神经网络
专知会员服务
11+阅读 · 2022年8月7日
专知会员服务
16+阅读 · 2021年8月6日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
论文盘点:CVPR 2019 - 文本检测专题
PaperWeekly
14+阅读 · 2019年5月31日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
读书报告 | Deep Learning for Extreme Multi-label Text Classification
科技创新与创业
48+阅读 · 2018年1月10日
深度学习CTPN+CRNN模型实现图片内文字的定位与识别(OCR)
北京思腾合力科技有限公司
35+阅读 · 2017年11月27日
TextInfoExp:自然语言处理相关实验(基于sougou数据集)
全球人工智能
12+阅读 · 2017年11月12日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
1+阅读 · 今天14:45
定向能反无人机系统最新发展动态
专知会员服务
4+阅读 · 今天13:50
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 今天13:33
相关VIP内容
Nat. Biotechnol. | 用机器学习预测多肽质谱库
专知会员服务
18+阅读 · 2022年9月12日
【Nature.Mac.Intel】基于DNA调控电路的分子卷积神经网络
专知会员服务
11+阅读 · 2022年8月7日
专知会员服务
16+阅读 · 2021年8月6日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员