We initiate the study of DNA-based distributed storage systems, where information is encoded across multiple DNA data storage containers to achieve robustness against container failures. In this setting, data are distributed over $M$ containers, and the objective is to guarantee that the contents of any failed container can be reliably reconstructed from the surviving ones. Unlike classical distributed storage systems, DNA data storage containers are fundamentally constrained by sequencing technology, since each read operation yields the content of a uniformly random sampled strand from the container. Within this framework, we consider several erasure-correcting codes and analyze the expected recovery time of the data stored in a failed container. Our results are obtained by analyzing generalized versions of the classical Coupon Collector's Problem, which may be of independent interest.


翻译:我们首次研究了基于DNA的分布式存储系统,其中信息被编码存储在多个DNA数据存储容器中,以实现对容器故障的鲁棒性。在此设置中,数据分布在$M$个容器上,目标是确保任何故障容器的内容都能从存活的容器中可靠地重建。与经典分布式存储系统不同,DNA数据存储容器从根本上受到测序技术的限制,因为每次读取操作只能获得从容器中均匀随机采样的一条链的内容。在此框架下,我们考虑了几种纠删码,并分析了存储在故障容器中数据的期望恢复时间。我们的结果是通过分析经典"优惠券收集问题"的广义版本得到的,这可能具有独立的学术价值。

0
下载
关闭预览

相关内容

【2023新书】分布式系统,第四版,685页pdf
专知会员服务
91+阅读 · 2023年2月25日
【Nature.Mac.Intel】基于DNA调控电路的分子卷积神经网络
专知会员服务
11+阅读 · 2022年8月7日
分布式核心技术知识图谱,带走不谢
架构师之路
12+阅读 · 2019年9月23日
回归预测&时间序列预测
GBASE数据工程部数据团队
44+阅读 · 2017年5月17日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月5日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员