Modern distributed systems rely on consensus protocols to build a fault-tolerant-core upon which they can build applications. Consensus protocols are correct under a specific failure model, where up to $f$ machines can fail. We argue that this $f$-threshold failure model oversimplifies the real world and limits potential opportunities to optimize for cost or performance. We argue instead for a probabilistic failure model that captures the complex and nuanced nature of faults observed in practice. Probabilistic consensus protocols can explicitly leverage individual machine \textit{failure curves} and explore side-stepping traditional bottlenecks such as majority quorum intersection, enabling systems that are more reliable, efficient, cost-effective, and sustainable.


翻译:现代分布式系统依赖共识协议构建容错核心,并在此基础上构建应用程序。共识协议在特定的故障模型下具有正确性,该模型假设最多有 $f$ 台机器可能发生故障。我们认为这种基于 $f$ 阈值的故障模型过度简化了现实世界,并限制了在成本或性能方面进行优化的潜在机会。相反,我们主张采用概率化故障模型,以捕捉实践中观察到的复杂且细微的故障特性。概率化共识协议能够显式利用个体机器的\textit{故障曲线},并探索规避传统瓶颈(如多数仲裁集交集)的方法,从而构建更可靠、高效、经济且可持续的系统。

0
下载
关闭预览

相关内容

人机编队协作的共同认知改变了战争方式
专知会员服务
26+阅读 · 2025年2月5日
【硬核书】不确定性:不确定性估计的现代主题,160页pdf
专知会员服务
87+阅读 · 2022年12月4日
专知会员服务
50+阅读 · 2021年4月9日
分布式核心技术知识图谱,带走不谢
架构师之路
12+阅读 · 2019年9月23日
你的算法可靠吗? 神经网络不确定性度量
专知
40+阅读 · 2019年4月27日
经典文章推荐-《迁移学习-该做的和不该做的》
深度学习与NLP
16+阅读 · 2019年4月20日
知识图谱 vs. 对话系统专题讨论 - PaperWeekly 社区
PaperWeekly
10+阅读 · 2017年10月18日
Attention is All You Need | 每周一起读
PaperWeekly
14+阅读 · 2017年6月28日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月19日
Arxiv
0+阅读 · 2月3日
Arxiv
0+阅读 · 2月2日
Arxiv
0+阅读 · 1月14日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员