There are few, if any, algorithms in statistical phylogenetics which are used more heavily than Felsenstein's 1973 pruning method for computing the likelihood of a tree. We present LvD, (Likelihood via Decomposition), an alternative to Felsenstein's algorithm based on a different decomposition of the underlying phylogeny. It works for all standard nucleotide models. The new algorithm allows updates of the likelihood calculation in worst case $O(\log n)$ time with $n$ taxa, as opposed to worst case $O(n)$ time for existing methods. In practice this leads to appreciable improvements in likelihood calculations, the extent of speed-up depending on how balanced or unbalanced the trees are. We explore implications for parallel computing, and show that the approach allows likelihoods to be computed in $O(\log n)$ parallel time per site, compared to (worst case) $O(n)$ time. We implemented and applied the algorithm to large numbers of simulated and empirical data sets and showed that these theoretical advances lead to a significant practical speed-up, although the extent of the improvement depends on how balanced the phylogenies already are.


翻译:在统计系统发育学中,几乎没有比Felsenstein于1973年提出的用于计算树似然性的剪枝算法使用更广泛的算法。我们提出了LvD(通过分解计算似然性),这是一种基于对底层系统发育树进行不同分解的、替代Felsenstein算法的新方法。它适用于所有标准核苷酸模型。新算法在具有n个分类群的情况下,能够在最坏情况下以$O(\log n)$的时间复杂度更新似然性计算,而现有方法在最坏情况下需要$O(n)$时间。在实践中,这带来了似然性计算的显著改进,加速的程度取决于树的平衡或不平衡程度。我们探讨了其对并行计算的影响,并表明该方法允许每个位点的似然性计算在$O(\log n)$的并行时间内完成,相比之下(最坏情况下)现有方法需要$O(n)$时间。我们实现并将该算法应用于大量模拟和实证数据集,结果表明这些理论进展带来了显著的实践加速,尽管改进的程度取决于系统发育树原有的平衡性。

0
下载
关闭预览

相关内容

新书介绍 | 图算法指南,A Guide to Graph Algorithms
专知会员服务
57+阅读 · 2022年3月2日
【NeurIPS 2021】类比进化算法:设计统一的序列模型
专知会员服务
16+阅读 · 2021年10月30日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
并行算法演进,从MapReduce到MPI
凡人机器学习
10+阅读 · 2017年11月5日
GAFT:一个使用 Python 实现的遗传算法框架
Python开发者
10+阅读 · 2017年8月1日
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Arxiv
0+阅读 · 1月30日
Arxiv
0+阅读 · 1月13日
VIP会员
相关VIP内容
新书介绍 | 图算法指南,A Guide to Graph Algorithms
专知会员服务
57+阅读 · 2022年3月2日
【NeurIPS 2021】类比进化算法:设计统一的序列模型
专知会员服务
16+阅读 · 2021年10月30日
相关基金
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员