Rooted bifurcating trees are mathematical objects used to model evolutionary relationships and arise naturally in both coalescent theory and phylogenetics. Recent numerical representations of tree topologies, known as F-matrices, allow for summarizing a sample of trees via Fréchet means and provide new measures of tree balance. However, the number of ranked unlabelled trees grows super-exponentially with the number of leaves. This makes computation intensive and current methods rely on mixed integer programming and simulation-based methods. Moreover, F-matrices are difficult to interpret, and their distribution is only described in terms of first- and second-order moments under neutral branching. In this paper, we introduce a Markov chain embedding of ranked and unlabelled trees that drastically decreases the size of the state space. Leveraging this embedding, we develop an algorithm that efficiently computes all Fréchet means and use discrete phase-type theory to obtain the joint distribution of tree balance indices. We also use discrete phase-type theory to generalize previous results regarding moments of F-matrices to arbitrary order for any time homogeneous and bifurcating coalescent model. Using this framework, we construct three tests for neutrality and demonstrate their improved power compared to previous methods on simulated data.


翻译:有根分叉树是用于模拟进化关系的数学对象,自然出现在溯祖理论和系统发育学中。近期基于树拓扑结构的数值表示(称为F-矩阵)可通过Fréchet均值总结树的样本,并提供新的树平衡度量。然而,带秩无标记树的数量随叶子数呈超指数增长,导致计算密集,现有方法依赖混合整数规划和基于模拟的算法。此外,F-矩阵难以解释,且其分布仅在中性分支条件下用一阶和二阶矩描述。本文提出带秩无标记树的马尔可夫链嵌入方法,大幅缩减状态空间规模。利用该嵌入,我们开发了一种高效计算所有Fréchet均值的算法,并采用离散相型理论推导树平衡指数的联合分布。同时,利用离散相型理论将F-矩阵矩的已有结论推广至任意阶,适用于任何时间齐次且分叉的溯祖模型。基于此框架,我们构建了三种中性检验方法,模拟数据表明其检验功效优于现有方法。

0
下载
关闭预览

相关内容

Nat. Commun. | 深度学习将大分子分解为独立的马尔可夫域
专知会员服务
17+阅读 · 2022年12月9日
临床自然语言处理中的嵌入综述,SECNLP: A survey of embeddings
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
0+阅读 · 21分钟前
《通过小型无人机系统将情报能力“作战化”》
消耗优势:美军的“精确规模化”概念
专知会员服务
8+阅读 · 6月15日
相关VIP内容
Nat. Commun. | 深度学习将大分子分解为独立的马尔可夫域
专知会员服务
17+阅读 · 2022年12月9日
临床自然语言处理中的嵌入综述,SECNLP: A survey of embeddings
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员