Bayesian nonparametric models for zero-inflated count-compositional data using ensembles of regression trees - 专知论文

会员服务 ·

0

Bayesian nonparametric models for zero-inflated count-compositional data using ensembles of regression trees

翻译：基于回归树集成的零膨胀计数与组成数据的贝叶斯非参数模型

André F. B. Menezes,Andrew C. Parnell,Keefe Murphy

Count-compositional data arise in many different fields, including high-throughput sequencing experiments, ecological surveys, and palaeoclimate studies, where a common, important goal is to understand how covariates relate to the observed compositions. Existing methods often fail to simultaneously address key challenges inherent in such data, namely: overdispersion, an excess of zeros, cross-sample heterogeneity, and complex covariate effects. To address these concerns, we propose two novel Bayesian models based on ensembles of regression trees. Specifically, we leverage the recently introduced zero-and-$N$-inflated multinomial distribution and assign independent nonparametric Bayesian additive regression tree (BART) priors to both the compositional and structural zero probability components of the model, to flexibly capture covariate effects. We further extend this by adding latent random effects to capture overdispersion and more general dependence structures among the categories. We develop an efficient inferential algorithm combining recent data augmentation schemes with established BART sampling routines. We evaluate our proposed models in simulation studies and illustrate their applicability through a case study of palaeoclimate modelling.

翻译：计数组成数据广泛出现在高通量测序实验、生态调查和古气候研究等多个领域，其中一个共同且重要的目标是理解协变量如何与观测到的组成结构相关联。现有方法通常无法同时应对此类数据固有的关键挑战，即：过度离散、过量零值、跨样本异质性以及复杂的协变量效应。为解决这些问题，我们提出两种基于回归树集成的新型贝叶斯模型。具体而言，我们利用新近引入的零与N值膨胀多项分布，将独立的非参数贝叶斯加性回归树先验分别赋予模型的成分概率和结构零概率分量，以灵活捕捉协变量效应。我们进一步扩展该模型，通过添加潜在随机效应来捕获过度离散及类别间更一般的依赖结构。我们开发了一种高效的推断算法，结合了近期数据增广方案与成熟的BART采样流程。我们通过模拟研究评估了所提出的模型，并通过古气候建模案例研究展示了其适用性。

0

相关内容

【新书】非负矩阵与张量分解：在探索性多向数据分析与盲源分离中的应用，205页pdf

【新书】非负矩阵与张量分解：在探索性多向数据分析与盲源分离中的应用，205页pdf

专知会员服务

23+阅读 · 2025年9月21日

【牛津大学博士论文】流形假设下的贝叶斯非参数估计

【牛津大学博士论文】流形假设下的贝叶斯非参数估计

专知会员服务

19+阅读 · 2025年5月1日

何恺明NeurIPS 2024论文《无条件生成的回归：一种自监督表征生成方法》

何恺明NeurIPS 2024论文《无条件生成的回归：一种自监督表征生成方法》

专知会员服务

21+阅读 · 2024年11月4日

【牛津大学博士论文】通过贝叶斯实验设计实现自动化数据采集

【牛津大学博士论文】通过贝叶斯实验设计实现自动化数据采集

专知会员服务

31+阅读 · 2024年11月4日

面向关系型数据与知识图谱的数据集成技术综述

面向关系型数据与知识图谱的数据集成技术综述

专知会员服务

53+阅读 · 2022年12月30日

【MIT博士论文】高维贝叶斯线性建模:层次建模、推理和评价的进展，250页pdf

【MIT博士论文】高维贝叶斯线性建模:层次建模、推理和评价的进展，250页pdf

专知会员服务

46+阅读 · 2022年10月1日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

【Nature】贝叶斯统计与建模综述，26页pdf

【Nature】贝叶斯统计与建模综述，26页pdf

专知会员服务

77+阅读 · 2021年1月21日

【伯克利】自回归模型的局部掩卷积，Locally Masked Convolution for Autoregressive Models

【伯克利】自回归模型的局部掩卷积，Locally Masked Convolution for Autoregressive Models

专知会员服务

20+阅读 · 2020年6月23日

【IJCAI2020】统计相关模型，A Complete Characterization of Projectivity for Statistical Relational Models

【IJCAI2020】统计相关模型，A Complete Characterization of Projectivity for Statistical Relational Models

专知会员服务

20+阅读 · 2020年4月25日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

常用的模型集成方法介绍：bagging、boosting 、stacking

常用的模型集成方法介绍：bagging、boosting 、stacking

机器之心

14+阅读 · 2019年5月15日

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

专知

42+阅读 · 2019年1月22日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

数据分析师应该知道的16种回归方法：负二项回归

数据分析师应该知道的16种回归方法：负二项回归

数萃大数据

74+阅读 · 2018年9月16日

数据分析师应该知道的16种回归技术：偏最小二乘回归

数据分析师应该知道的16种回归技术：偏最小二乘回归

数萃大数据

14+阅读 · 2018年8月29日

统计学常用数据类型

统计学常用数据类型

论智

19+阅读 · 2018年7月6日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

机器学习研究会

21+阅读 · 2018年1月21日

删失数据超高维共线性模型的变量选择

国家自然科学基金

0+阅读 · 2017年12月31日

含非正态及缺失数据的结构方程模型分析

国家自然科学基金

0+阅读 · 2015年12月31日

可扩展的蛋白质组学大数据存储与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维半参数模型假设检验问题的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

17+阅读 · 2015年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

变换结构方程模型的非参数贝叶斯分析

国家自然科学基金

4+阅读 · 2014年12月31日

代谢组学数据的多层次融合和模型评价方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

Bayesian Modeling of the Stochastic Block Model for Weighted Network Data with Zero-Inflated Negative Binomial Distribution

Arxiv

0+阅读 · 4月27日

Bayesian Modeling of the Stochastic Block Model for Weighted Network Data with Zero-Inflated Negative Binomial Distribution

Arxiv

0+阅读 · 4月22日

Bayesian Nonparametric Modeling for Multivariate Conditional Copula Regression with Varying Coefficients

Arxiv

0+阅读 · 4月14日

Bayesian Semiparametric Multivariate Density Regression with Coordinate-Wise Predictor Selection

Arxiv

0+阅读 · 4月9日

Bayesian covariance regression for differential network analysis of zero-inflated microbiome data

Arxiv

0+阅读 · 4月2日

Bayesian Nonparametrics for Principal Stratification with Continuous Post-Treatment Variables

Arxiv

0+阅读 · 3月25日

Nonparametric Empirical Bayes Estimation on Heterogeneous Data

Arxiv

0+阅读 · 3月24日

A scalable Bayesian functional factor model for high-dimensional longitudinal molecular data

Arxiv

0+阅读 · 3月21日

Conditional Copula models using loss-based Bayesian Additive Regression Trees

Arxiv

0+阅读 · 3月10日

Bayesian Variational Inference for Mixed Data Mixture Models

Arxiv

0+阅读 · 3月2日

VIP会员

文章信息

相关主题

最新内容

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

0+阅读 · 10分钟前

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

1+阅读 · 22分钟前

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

1+阅读 · 33分钟前

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

1+阅读 · 42分钟前

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

1+阅读 · 46分钟前

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

1+阅读 · 50分钟前

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

1+阅读 · 54分钟前

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

相关VIP内容

【新书】非负矩阵与张量分解：在探索性多向数据分析与盲源分离中的应用，205页pdf

【新书】非负矩阵与张量分解：在探索性多向数据分析与盲源分离中的应用，205页pdf

专知会员服务

23+阅读 · 2025年9月21日

【牛津大学博士论文】流形假设下的贝叶斯非参数估计

【牛津大学博士论文】流形假设下的贝叶斯非参数估计

专知会员服务

19+阅读 · 2025年5月1日

何恺明NeurIPS 2024论文《无条件生成的回归：一种自监督表征生成方法》

何恺明NeurIPS 2024论文《无条件生成的回归：一种自监督表征生成方法》

专知会员服务

21+阅读 · 2024年11月4日

【牛津大学博士论文】通过贝叶斯实验设计实现自动化数据采集

【牛津大学博士论文】通过贝叶斯实验设计实现自动化数据采集

专知会员服务

31+阅读 · 2024年11月4日

面向关系型数据与知识图谱的数据集成技术综述

面向关系型数据与知识图谱的数据集成技术综述

专知会员服务

53+阅读 · 2022年12月30日

【MIT博士论文】高维贝叶斯线性建模:层次建模、推理和评价的进展，250页pdf

【MIT博士论文】高维贝叶斯线性建模:层次建模、推理和评价的进展，250页pdf

专知会员服务

46+阅读 · 2022年10月1日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

【Nature】贝叶斯统计与建模综述，26页pdf

【Nature】贝叶斯统计与建模综述，26页pdf

专知会员服务

77+阅读 · 2021年1月21日

【伯克利】自回归模型的局部掩卷积，Locally Masked Convolution for Autoregressive Models

【伯克利】自回归模型的局部掩卷积，Locally Masked Convolution for Autoregressive Models

专知会员服务

20+阅读 · 2020年6月23日

【IJCAI2020】统计相关模型，A Complete Characterization of Projectivity for Statistical Relational Models

【IJCAI2020】统计相关模型，A Complete Characterization of Projectivity for Statistical Relational Models

专知会员服务

20+阅读 · 2020年4月25日

热门VIP内容

开通专知VIP会员享更多权益服务

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

美以伊冲突：无人机与人工智能的运用

《特种部队在透明战场中的生存力》最新报告

相关资讯

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

常用的模型集成方法介绍：bagging、boosting 、stacking

常用的模型集成方法介绍：bagging、boosting 、stacking

机器之心

14+阅读 · 2019年5月15日

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

专知

42+阅读 · 2019年1月22日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

数据分析师应该知道的16种回归方法：负二项回归

数据分析师应该知道的16种回归方法：负二项回归

数萃大数据

74+阅读 · 2018年9月16日

数据分析师应该知道的16种回归技术：偏最小二乘回归

数据分析师应该知道的16种回归技术：偏最小二乘回归

数萃大数据

14+阅读 · 2018年8月29日

统计学常用数据类型

统计学常用数据类型

论智

19+阅读 · 2018年7月6日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

机器学习研究会

21+阅读 · 2018年1月21日

相关论文

Bayesian Modeling of the Stochastic Block Model for Weighted Network Data with Zero-Inflated Negative Binomial Distribution

Arxiv

0+阅读 · 4月27日

Bayesian Modeling of the Stochastic Block Model for Weighted Network Data with Zero-Inflated Negative Binomial Distribution

Arxiv

0+阅读 · 4月22日

Bayesian Nonparametric Modeling for Multivariate Conditional Copula Regression with Varying Coefficients

Arxiv

0+阅读 · 4月14日

Bayesian Semiparametric Multivariate Density Regression with Coordinate-Wise Predictor Selection

Arxiv

0+阅读 · 4月9日

Bayesian covariance regression for differential network analysis of zero-inflated microbiome data

Arxiv

0+阅读 · 4月2日

Bayesian Nonparametrics for Principal Stratification with Continuous Post-Treatment Variables

Arxiv

0+阅读 · 3月25日

Nonparametric Empirical Bayes Estimation on Heterogeneous Data

Arxiv

0+阅读 · 3月24日

A scalable Bayesian functional factor model for high-dimensional longitudinal molecular data

Arxiv

0+阅读 · 3月21日

Conditional Copula models using loss-based Bayesian Additive Regression Trees

Arxiv

0+阅读 · 3月10日

Bayesian Variational Inference for Mixed Data Mixture Models

Arxiv

0+阅读 · 3月2日

相关基金

删失数据超高维共线性模型的变量选择

国家自然科学基金

0+阅读 · 2017年12月31日

含非正态及缺失数据的结构方程模型分析

国家自然科学基金

0+阅读 · 2015年12月31日

可扩展的蛋白质组学大数据存储与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维半参数模型假设检验问题的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

17+阅读 · 2015年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

变换结构方程模型的非参数贝叶斯分析

国家自然科学基金

4+阅读 · 2014年12月31日

代谢组学数据的多层次融合和模型评价方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员