Discovery and inference beyond linearity for epidemiological data by integrating Bayesian regression, tree ensembles and Shapley values - 专知论文

会员服务 ·

0

推断 · 线性的 · Integration · 集成 · ML ·

Discovery and inference beyond linearity for epidemiological data by integrating Bayesian regression, tree ensembles and Shapley values

翻译：通过整合贝叶斯回归、树集成与Shapley值实现流行病学数据的非线性发现与推断

Giorgio Spadaccini,Marjolein Fokkema,Mark A. van de Wiel

Machine Learning (ML) is gaining popularity in epidemiology and healthcare studies for hypothesis-free discovery of risk and protective factors. ML is strong at discovering nonlinearities and interactions, but this power is compromised by a lack of reliable inference. Although Shapley values provide local measures of features' effects, valid uncertainty quantification for these effects is typically lacking, thus precluding statistical inference. We propose RuleSHAP, a framework that addresses this limitation by combining a dedicated Bayesian sparse regression model with an improved tree-based rule generator and Shapley value attribution. RuleSHAP provides detection of nonlinear and interaction effects, with uncertainty quantification at the individual level as a key contribution. We derive an efficient formula for computing marginal Shapley values within this framework. We apply RuleSHAP to data from an epidemiological cohort to detect and infer several effects for high cholesterol and blood pressure, such as nonlinear interaction effects between features like age, sex, ethnicity, BMI and glucose level. To conclude, we demonstrate the validity of our framework on simulated data.

翻译：机器学习（ML）在流行病学和医疗健康研究中日益流行，用于无假设发现风险因素与保护因素。ML擅长发现非线性关系与交互作用，但这一能力因缺乏可靠推断而受限。尽管Shapley值能提供变量效应的局部度量，但这些效应通常缺乏有效的不确定性量化，从而阻碍了统计推断。我们提出RuleSHAP框架，通过将专用贝叶斯稀疏回归模型与改进的基于树的规则生成器及Shapley值归因相结合，解决了这一局限。RuleSHAP能够检测非线性效应与交互效应，其关键贡献在于实现了个体层面的不确定性量化。我们推导了在该框架内计算边际Shapley值的高效公式。将RuleSHAP应用于某流行病学队列数据，检测并推断出高胆固醇与血压的若干效应，例如年龄、性别、种族、BMI及血糖水平等变量间的非线性交互效应。最后，我们通过模拟数据验证了该框架的有效性。

0

相关内容

不平衡数据学习的全面综述

不平衡数据学习的全面综述

专知会员服务

44+阅读 · 2025年2月15日

【ETHZ博士论文】利用时间信息：自回归模型中长期依赖性学习的方法

【ETHZ博士论文】利用时间信息：自回归模型中长期依赖性学习的方法

专知会员服务

25+阅读 · 2024年1月2日

《通过数学演绎推理产生形式智能，并作为从数据模式中归纳推理产生知识的补充》2022最新论文，加拿大国防研究与发展部

《通过数学演绎推理产生形式智能，并作为从数据模式中归纳推理产生知识的补充》2022最新论文，加拿大国防研究与发展部

专知会员服务

29+阅读 · 2023年1月11日

博士论文《对抗环境中的深度学习》全面讲解对抗深度学习，169页PDF

博士论文《对抗环境中的深度学习》全面讲解对抗深度学习，169页PDF

专知会员服务

64+阅读 · 2022年4月29日

综述：药物发现中的机器学习

专知会员服务

86+阅读 · 2021年10月11日

对抗学习如何应用到推荐系统？ECIR2021<对抗学习推荐系统>教程，197页ppt

专知会员服务

46+阅读 · 2021年3月29日

【MLSS2020】最新《贝叶斯推断》教程，125页ppt与视频，DeepMind Shakir Mohamed博士

【MLSS2020】最新《贝叶斯推断》教程，125页ppt与视频，DeepMind Shakir Mohamed博士

专知会员服务

120+阅读 · 2020年7月11日

【MLSS2020】流数据贝叶斯预测，米兰Sonia Petrone教授，80页ppt

【MLSS2020】流数据贝叶斯预测，米兰Sonia Petrone教授，80页ppt

专知会员服务

48+阅读 · 2020年7月5日

【开放书】贝叶斯推理与机器学习，690页pdf，Bayesian Reasoning and Machine Learning

【开放书】贝叶斯推理与机器学习，690页pdf，Bayesian Reasoning and Machine Learning

专知会员服务

192+阅读 · 2020年5月30日

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

专知会员服务

103+阅读 · 2020年3月8日

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

专知

19+阅读 · 2022年10月23日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

牛津大学YARIN GAL《贝叶斯深度学习》入门教程，336页ppt

牛津大学YARIN GAL《贝叶斯深度学习》入门教程，336页ppt

专知

36+阅读 · 2019年9月1日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

专知

41+阅读 · 2019年1月22日

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

AI研习社

13+阅读 · 2018年6月8日

【论文推荐】最新七篇推荐系统相关论文—协同度量学习、SQL-Rank、用户行为与神经网络、隐私价格、贝叶斯、 IoT、序列感知

【论文推荐】最新七篇推荐系统相关论文—协同度量学习、SQL-Rank、用户行为与神经网络、隐私价格、贝叶斯、 IoT、序列感知

专知

10+阅读 · 2018年3月9日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

机器学习研究会

21+阅读 · 2018年1月21日

【推荐】(Python)多种模型(Naive Bayes, SVM, CNN, LSTM, etc)实现推文情感分析

【推荐】(Python)多种模型(Naive Bayes, SVM, CNN, LSTM, etc)实现推文情感分析

机器学习研究会

13+阅读 · 2017年12月25日

贝叶斯网分解理论及其应用

国家自然科学基金

16+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于非参数贝叶斯推断的RNA甲基化谱分解及关键致病酶基因的预测

国家自然科学基金

0+阅读 · 2015年12月31日

基于略图挖掘的在不同时空域的网络流式数据实时处理

国家自然科学基金

1+阅读 · 2015年12月31日

基于在线社会媒体数据的疾病传播过程中人类行为变化机制与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

Explaining a probabilistic prediction on the simplex with Shapley compositions

Arxiv

0+阅读 · 6月3日

Sparse Bayesian Deep Functional Learning with Structured Region Selection

Arxiv

0+阅读 · 6月3日

DiffUNet^2: Bidirectional Prediction, Probabilistic Generation and Collaborative Visual Discovery for Scientific Data

Arxiv

0+阅读 · 6月2日

ShaplEIG: Bayesian Experimental Design for Shapley Value Estimation

Arxiv

0+阅读 · 6月1日

A Bayesian Approach to Membership Inference for Statistical Release

Arxiv

0+阅读 · 5月28日

Linear Causal Representation Learning by Topological Ordering, Pruning, and Disentanglement

Arxiv

0+阅读 · 5月27日

Efficient sequential Bayesian inference for state-space epidemic models using ensemble data assimilation

Arxiv

0+阅读 · 5月18日

XAI and Statistical Analysis for Reliable Intrusion Detection in the UAVIDS-2025 Dataset: From Tree to Hybrid and Tabular DNN Ensembles

Arxiv

0+阅读 · 5月13日

EpiCastBench: Datasets and Benchmarks for Multivariate Epidemic Forecasting

Arxiv

0+阅读 · 5月12日

Econometric vs. Causal Structure-Learning for Time-Series Policy Decisions: Evidence from the UK COVID-19 Policies

Arxiv

0+阅读 · 5月8日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

4+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

5+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

9+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

6+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

8+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

11+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

5+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

7+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

7+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

6+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

7+阅读 · 6月16日

相关VIP内容

不平衡数据学习的全面综述

不平衡数据学习的全面综述

专知会员服务

44+阅读 · 2025年2月15日

【ETHZ博士论文】利用时间信息：自回归模型中长期依赖性学习的方法

【ETHZ博士论文】利用时间信息：自回归模型中长期依赖性学习的方法

专知会员服务

25+阅读 · 2024年1月2日

《通过数学演绎推理产生形式智能，并作为从数据模式中归纳推理产生知识的补充》2022最新论文，加拿大国防研究与发展部

《通过数学演绎推理产生形式智能，并作为从数据模式中归纳推理产生知识的补充》2022最新论文，加拿大国防研究与发展部

专知会员服务

29+阅读 · 2023年1月11日

博士论文《对抗环境中的深度学习》全面讲解对抗深度学习，169页PDF

博士论文《对抗环境中的深度学习》全面讲解对抗深度学习，169页PDF

专知会员服务

64+阅读 · 2022年4月29日

综述：药物发现中的机器学习

专知会员服务

86+阅读 · 2021年10月11日

对抗学习如何应用到推荐系统？ECIR2021<对抗学习推荐系统>教程，197页ppt

专知会员服务

46+阅读 · 2021年3月29日

【MLSS2020】最新《贝叶斯推断》教程，125页ppt与视频，DeepMind Shakir Mohamed博士

【MLSS2020】最新《贝叶斯推断》教程，125页ppt与视频，DeepMind Shakir Mohamed博士

专知会员服务

120+阅读 · 2020年7月11日

【MLSS2020】流数据贝叶斯预测，米兰Sonia Petrone教授，80页ppt

【MLSS2020】流数据贝叶斯预测，米兰Sonia Petrone教授，80页ppt

专知会员服务

48+阅读 · 2020年7月5日

【开放书】贝叶斯推理与机器学习，690页pdf，Bayesian Reasoning and Machine Learning

【开放书】贝叶斯推理与机器学习，690页pdf，Bayesian Reasoning and Machine Learning

专知会员服务

192+阅读 · 2020年5月30日

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

专知会员服务

103+阅读 · 2020年3月8日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

专知

19+阅读 · 2022年10月23日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

牛津大学YARIN GAL《贝叶斯深度学习》入门教程，336页ppt

牛津大学YARIN GAL《贝叶斯深度学习》入门教程，336页ppt

专知

36+阅读 · 2019年9月1日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

专知

41+阅读 · 2019年1月22日

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

AI研习社

13+阅读 · 2018年6月8日

【论文推荐】最新七篇推荐系统相关论文—协同度量学习、SQL-Rank、用户行为与神经网络、隐私价格、贝叶斯、 IoT、序列感知

【论文推荐】最新七篇推荐系统相关论文—协同度量学习、SQL-Rank、用户行为与神经网络、隐私价格、贝叶斯、 IoT、序列感知

专知

10+阅读 · 2018年3月9日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

机器学习研究会

21+阅读 · 2018年1月21日

【推荐】(Python)多种模型(Naive Bayes, SVM, CNN, LSTM, etc)实现推文情感分析

【推荐】(Python)多种模型(Naive Bayes, SVM, CNN, LSTM, etc)实现推文情感分析

机器学习研究会

13+阅读 · 2017年12月25日

相关论文

Explaining a probabilistic prediction on the simplex with Shapley compositions

Arxiv

0+阅读 · 6月3日

Sparse Bayesian Deep Functional Learning with Structured Region Selection

Arxiv

0+阅读 · 6月3日

DiffUNet^2: Bidirectional Prediction, Probabilistic Generation and Collaborative Visual Discovery for Scientific Data

Arxiv

0+阅读 · 6月2日

ShaplEIG: Bayesian Experimental Design for Shapley Value Estimation

Arxiv

0+阅读 · 6月1日

A Bayesian Approach to Membership Inference for Statistical Release

Arxiv

0+阅读 · 5月28日

Linear Causal Representation Learning by Topological Ordering, Pruning, and Disentanglement

Arxiv

0+阅读 · 5月27日

Efficient sequential Bayesian inference for state-space epidemic models using ensemble data assimilation

Arxiv

0+阅读 · 5月18日

XAI and Statistical Analysis for Reliable Intrusion Detection in the UAVIDS-2025 Dataset: From Tree to Hybrid and Tabular DNN Ensembles

Arxiv

0+阅读 · 5月13日

EpiCastBench: Datasets and Benchmarks for Multivariate Epidemic Forecasting

Arxiv

0+阅读 · 5月12日

Econometric vs. Causal Structure-Learning for Time-Series Policy Decisions: Evidence from the UK COVID-19 Policies

Arxiv

0+阅读 · 5月8日

相关基金

贝叶斯网分解理论及其应用

国家自然科学基金

16+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于非参数贝叶斯推断的RNA甲基化谱分解及关键致病酶基因的预测

国家自然科学基金

0+阅读 · 2015年12月31日

基于略图挖掘的在不同时空域的网络流式数据实时处理

国家自然科学基金

1+阅读 · 2015年12月31日

基于在线社会媒体数据的疾病传播过程中人类行为变化机制与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员