This study introduces an outlier-robust model for analyzing hierarchically structured bounded count data within a Bayesian framework, utilizing a logistic regression approach implemented in JAGS. Our model incorporates a t-distributed latent variable to address overdispersion and outliers, improving robustness compared to conventional models such as the beta-binomial, binomial-logit-normal, and standard binomial models. Notably, our model targets a pseudo-median that differs from the true discrete median by less than one count; this closed-form quantity provides a robust and interpretable measure of central tendency. For comparability between all models, we additionally make predictions based on the mean proportion; however, this involves an integration step for the t-distributed nuisance parameter. While limited literature specifically addresses outliers in mixed models for bounded count data, this research fills that gap. The practical utility of the model is demonstrated using a longitudinal medication adherence dataset, where patient behavior often results in abrupt changes and outliers within individual trajectories. A simulation study demonstrates the binomial-logit-t model's strong performance, with comparison statistics favoring it among the four evaluated models. An additional data contamination simulation confirms its robustness against outliers. Our robust approach maintains the integrity of the dataset, effectively handling outliers to provide more accurate and reliable parameter estimates.


翻译:本研究提出了一种在贝叶斯框架下分析分层结构有界计数数据的异常值稳健模型,该模型采用在JAGS中实现的逻辑回归方法。我们的模型引入了t分布潜变量来处理过度离散和异常值,相比传统模型(如beta-二项分布、二项-对数正态分布及标准二项模型)具有更强的稳健性。值得注意的是,该模型以伪中位数为目标,其与真实离散中位数的差异小于一个计数单位;这个闭式量提供了稳健且可解释的集中趋势度量。为保障所有模型间的可比性,我们还基于平均比例进行预测,但这涉及对t分布冗余参数的积分步骤。尽管现有文献专门针对有界计数数据混合模型中的异常值研究有限,但本研究填补了这一空白。通过纵向用药依从性数据集验证了该模型的实际效用,其中患者行为常导致个体轨迹的突变和异常值。模拟研究表明二项-对数-t模型表现优异,比较统计量在四个评估模型中均显示其优势。额外的数据污染模拟实验证实了其对异常值的稳健性。我们的稳健方法在保持数据集完整性的同时,能有效处理异常值,从而提供更准确可靠的参数估计。

0
下载
关闭预览

相关内容

非平稳过程异常监测方法: 综述与展望
专知会员服务
15+阅读 · 2024年9月5日
非平稳过程异常监测方法:综述与展望
专知会员服务
23+阅读 · 2024年7月16日
大型语言模型在预测和异常检测中的应用综述
专知会员服务
70+阅读 · 2024年2月19日
【NeurIPS2023】利用扩散模型进行异常值想象
专知会员服务
24+阅读 · 2023年10月1日
异常检测论文大列表:方法、应用、综述
专知
126+阅读 · 2019年7月15日
异常检测的阈值,你怎么选?给你整理好了...
机器学习算法与Python学习
10+阅读 · 2018年9月19日
数据分析师应该知道的16种回归方法:负二项回归
数萃大数据
74+阅读 · 2018年9月16日
数据分析师应该知道的16种回归方法:泊松回归
数萃大数据
35+阅读 · 2018年9月13日
数据分析师应该知道的16种回归方法:定序回归
数萃大数据
16+阅读 · 2018年9月9日
数据分析师应该知道的16种回归技术:分位数回归
数萃大数据
29+阅读 · 2018年8月8日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
非平稳过程异常监测方法: 综述与展望
专知会员服务
15+阅读 · 2024年9月5日
非平稳过程异常监测方法:综述与展望
专知会员服务
23+阅读 · 2024年7月16日
大型语言模型在预测和异常检测中的应用综述
专知会员服务
70+阅读 · 2024年2月19日
【NeurIPS2023】利用扩散模型进行异常值想象
专知会员服务
24+阅读 · 2023年10月1日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员