Retrospective cohorts can be extracted from Electronic Health Records (EHR) to study prevalence, time until disease or event occurrence and cure proportion in real world scenarios. However, EHR are collected for patient care rather than research, so typically have complexities, such as patients with missing baseline disease status. Prevalence-Incidence (PI) models, which use a two-component mixture model to account for this missing data, have been proposed. However, PI models are biased in settings in which some individuals will never experience the endpoint (they are 'cured'). To address this, we propose a Prevalence Incidence Cure (PIC) model, a 3 component mixture model that combines the PI model framework with a cure model. Our PIC model enables estimation of the prevalence, time-to-incidence, and the cure proportion, and allows for covariates to affect these. We adopt a Bayesian inference approach, and focus on the interpretability of the prior. We show in a simulation study that the PIC model has smaller bias than a PI model for the survival probability; and compare inference under vague, informative and misspecified priors. We illustrate our model using a dataset of 1964 patients undergoing treatment for Diabetic Macular Oedema, demonstrating improved fit under the PIC model.


翻译:回顾性队列可从电子健康记录中提取,用于研究真实世界场景中的患病率、疾病或事件发生时间以及治愈比例。然而,电子健康记录是为患者护理而非研究目的收集的,因此通常存在复杂性,例如患者基线疾病状态缺失。已有研究提出患病率-发病率模型,该模型使用双组分混合模型来处理此类缺失数据。然而,在部分个体永远不会经历终点事件(即他们被'治愈')的情况下,患病率-发病率模型存在偏差。为解决此问题,我们提出了一种患病率-发病率治愈模型,这是一种将患病率-发病率模型框架与治愈模型相结合的三组分混合模型。我们的患病率-发病率治愈模型能够估计患病率、发病时间以及治愈比例,并允许协变量影响这些参数。我们采用贝叶斯推断方法,并重点关注先验分布的可解释性。我们在模拟研究中表明,对于生存概率,患病率-发病率治愈模型比患病率-发病率模型具有更小的偏差;并比较了在模糊、信息性和错误设定先验下的推断结果。我们使用一个包含1964名接受糖尿病性黄斑水肿治疗的患者的数据库来说明我们的模型,证明了患病率-发病率治愈模型具有更好的拟合效果。

0
下载
关闭预览

相关内容

健康是指一个人在身体、精神和社会等方面都处于良好的状态。 健康包括两个方面的内容:

一是主要脏器无疾病,身体形态发育良好,体形均匀,人体各系统具有良好的生理功能,有较强的身体活动能力和劳动能力,这是对健康最基本的要求;

二是对疾病的抵抗能力较强,能够适应环境变化,各种生理刺激以及致病因素对身体的作用。传统的健康观是“无病即健康”,现代人的健康观是整体健康,世界卫生组织提出“健康不仅是躯体没有疾病,还要具备心理健康、社会适应良好和有道德”。因此,现代人的健康内容包括:躯体健康、心理健康、心灵健康、社会健康、智力健康、道德健康、环境健康等。健康是人的基本权利。健康是人生的第一财富。
利用表示学习推动多机构电子健康记录数据研究
专知会员服务
16+阅读 · 2025年2月17日
【华侨大学】基于混合深度学习算法的疾病预测模型
专知会员服务
97+阅读 · 2020年1月21日
【AI与医学】多模态机器学习精准医疗健康
【NER综述】近五年中文电子病历命名实体识别研究进展
深度学习自然语言处理
12+阅读 · 2020年8月24日
医疗中的自动机器学习和可解释性
专知
24+阅读 · 2019年4月1日
贝叶斯机器学习前沿进展
机器学习研究会
21+阅读 · 2018年1月21日
[推荐] 这些年,我用过的点击率(CTR)预估模型!!!
菜鸟的机器学习
28+阅读 · 2017年7月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
22+阅读 · 2014年12月31日
VIP会员
相关VIP内容
利用表示学习推动多机构电子健康记录数据研究
专知会员服务
16+阅读 · 2025年2月17日
【华侨大学】基于混合深度学习算法的疾病预测模型
专知会员服务
97+阅读 · 2020年1月21日
相关基金
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
22+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员