Wearable devices collect time-varying biobehavioral data, offering opportunities to investigate how behaviors influence health outcomes. However, these data often contain measurement error and excess zeros (due to nonwear, sedentary behavior, or connectivity issues), each characterized by subject-specific distributions. Current statistical methods fail to address these issues simultaneously. We introduce a novel modeling framework for zero-inflated and error-prone functional data by incorporating a subject-specific time-varying validity indicator that explicitly distinguishes structural zeros from intrinsic values. We iteratively estimate the latent functional covariates and zero-inflation probabilities via maximum likelihood, using basis expansions and linear mixed models to adjust for measurement error. To assess the effects of the recovered latent covariates, we apply joint quantile regression across multiple quantile levels. Through extensive simulations, we demonstrate that our approach significantly improves estimation accuracy over methods that only address measurement error, and joint estimation yields substantial improvements compared with fitting separate quantile regressions. Applied to a childhood obesity study, our approach effectively corrects for zero inflation and measurement error in step counts, yielding results that closely align with energy expenditure and supporting their use as a proxy for physical activity.


翻译:可穿戴设备收集随时间变化的生物行为数据,为探究行为如何影响健康结局提供了契机。然而,这类数据常包含测量误差与过量零值(由设备未佩戴、久坐行为或连接问题导致),且两者均呈现个体特异性分布特征。现有统计方法无法同时处理这些问题。本文提出一种针对零膨胀含误差函数型数据的新型建模框架,通过引入个体特异性时变有效性指标,显式区分结构性零值与内在真值。我们采用基函数展开与线性混合模型校正测量误差,通过最大似然估计迭代求解潜函数型协变量及零膨胀概率。为评估复原后潜协变量的效应,我们在多重分位数水平上应用联合分位数回归方法。大量模拟研究表明:相较于仅处理测量误差的方法,本方法显著提升了估计精度;且与独立拟合分位数回归相比,联合估计能带来实质性改进。在儿童肥胖研究中的应用表明,本方法能有效修正步数数据中的零膨胀与测量误差,所得结果与能量消耗高度吻合,支持将步数作为体力活动的有效代理指标。

0
下载
关闭预览

相关内容

零样本量化:综述
专知会员服务
12+阅读 · 2025年5月15日
非平稳过程异常监测方法:综述与展望
专知会员服务
23+阅读 · 2024年7月16日
【CMU博士论文】分布偏移下的不确定性量化,226页pdf
专知会员服务
31+阅读 · 2023年9月30日
索邦大学121页博士论文《时间序列中的无监督异常检测》
专知会员服务
103+阅读 · 2022年7月25日
数据受限条件下的多模态处理技术综述
专知
22+阅读 · 2022年7月16日
自定义损失函数Gradient Boosting
AI研习社
14+阅读 · 2018年10月16日
异常检测的阈值,你怎么选?给你整理好了...
机器学习算法与Python学习
10+阅读 · 2018年9月19日
数据分析师应该知道的16种回归方法:负二项回归
数萃大数据
74+阅读 · 2018年9月16日
详解常见的损失函数
七月在线实验室
20+阅读 · 2018年7月12日
FCS 论坛 | 孟德宇:误差建模原理
FCS
15+阅读 · 2017年8月17日
侦测欺诈交易(异常点检测)
GBASE数据工程部数据团队
20+阅读 · 2017年5月10日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员