测量误差与零膨胀修正：面向标量-函数分位数回归的函数型协变量处理 (Correcting Measurement Error and Zero Inflation in Functional Covariates for Scalar-on-Function Quantile Regression) - 专知论文

会员服务 ·

0

测量误差 · 标量 · 特异 · 可穿戴设备 · 生物 ·

Correcting Measurement Error and Zero Inflation in Functional Covariates for Scalar-on-Function Quantile Regression

翻译：测量误差与零膨胀修正：面向标量-函数分位数回归的函数型协变量处理

Caihong Qin,Lan Xue,Ufuk Beyaztas,Roger S. Zoh,Mark Benden,Jeff Goldsmith,Carmen D. Tekwe

Wearable devices collect time-varying biobehavioral data, offering opportunities to investigate how behaviors influence health outcomes. However, these data often contain measurement error and excess zeros (due to nonwear, sedentary behavior, or connectivity issues), each characterized by subject-specific distributions. Current statistical methods fail to address these issues simultaneously. We introduce a novel modeling framework for zero-inflated and error-prone functional data by incorporating a subject-specific time-varying validity indicator that explicitly distinguishes structural zeros from intrinsic values. We iteratively estimate the latent functional covariates and zero-inflation probabilities via maximum likelihood, using basis expansions and linear mixed models to adjust for measurement error. To assess the effects of the recovered latent covariates, we apply joint quantile regression across multiple quantile levels. Through extensive simulations, we demonstrate that our approach significantly improves estimation accuracy over methods that only address measurement error, and joint estimation yields substantial improvements compared with fitting separate quantile regressions. Applied to a childhood obesity study, our approach effectively corrects for zero inflation and measurement error in step counts, yielding results that closely align with energy expenditure and supporting their use as a proxy for physical activity.

翻译：可穿戴设备收集随时间变化的生物行为数据，为探究行为如何影响健康结局提供了契机。然而，这类数据常包含测量误差与过量零值（由设备未佩戴、久坐行为或连接问题导致），且两者均呈现个体特异性分布特征。现有统计方法无法同时处理这些问题。本文提出一种针对零膨胀含误差函数型数据的新型建模框架，通过引入个体特异性时变有效性指标，显式区分结构性零值与内在真值。我们采用基函数展开与线性混合模型校正测量误差，通过最大似然估计迭代求解潜函数型协变量及零膨胀概率。为评估复原后潜协变量的效应，我们在多重分位数水平上应用联合分位数回归方法。大量模拟研究表明：相较于仅处理测量误差的方法，本方法显著提升了估计精度；且与独立拟合分位数回归相比，联合估计能带来实质性改进。在儿童肥胖研究中的应用表明，本方法能有效修正步数数据中的零膨胀与测量误差，所得结果与能量消耗高度吻合，支持将步数作为体力活动的有效代理指标。

0

相关内容

测量误差

零样本量化：综述

零样本量化：综述

专知会员服务

12+阅读 · 2025年5月15日

非平稳过程异常监测方法：综述与展望

非平稳过程异常监测方法：综述与展望

专知会员服务

23+阅读 · 2024年7月16日

《分析将零信任模式应用于运行技术系统的可行性和益处》2023最新83页论文

《分析将零信任模式应用于运行技术系统的可行性和益处》2023最新83页论文

专知会员服务

32+阅读 · 2023年12月1日

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

专知会员服务

31+阅读 · 2023年9月30日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

103+阅读 · 2022年7月25日

《用于工业设计异常检测和参数余量预测的无监督概率和核回归方法》234页博士论文

《用于工业设计异常检测和参数余量预测的无监督概率和核回归方法》234页博士论文

专知会员服务

20+阅读 · 2022年5月12日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知会员服务

76+阅读 · 2022年4月30日

【论文推荐WWW2020-UIUC】修正排序系统中的选择偏差：Correcting for Selection Bias in Learning-to-rank Systems

【论文推荐WWW2020-UIUC】修正排序系统中的选择偏差：Correcting for Selection Bias in Learning-to-rank Systems

专知会员服务

32+阅读 · 2020年2月1日

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

专知会员服务

31+阅读 · 2020年1月11日

【独立研究者I-Sheng Yang论文】因果机器学习损失函数（A Loss-Function for Causal Machine-Learning）

【独立研究者I-Sheng Yang论文】因果机器学习损失函数（A Loss-Function for Causal Machine-Learning）

专知会员服务

20+阅读 · 2020年1月7日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知

16+阅读 · 2022年5月3日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

自定义损失函数Gradient Boosting

自定义损失函数Gradient Boosting

AI研习社

14+阅读 · 2018年10月16日

异常检测的阈值，你怎么选？给你整理好了...

异常检测的阈值，你怎么选？给你整理好了...

机器学习算法与Python学习

10+阅读 · 2018年9月19日

数据分析师应该知道的16种回归方法：负二项回归

数据分析师应该知道的16种回归方法：负二项回归

数萃大数据

74+阅读 · 2018年9月16日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

FCS 论坛 | 孟德宇：误差建模原理

FCS 论坛 | 孟德宇：误差建模原理

FCS

15+阅读 · 2017年8月17日

侦测欺诈交易（异常点检测）

侦测欺诈交易（异常点检测）

GBASE数据工程部数据团队

20+阅读 · 2017年5月10日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

半参数回归模型中随机误差分布的检验问题

国家自然科学基金

2+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

整数关系探测的误差可控算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

一般误差分布下若干半参数模型的复合分位数方法

国家自然科学基金

0+阅读 · 2014年12月31日

连续变量量子误差修正的实验研究

国家自然科学基金

0+阅读 · 2014年12月31日

Stochastic EM Estimation and Inference for Zero-Inflated Beta-Binomial Mixed Models for Longitudinal Count Data

Arxiv

0+阅读 · 2月9日

Adaptive Off-Policy Inference for M-Estimators Under Model Misspecification

Arxiv

0+阅读 · 2月8日

Correcting for Nonignorable Nonresponse Bias in Ordinal Observational Survey Data

Arxiv

0+阅读 · 2月7日

Understanding Fairness and Prediction Error through Subspace Decomposition and Influence Analysis

Arxiv

0+阅读 · 2月7日

Missing At Random as Covariate Shift: Correcting Bias in Iterative Imputation

Arxiv

0+阅读 · 2月6日

A Flexible Modeling of Extremes in the Presence of Inliers

Arxiv

0+阅读 · 2月5日

Counting models with excessive zeros ensuring stochastic monotonicity

Arxiv

0+阅读 · 2月2日

Causal Characterization of Measurement and Mechanistic Anomalies

Arxiv

0+阅读 · 1月30日

Causal Imitation Learning Under Measurement Error and Distribution Shift

Arxiv

0+阅读 · 1月29日

Transportability of Regression Calibration with External Validation Studies for Measurement Error Correction

Arxiv

0+阅读 · 1月25日

VIP会员

文章信息

相关主题

可穿戴设备

相关VIP内容

零样本量化：综述

零样本量化：综述

专知会员服务

12+阅读 · 2025年5月15日

非平稳过程异常监测方法：综述与展望

非平稳过程异常监测方法：综述与展望

专知会员服务

23+阅读 · 2024年7月16日

《分析将零信任模式应用于运行技术系统的可行性和益处》2023最新83页论文

《分析将零信任模式应用于运行技术系统的可行性和益处》2023最新83页论文

专知会员服务

32+阅读 · 2023年12月1日

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

专知会员服务

31+阅读 · 2023年9月30日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

103+阅读 · 2022年7月25日

《用于工业设计异常检测和参数余量预测的无监督概率和核回归方法》234页博士论文

《用于工业设计异常检测和参数余量预测的无监督概率和核回归方法》234页博士论文

专知会员服务

20+阅读 · 2022年5月12日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知会员服务

76+阅读 · 2022年4月30日

【论文推荐WWW2020-UIUC】修正排序系统中的选择偏差：Correcting for Selection Bias in Learning-to-rank Systems

【论文推荐WWW2020-UIUC】修正排序系统中的选择偏差：Correcting for Selection Bias in Learning-to-rank Systems

专知会员服务

32+阅读 · 2020年2月1日

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

专知会员服务

31+阅读 · 2020年1月11日

【独立研究者I-Sheng Yang论文】因果机器学习损失函数（A Loss-Function for Causal Machine-Learning）

【独立研究者I-Sheng Yang论文】因果机器学习损失函数（A Loss-Function for Causal Machine-Learning）

专知会员服务

20+阅读 · 2020年1月7日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知

16+阅读 · 2022年5月3日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

自定义损失函数Gradient Boosting

自定义损失函数Gradient Boosting

AI研习社

14+阅读 · 2018年10月16日

异常检测的阈值，你怎么选？给你整理好了...

异常检测的阈值，你怎么选？给你整理好了...

机器学习算法与Python学习

10+阅读 · 2018年9月19日

数据分析师应该知道的16种回归方法：负二项回归

数据分析师应该知道的16种回归方法：负二项回归

数萃大数据

74+阅读 · 2018年9月16日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

FCS 论坛 | 孟德宇：误差建模原理

FCS 论坛 | 孟德宇：误差建模原理

FCS

15+阅读 · 2017年8月17日

侦测欺诈交易（异常点检测）

侦测欺诈交易（异常点检测）

GBASE数据工程部数据团队

20+阅读 · 2017年5月10日

相关论文

Stochastic EM Estimation and Inference for Zero-Inflated Beta-Binomial Mixed Models for Longitudinal Count Data

Arxiv

0+阅读 · 2月9日

Adaptive Off-Policy Inference for M-Estimators Under Model Misspecification

Arxiv

0+阅读 · 2月8日

Correcting for Nonignorable Nonresponse Bias in Ordinal Observational Survey Data

Arxiv

0+阅读 · 2月7日

Understanding Fairness and Prediction Error through Subspace Decomposition and Influence Analysis

Arxiv

0+阅读 · 2月7日

Missing At Random as Covariate Shift: Correcting Bias in Iterative Imputation

Arxiv

0+阅读 · 2月6日

A Flexible Modeling of Extremes in the Presence of Inliers

Arxiv

0+阅读 · 2月5日

Counting models with excessive zeros ensuring stochastic monotonicity

Arxiv

0+阅读 · 2月2日

Causal Characterization of Measurement and Mechanistic Anomalies

Arxiv

0+阅读 · 1月30日

Causal Imitation Learning Under Measurement Error and Distribution Shift

Arxiv

0+阅读 · 1月29日

Transportability of Regression Calibration with External Validation Studies for Measurement Error Correction

Arxiv

0+阅读 · 1月25日

相关基金

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

半参数回归模型中随机误差分布的检验问题

国家自然科学基金

2+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

整数关系探测的误差可控算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

一般误差分布下若干半参数模型的复合分位数方法

国家自然科学基金

0+阅读 · 2014年12月31日

连续变量量子误差修正的实验研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员