Correcting for Missing Data When Evaluating Surrogate Markers in a Clinical Trial - 专知论文

会员服务 ·

0

缺失数据 · 试验 · 效用 · 极大 · 极大似然 ·

Correcting for Missing Data When Evaluating Surrogate Markers in a Clinical Trial

翻译：在临床试验中评估替代标志物时校正缺失数据

Sarah C. Lotspeich,P. D. Anh. Nguyen,Layla Parast

from arxiv, 19 pages, 4 tables, 3 figures, R package and GitHub repository with simulation code

Evaluating treatment effects is critical in clinical trials but sometimes involves lengthy, invasive, or costly follow-up procedures. In these cases, surrogate markers, which provide intermediate measures of the long-term treatment effect, allow clinicians to obtain results faster and more efficiently than would have otherwise been possible. Prior to adoption, it is vital that the utility of surrogate markers (i.e., their ability to capture the treatment effect on the primary outcome) is statistically validated. Many frameworks for evaluating surrogate markers have been proposed, but they do not account for missing data. Instead, they rely on complete cases (the subset of patients without missing data), which can be inefficient and biased. To improve on this, we propose methods to accommodate missing data in nonparametric and parametric surrogate evaluation via inverse probability weighting (IPW) and semiparametric maximum likelihood estimation (SMLE). Through simulation studies, we demonstrate that the proposed methods remain unbiased under a broader range of missing data mechanisms than complete case analysis and can help retain the statistical precision of the full trial. We illustrate their practical utility through an application to a diabetes clinical trial. Moreover, our missing data corrections have complementary strengths with respect to computational ease, robustness, and statistical efficiency. All methods are implemented in the MissSurrogate R package.

翻译：评估治疗效果在临床试验中至关重要，但有时涉及冗长、侵入性或昂贵的随访程序。在这些情况下，替代标志物（提供长期治疗效果的中间测量指标）使临床医生能够比传统方法更快、更高效地获取结果。在采用替代标志物之前，必须对其效用（即捕捉主要结局治疗效果的能力）进行统计验证。目前已提出多种评估替代标志物的框架，但均未考虑缺失数据问题。这些方法通常依赖完整病例（无缺失数据的患者子集），这可能导致效率低下和偏倚。为改进这一状况，我们提出通过逆概率加权（IPW）和半参数极大似然估计（SMLE）在非参数与参数替代标志物评估中处理缺失数据的方法。模拟研究表明，与完整病例分析相比，所提方法在更广泛的缺失数据机制下仍能保持无偏性，并有助于保留完整试验的统计精度。我们通过一项糖尿病临床试验的应用实例展示了其实用价值。此外，我们的缺失数据校正方法在计算简便性、稳健性和统计效率方面具有互补优势。所有方法均已集成在MissSurrogate R语言包中。

0

相关内容

缺失数据

在统计调查的过程中，由于受访者对问题的遗漏、拒绝，或是调查员与调查问卷本身存在的一些疏忽，使得记录经常会出现缺失数据 (Missing Data) 的问题。但是，几乎所有标准统计方法都假设每个个案具有可用于分析的所有变量信息，因此缺失数据就成为进行统计研究或问卷调查的工作人员所必须解决的一个问题。

【博士论文】在缺失数据情况下的深度自监督学习

【博士论文】在缺失数据情况下的深度自监督学习

专知会员服务

35+阅读 · 2024年12月27日

【ETH博士论文】标签和数据稀缺下的故障诊断，130页pdf

【ETH博士论文】标签和数据稀缺下的故障诊断，130页pdf

专知会员服务

69+阅读 · 2023年7月28日

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

专知会员服务

37+阅读 · 2023年7月22日

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

专知会员服务

84+阅读 · 2022年7月20日

因果推断在医药图像的应用：数据缺失和数据不匹配

因果推断在医药图像的应用：数据缺失和数据不匹配

专知会员服务

58+阅读 · 2022年4月2日

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

专知会员服务

23+阅读 · 2021年11月25日

元学习-生物医学中连接标记和未标记数据

元学习-生物医学中连接标记和未标记数据

专知会员服务

30+阅读 · 2021年8月3日

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

专知会员服务

63+阅读 · 2020年5月23日

【论文推荐】用于低资源药物发现的元学习初始化，Meta-Learning Initializations for Low-Resource Drug Discovery

【论文推荐】用于低资源药物发现的元学习初始化，Meta-Learning Initializations for Low-Resource Drug Discovery

专知会员服务

27+阅读 · 2020年3月26日

【论文推荐WWW2020-UIUC】修正排序系统中的选择偏差：Correcting for Selection Bias in Learning-to-rank Systems

【论文推荐WWW2020-UIUC】修正排序系统中的选择偏差：Correcting for Selection Bias in Learning-to-rank Systems

专知会员服务

32+阅读 · 2020年2月1日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

目标检测小tricks之样本不均衡处理

目标检测小tricks之样本不均衡处理

PaperWeekly

49+阅读 · 2019年4月5日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

异常检测的阈值，你怎么选？给你整理好了...

异常检测的阈值，你怎么选？给你整理好了...

机器学习算法与Python学习

10+阅读 · 2018年9月19日

赛尔原创 | ACM BCB 2018 CausalTriad: 从医学文本数据中推断出新的因果关系假设

赛尔原创 | ACM BCB 2018 CausalTriad: 从医学文本数据中推断出新的因果关系假设

哈工大SCIR

14+阅读 · 2018年6月28日

【机器视觉】表面缺陷检测：机器视觉检测技术

【机器视觉】表面缺陷检测：机器视觉检测技术

产业智能官

25+阅读 · 2018年5月30日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

基于临床代谢组学推断代谢功能异常的生物信息学方法

国家自然科学基金

1+阅读 · 2016年12月31日

评估出生缺陷风险的父源性表观遗传学标志物--相关印记基因筛选

国家自然科学基金

0+阅读 · 2016年12月31日

基于核酸分子门控染料释放的多色荧光信号同时获取传感器阵列用于肿瘤标志物检测

国家自然科学基金

0+阅读 · 2015年12月31日

协变量随机缺失和有测量误差数据下影响诊断精度的半参数模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

基于Medip-seq 和MRE-seq数据的甲基化水平的估计及差异性检验

国家自然科学基金

0+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

排序集抽样下随机删失数据的非参数估计

国家自然科学基金

1+阅读 · 2014年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

An Interdisciplinary and Cross-Task Review on Missing Data Imputation

Arxiv

0+阅读 · 4月24日

Identification strategies for combining an experimental study with external data

Arxiv

0+阅读 · 4月22日

Identification strategies for combining an experimental study with external data

Arxiv

0+阅读 · 4月17日

Evidence Sufficiency Under Delayed Ground Truth: Proxy Monitoring for Risk Decision Systems

Arxiv

0+阅读 · 4月17日

Causal inference for censored data with continuous marks

Arxiv

0+阅读 · 4月17日

On causal inference with marked point process data

Arxiv

0+阅读 · 4月14日

A Causal Framework for Evaluating Jointly Longitudinal Outcomes and Surrogate Markers: A State-Space Approach

Arxiv

0+阅读 · 4月14日

Evaluating Surrogates in Individualized Treatment Rules

Arxiv

0+阅读 · 4月10日

Evaluation of Individual and Trial Level Association Metrics in the Validation of a Binary Surrogate Endpoint for a True Time-to-Event Endpoint

Arxiv

0+阅读 · 3月19日

Hidden yet quantifiable: A lower bound for confounding strength using randomized trials

Arxiv

0+阅读 · 3月19日

VIP会员

文章信息

相关主题

最新内容

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

1+阅读 · 今天16:54

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

1+阅读 · 今天16:52

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

6+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

5+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

4+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

4+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

5+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

4+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

6+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

相关VIP内容

【博士论文】在缺失数据情况下的深度自监督学习

【博士论文】在缺失数据情况下的深度自监督学习

专知会员服务

35+阅读 · 2024年12月27日

【ETH博士论文】标签和数据稀缺下的故障诊断，130页pdf

【ETH博士论文】标签和数据稀缺下的故障诊断，130页pdf

专知会员服务

69+阅读 · 2023年7月28日

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

专知会员服务

37+阅读 · 2023年7月22日

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

专知会员服务

84+阅读 · 2022年7月20日

因果推断在医药图像的应用：数据缺失和数据不匹配

因果推断在医药图像的应用：数据缺失和数据不匹配

专知会员服务

58+阅读 · 2022年4月2日

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

专知会员服务

23+阅读 · 2021年11月25日

元学习-生物医学中连接标记和未标记数据

元学习-生物医学中连接标记和未标记数据

专知会员服务

30+阅读 · 2021年8月3日

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

专知会员服务

63+阅读 · 2020年5月23日

【论文推荐】用于低资源药物发现的元学习初始化，Meta-Learning Initializations for Low-Resource Drug Discovery

【论文推荐】用于低资源药物发现的元学习初始化，Meta-Learning Initializations for Low-Resource Drug Discovery

专知会员服务

27+阅读 · 2020年3月26日

【论文推荐WWW2020-UIUC】修正排序系统中的选择偏差：Correcting for Selection Bias in Learning-to-rank Systems

【论文推荐WWW2020-UIUC】修正排序系统中的选择偏差：Correcting for Selection Bias in Learning-to-rank Systems

专知会员服务

32+阅读 · 2020年2月1日

热门VIP内容

开通专知VIP会员享更多权益服务

Agentic RL：框架、实践与长程智能体训练

重新思考无人机时代的生存能力

综述 | 从问答到任务完成：Agent系统与Harness设计

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

相关资讯

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

目标检测小tricks之样本不均衡处理

目标检测小tricks之样本不均衡处理

PaperWeekly

49+阅读 · 2019年4月5日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

异常检测的阈值，你怎么选？给你整理好了...

异常检测的阈值，你怎么选？给你整理好了...

机器学习算法与Python学习

10+阅读 · 2018年9月19日

赛尔原创 | ACM BCB 2018 CausalTriad: 从医学文本数据中推断出新的因果关系假设

赛尔原创 | ACM BCB 2018 CausalTriad: 从医学文本数据中推断出新的因果关系假设

哈工大SCIR

14+阅读 · 2018年6月28日

【机器视觉】表面缺陷检测：机器视觉检测技术

【机器视觉】表面缺陷检测：机器视觉检测技术

产业智能官

25+阅读 · 2018年5月30日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

相关论文

An Interdisciplinary and Cross-Task Review on Missing Data Imputation

Arxiv

0+阅读 · 4月24日

Identification strategies for combining an experimental study with external data

Arxiv

0+阅读 · 4月22日

Identification strategies for combining an experimental study with external data

Arxiv

0+阅读 · 4月17日

Evidence Sufficiency Under Delayed Ground Truth: Proxy Monitoring for Risk Decision Systems

Arxiv

0+阅读 · 4月17日

Causal inference for censored data with continuous marks

Arxiv

0+阅读 · 4月17日

On causal inference with marked point process data

Arxiv

0+阅读 · 4月14日

A Causal Framework for Evaluating Jointly Longitudinal Outcomes and Surrogate Markers: A State-Space Approach

Arxiv

0+阅读 · 4月14日

Evaluating Surrogates in Individualized Treatment Rules

Arxiv

0+阅读 · 4月10日

Evaluation of Individual and Trial Level Association Metrics in the Validation of a Binary Surrogate Endpoint for a True Time-to-Event Endpoint

Arxiv

0+阅读 · 3月19日

Hidden yet quantifiable: A lower bound for confounding strength using randomized trials

Arxiv

0+阅读 · 3月19日

相关基金

基于临床代谢组学推断代谢功能异常的生物信息学方法

国家自然科学基金

1+阅读 · 2016年12月31日

评估出生缺陷风险的父源性表观遗传学标志物--相关印记基因筛选

国家自然科学基金

0+阅读 · 2016年12月31日

基于核酸分子门控染料释放的多色荧光信号同时获取传感器阵列用于肿瘤标志物检测

国家自然科学基金

0+阅读 · 2015年12月31日

协变量随机缺失和有测量误差数据下影响诊断精度的半参数模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

基于Medip-seq 和MRE-seq数据的甲基化水平的估计及差异性检验

国家自然科学基金

0+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

排序集抽样下随机删失数据的非参数估计

国家自然科学基金

1+阅读 · 2014年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员