风险包容性上下文多臂赌博机在早期临床试验中的应用 (Risk-inclusive Contextual Bandits for Early Phase Clinical Trials) - 专知论文

会员服务 ·

0

多臂赌博机 · 赌博机 · 有效性 · 上下文 · 试验 ·

Risk-inclusive Contextual Bandits for Early Phase Clinical Trials

翻译：风险包容性上下文多臂赌博机在早期临床试验中的应用

Rohit Kanrar,Chunlin Li,Zara Ghodsi,Margaret Gamalo

Early-phase clinical trials face the challenge of selecting optimal drug doses that balance safety and efficacy due to uncertain dose-response relationships and varied participant characteristics. Traditional randomized dose allocation often exposes participants to sub-optimal doses by not considering individual covariates, necessitating larger sample sizes and prolonging drug development. This paper introduces a risk-inclusive contextual bandit algorithm that utilizes multi-arm bandit (MAB) strategies to optimize dosing through participant-specific data integration. By combining two separate Thompson samplers, one for efficacy and one for safety, the algorithm enhances the balance between efficacy and safety in dose allocation. The effect sizes are estimated with a generalized version of asymptotic confidence sequences (AsympCS), offering a uniform coverage guarantee for sequential causal inference over time. The validity of AsympCS is also established in the MAB setup with a possibly mis-specified model. The empirical results demonstrate the strengths of this method in optimizing dose allocation compared to randomized allocations and traditional contextual bandits focused solely on efficacy. Moreover, an application on real data generated from a recent Phase IIb study aligns with actual findings.

翻译：早期临床试验面临选择最佳药物剂量的挑战，需要在安全性和有效性之间取得平衡，这源于剂量-反应关系的不确定性以及参与者特征的多样性。传统的随机剂量分配方法通常不考虑个体协变量，导致参与者暴露于次优剂量，从而需要更大的样本量并延长药物开发周期。本文提出一种风险包容性上下文多臂赌博机算法，该算法利用多臂赌博机策略，通过整合参与者特异性数据来优化剂量分配。通过结合两个独立的汤普森采样器（一个用于有效性评估，一个用于安全性评估），该算法增强了剂量分配中有效性与安全性之间的平衡。效应量通过渐近置信序列的广义版本进行估计，为时序因果推断提供了统一的覆盖保证。在模型可能设定错误的情况下，渐近置信序列在多臂赌博机框架中的有效性也得到了验证。实证结果表明，与随机分配以及仅关注有效性的传统上下文多臂赌博机相比，该方法在优化剂量分配方面具有显著优势。此外，在最近一项IIb期研究产生的真实数据上的应用结果与实际发现相符。

0

相关内容

多臂赌博机

多臂赌博机

【普林斯顿博士论文】量化、评估与缓解现代机器学习系统中的风险

【普林斯顿博士论文】量化、评估与缓解现代机器学习系统中的风险

专知会员服务

21+阅读 · 2025年10月20日

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

48+阅读 · 2025年9月8日

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

专知会员服务

24+阅读 · 2025年8月14日

【ETHZ博士论文】贝叶斯优化：风险规避与计算效率决策，183页pdf

【ETHZ博士论文】贝叶斯优化：风险规避与计算效率决策，183页pdf

专知会员服务

30+阅读 · 2024年1月19日

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

专知会员服务

45+阅读 · 2023年9月19日

【牛津大学博士论文】面向电子健康记录的深度学习:风险预测、可解释性和不确定性，200页pdf

【牛津大学博士论文】面向电子健康记录的深度学习:风险预测、可解释性和不确定性，200页pdf

专知会员服务

46+阅读 · 2023年7月18日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知会员服务

254+阅读 · 2022年11月15日

《不确定性下的国防能力组合选择》2022最新41页技术报告，加拿大国防研究与发展部

《不确定性下的国防能力组合选择》2022最新41页技术报告，加拿大国防研究与发展部

专知会员服务

32+阅读 · 2022年10月26日

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

专知会员服务

87+阅读 · 2022年10月16日

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

专知会员服务

36+阅读 · 2019年12月12日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

49+阅读 · 2022年11月16日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

MIT最新博士论文《用于个性化医疗和保险的新型机器学习算法》，350页pdf

MIT最新博士论文《用于个性化医疗和保险的新型机器学习算法》，350页pdf

专知

10+阅读 · 2022年5月2日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

PyTorch Parallel Training（单机多卡并行、混合精度、同步BN训练指南文档）

PyTorch Parallel Training（单机多卡并行、混合精度、同步BN训练指南文档）

CVer

21+阅读 · 2020年6月20日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

操作风险动态量化方法研究：从微观机构到宏观系统

国家自然科学基金

1+阅读 · 2015年12月31日

基于正交级数展开的多体系统混合不确定性研究

国家自然科学基金

1+阅读 · 2015年12月31日

上市后药品不良反应信号检测中双稳健方法的构建

国家自然科学基金

0+阅读 · 2015年12月31日

随机接入中的分布式功率控制和数据包编码传输

国家自然科学基金

0+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

劣者淘汰两阶段自适应临床试验的设计和分析

国家自然科学基金

0+阅读 · 2014年12月31日

基于网络传导的金融系统风险度量：理论及其应用

国家自然科学基金

2+阅读 · 2014年12月31日

保险金融市场中相依风险模型的随机最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

非对称随机波动建模及其在金融风险管理中的应用研究

国家自然科学基金

4+阅读 · 2014年12月31日

概率抽样设计及其统计推断方法

国家自然科学基金

6+阅读 · 2014年12月31日

Robust evaluation of treatment effects in longitudinal studies with truncation by death or other intercurrent events

Arxiv

0+阅读 · 3月11日

Safety-Driven Response Adaptive Randomisation: An Application in Non-inferiority Oncology Trials

Arxiv

0+阅读 · 2月19日

Bandit Learning in Matching Markets with Interviews

Arxiv

0+阅读 · 2月12日

Modern Causal Inference Approaches to Improve Power for Subgroup Analysis in Randomized Controlled Trials

Arxiv

0+阅读 · 2月11日

Doubly Robust Estimation of Desirability of Outcome Ranking (DOOR) Probability with Application to MDRO Studies

Arxiv

0+阅读 · 2月10日

Some Bayesian Perspectives on Clinical Trials

Arxiv

0+阅读 · 2月9日

A Causal Machine Learning Framework for Treatment Personalization in Clinical Trials: Application to Ulcerative Colitis

Arxiv

0+阅读 · 2月9日

Meta-analysis of diagnostic test accuracy with multiple disease stages: combining stage-specific and merged-stage data

Arxiv

0+阅读 · 2月8日

Benchmarking covariate-adjustment strategies for randomized clinical trials

Arxiv

0+阅读 · 1月31日

Data-driven controlled subgroup selection in clinical trials

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

多臂赌博机

最新内容

【CMU博士论文】迈向可解释机器学习的理论基础

【CMU博士论文】迈向可解释机器学习的理论基础

专知会员服务

0+阅读 · 今天12:23

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

专知会员服务

0+阅读 · 今天12:21

无人机视觉语言导航：研究进展、挑战与技术路线图

无人机视觉语言导航：研究进展、挑战与技术路线图

专知会员服务

0+阅读 · 今天12:13

《基于强化学习的反无人机蜂群拦截优先级排序》

《基于强化学习的反无人机蜂群拦截优先级排序》

专知会员服务

7+阅读 · 今天8:20

乌克兰反无人机方案“天穹哨兵”解析：一款人工智能驱动的近程防空系统

乌克兰反无人机方案“天穹哨兵”解析：一款人工智能驱动的近程防空系统

专知会员服务

2+阅读 · 今天7:30

美军2026条令《指挥官装甲装备维护技能测试计划》

美军2026条令《指挥官装甲装备维护技能测试计划》

专知会员服务

5+阅读 · 今天7:28

《俄罗斯构建服务于人工智能驱动自主性的主权无人机生态系统》（2026报告）

《俄罗斯构建服务于人工智能驱动自主性的主权无人机生态系统》（2026报告）

专知会员服务

6+阅读 · 今天3:09

2026年俄罗斯新型喷气动力无人机Geran-5的技术规格

2026年俄罗斯新型喷气动力无人机Geran-5的技术规格

专知会员服务

3+阅读 · 今天2:50

基于数据优化的人机协同与机器人僚机

基于数据优化的人机协同与机器人僚机

专知会员服务

4+阅读 · 今天2:08

美太空军发布两份聚焦2040年规划的文件：《2040年未来作战环境》和《2040年目标部队》（附文件）

美太空军发布两份聚焦2040年规划的文件：《2040年未来作战环境》和《2040年目标部队》（附文件）

专知会员服务

12+阅读 · 今天1:51

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

专知会员服务

8+阅读 · 4月15日

《认知战作为一个战略域：媒体生态系统、社交网络与社会韧性的侵蚀》

《认知战作为一个战略域：媒体生态系统、社交网络与社会韧性的侵蚀》

专知会员服务

5+阅读 · 4月15日

美陆军设想无人系统司令部

美陆军设想无人系统司令部

专知会员服务

3+阅读 · 4月15日

【博士论文】已对齐人工智能系统的持久脆弱性

【博士论文】已对齐人工智能系统的持久脆弱性

专知会员服务

5+阅读 · 4月15日

人工智能对指挥控制的加速及其对陆军的影响（中文报告）

人工智能对指挥控制的加速及其对陆军的影响（中文报告）

专知会员服务

5+阅读 · 4月15日

相关VIP内容

【普林斯顿博士论文】量化、评估与缓解现代机器学习系统中的风险

【普林斯顿博士论文】量化、评估与缓解现代机器学习系统中的风险

专知会员服务

21+阅读 · 2025年10月20日

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

48+阅读 · 2025年9月8日

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

专知会员服务

24+阅读 · 2025年8月14日

【ETHZ博士论文】贝叶斯优化：风险规避与计算效率决策，183页pdf

【ETHZ博士论文】贝叶斯优化：风险规避与计算效率决策，183页pdf

专知会员服务

30+阅读 · 2024年1月19日

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

专知会员服务

45+阅读 · 2023年9月19日

【牛津大学博士论文】面向电子健康记录的深度学习:风险预测、可解释性和不确定性，200页pdf

【牛津大学博士论文】面向电子健康记录的深度学习:风险预测、可解释性和不确定性，200页pdf

专知会员服务

46+阅读 · 2023年7月18日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知会员服务

254+阅读 · 2022年11月15日

《不确定性下的国防能力组合选择》2022最新41页技术报告，加拿大国防研究与发展部

《不确定性下的国防能力组合选择》2022最新41页技术报告，加拿大国防研究与发展部

专知会员服务

32+阅读 · 2022年10月26日

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

专知会员服务

87+阅读 · 2022年10月16日

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

专知会员服务

36+阅读 · 2019年12月12日

热门VIP内容

开通专知VIP会员享更多权益服务

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

《基于强化学习的反无人机蜂群拦截优先级排序》

【CMU博士论文】迈向可解释机器学习的理论基础

无人机视觉语言导航：研究进展、挑战与技术路线图

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

49+阅读 · 2022年11月16日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

MIT最新博士论文《用于个性化医疗和保险的新型机器学习算法》，350页pdf

MIT最新博士论文《用于个性化医疗和保险的新型机器学习算法》，350页pdf

专知

10+阅读 · 2022年5月2日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

PyTorch Parallel Training（单机多卡并行、混合精度、同步BN训练指南文档）

PyTorch Parallel Training（单机多卡并行、混合精度、同步BN训练指南文档）

CVer

21+阅读 · 2020年6月20日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

相关论文

Robust evaluation of treatment effects in longitudinal studies with truncation by death or other intercurrent events

Arxiv

0+阅读 · 3月11日

Safety-Driven Response Adaptive Randomisation: An Application in Non-inferiority Oncology Trials

Arxiv

0+阅读 · 2月19日

Bandit Learning in Matching Markets with Interviews

Arxiv

0+阅读 · 2月12日

Modern Causal Inference Approaches to Improve Power for Subgroup Analysis in Randomized Controlled Trials

Arxiv

0+阅读 · 2月11日

Doubly Robust Estimation of Desirability of Outcome Ranking (DOOR) Probability with Application to MDRO Studies

Arxiv

0+阅读 · 2月10日

Some Bayesian Perspectives on Clinical Trials

Arxiv

0+阅读 · 2月9日

A Causal Machine Learning Framework for Treatment Personalization in Clinical Trials: Application to Ulcerative Colitis

Arxiv

0+阅读 · 2月9日

Meta-analysis of diagnostic test accuracy with multiple disease stages: combining stage-specific and merged-stage data

Arxiv

0+阅读 · 2月8日

Benchmarking covariate-adjustment strategies for randomized clinical trials

Arxiv

0+阅读 · 1月31日

Data-driven controlled subgroup selection in clinical trials

Arxiv

0+阅读 · 1月30日

相关基金

操作风险动态量化方法研究：从微观机构到宏观系统

国家自然科学基金

1+阅读 · 2015年12月31日

基于正交级数展开的多体系统混合不确定性研究

国家自然科学基金

1+阅读 · 2015年12月31日

上市后药品不良反应信号检测中双稳健方法的构建

国家自然科学基金

0+阅读 · 2015年12月31日

随机接入中的分布式功率控制和数据包编码传输

国家自然科学基金

0+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

劣者淘汰两阶段自适应临床试验的设计和分析

国家自然科学基金

0+阅读 · 2014年12月31日

基于网络传导的金融系统风险度量：理论及其应用

国家自然科学基金

2+阅读 · 2014年12月31日

保险金融市场中相依风险模型的随机最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

非对称随机波动建模及其在金融风险管理中的应用研究

国家自然科学基金

4+阅读 · 2014年12月31日

概率抽样设计及其统计推断方法

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员