A General Framework for Optimal Group Sequential Testing via Mixed-Integer Linear Programming - 专知论文

会员服务 ·

0

最优 · 混合 · 整数线性规划 · 通用框架 · 假设检验 ·

A General Framework for Optimal Group Sequential Testing via Mixed-Integer Linear Programming

翻译：通过混合整数线性规划实现最优分组序贯测试的通用框架

Dae Woong Ham,Stefanus Jasin,Xuejun Zhao

Sequential hypothesis tests are widely adopted as a principled way to perform multiple tests on data that arrives over time. In particular, researchers frequently utilize group sequential hypothesis tests (GST) to test the same hypotheses at K times or "groups" while data arrives sequentially. In this setting, many methods have been proposed to allow researchers to uniformly control type-1 error across K checks (often known as various alpha-spending budgets). Although these methods are all successfully valid in controlling uniform type-1 error, it is not clear which of these methods are optimal when trying to reject the null as soon as possible. In this paper, we directly optimize the rejection criterion in the GST setting under the same constraints of controlling type-1 and type-2 errors. We use a sample average approximation combined with mixed integer linear programming (S-MILP) approach for this problem and show how our S-MILP approach dominates classical GST procedures such as Lan-DeMets, Pocock, and O'Brien-Fleming methods. We also find that the optimal solution typically aggressively spends the alpha-budget early, shedding insight to the long-standing debate of which alpha-spending budgets are more efficient. We finally apply our optimal S-MILP approach to a recent study on acute kidney injury interventions and find our optimal S-MILP approach can reach the same statistically significant conclusion faster than the original study and other GST methods.

翻译：序贯假设检验被广泛用作对随时间到达的数据进行多重检验的原则性方法。研究者常采用分组序贯假设检验（GST）在数据序贯到达期间对同一假设进行K次或"分组"检验。在此框架下，许多方法被提出以使研究者能在K次检验中统一控制第一类错误（通常称为各类α支出预算）。尽管这些方法在控制统一第一类错误方面均有效，但尚不明确其中哪些方法能在尽可能早地拒绝原假设时达到最优。本文在控制第一类与第二类错误的相同约束条件下，直接优化GST框架中的拒绝准则。我们采用样本平均近似与混合整数线性规划（S-MILP）相结合的方法解决该问题，并展示S-MILP方法如何优于Lan-DeMets、Pocock及O'Brien-Fleming等经典GST程序。研究同时发现，最优解通常会在早期激进地消耗α预算，这为长期存在的"何种α支出预算更有效"的争论提供了新见解。最终我们将所提出的最优S-MILP方法应用于一项急性肾损伤干预措施的最新研究，结果显示该方法能比原始研究及其他GST方法更快得出相同统计学显著结论。

0

相关内容

《结构化部分可观测下的序贯决策研究》2026年300页

《结构化部分可观测下的序贯决策研究》2026年300页

专知会员服务

16+阅读 · 7月11日

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

专知会员服务

8+阅读 · 5月6日

《战略智能体与有限反馈下的序贯决策》211页

《战略智能体与有限反馈下的序贯决策》211页

专知会员服务

37+阅读 · 2025年5月7日

美国防部测试和评估 |《序列分析综述》53页报告

美国防部测试和评估 |《序列分析综述》53页报告

专知会员服务

29+阅读 · 2023年2月26日

具有组合结构的统计推断和在线算法

具有组合结构的统计推断和在线算法

专知会员服务

12+阅读 · 2022年12月13日

《时间序列的机器学习：学习任务的分类，统一框架的开发，以及算法基准测试比较》博士论文277页，伦敦大学学院

《时间序列的机器学习：学习任务的分类，统一框架的开发，以及算法基准测试比较》博士论文277页，伦敦大学学院

专知会员服务

86+阅读 · 2022年8月4日

【Alex Nowak-Vila博士论文】有理论保证的结构化预测， Structured Prediction with Theoretical Guarantees

【Alex Nowak-Vila博士论文】有理论保证的结构化预测， Structured Prediction with Theoretical Guarantees

专知会员服务

13+阅读 · 2022年3月15日

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

专知会员服务

25+阅读 · 2021年10月3日

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

专知会员服务

27+阅读 · 2020年7月24日

【ECML-PKDD 2019】可解释序列分类的背景知识注入（Background Knowledge Injection forInterpretable Sequence Classification）

【ECML-PKDD 2019】可解释序列分类的背景知识注入（Background Knowledge Injection forInterpretable Sequence Classification）

专知会员服务

15+阅读 · 2019年12月3日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AINLP

10+阅读 · 2021年2月6日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

边界框的回归策略搞不懂？算法太多分不清？看这篇就够了

边界框的回归策略搞不懂？算法太多分不清？看这篇就够了

AI100

10+阅读 · 2019年9月4日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

图分类：结合胶囊网络Capsule和图卷积GCN（附代码）

图分类：结合胶囊网络Capsule和图卷积GCN（附代码）

专知

149+阅读 · 2019年2月26日

时序异常检测算法概览

时序异常检测算法概览

论智

29+阅读 · 2018年8月30日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

9+阅读 · 2015年12月31日

多重假设检验中的k-FWER控制

国家自然科学基金

0+阅读 · 2015年12月31日

类簇级测试中类测试序的生成技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

多重比较中控制FDR的有效检验方法

国家自然科学基金

0+阅读 · 2014年12月31日

一般最小低阶混杂设计中混杂结构的研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

多元数据与函数型数据的序贯检验方法与控制图研究

国家自然科学基金

0+阅读 · 2014年12月31日

Asymptotically Optimal Sequential Testing with Markovian Data

Arxiv

0+阅读 · 6月12日

Group Sequential Sample Size for Comparing Two Survival Probabilities at a Specific Time Point

Arxiv

0+阅读 · 6月9日

ALMAB-DC: Active Learning, Multi-Armed Bandits, and Distributed Computing for Sequential Experimental Design and Black-Box Optimization

Arxiv

0+阅读 · 6月3日

Sequential multiple testing with multiple hypotheses and prior information on the hypothesis configuration

Arxiv

0+阅读 · 5月30日

The Counting General Dominating Set Framework

Arxiv

0+阅读 · 5月19日

interwhen: A Generalizable Framework for Steering Reasoning Models with Test-time Verification

Arxiv

0+阅读 · 5月13日

Informative Simultaneous Confidence Intervals for Graphical Group Sequential Test Procedures

Arxiv

0+阅读 · 5月12日

Sequential Randomization Tests Using e-values: Applications for trial monitoring

Arxiv

0+阅读 · 5月10日

Optimal Error Exponents for Composite Sequential Quantum Hypothesis Testing

Arxiv

0+阅读 · 5月10日

Optimal Error Exponents for Composite Sequential Quantum Hypothesis Testing

Arxiv

0+阅读 · 5月6日

VIP会员

文章信息

相关主题

整数线性规划

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 今天4:35

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

3+阅读 · 今天4:24

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 今天4:18

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 今天4:15

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 今天4:08

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

《结构化部分可观测下的序贯决策研究》2026年300页

《结构化部分可观测下的序贯决策研究》2026年300页

专知会员服务

16+阅读 · 7月11日

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

专知会员服务

8+阅读 · 5月6日

《战略智能体与有限反馈下的序贯决策》211页

《战略智能体与有限反馈下的序贯决策》211页

专知会员服务

37+阅读 · 2025年5月7日

美国防部测试和评估 |《序列分析综述》53页报告

美国防部测试和评估 |《序列分析综述》53页报告

专知会员服务

29+阅读 · 2023年2月26日

具有组合结构的统计推断和在线算法

具有组合结构的统计推断和在线算法

专知会员服务

12+阅读 · 2022年12月13日

《时间序列的机器学习：学习任务的分类，统一框架的开发，以及算法基准测试比较》博士论文277页，伦敦大学学院

《时间序列的机器学习：学习任务的分类，统一框架的开发，以及算法基准测试比较》博士论文277页，伦敦大学学院

专知会员服务

86+阅读 · 2022年8月4日

【Alex Nowak-Vila博士论文】有理论保证的结构化预测， Structured Prediction with Theoretical Guarantees

【Alex Nowak-Vila博士论文】有理论保证的结构化预测， Structured Prediction with Theoretical Guarantees

专知会员服务

13+阅读 · 2022年3月15日

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

专知会员服务

25+阅读 · 2021年10月3日

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

专知会员服务

27+阅读 · 2020年7月24日

【ECML-PKDD 2019】可解释序列分类的背景知识注入（Background Knowledge Injection forInterpretable Sequence Classification）

【ECML-PKDD 2019】可解释序列分类的背景知识注入（Background Knowledge Injection forInterpretable Sequence Classification）

专知会员服务

15+阅读 · 2019年12月3日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AINLP

10+阅读 · 2021年2月6日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

边界框的回归策略搞不懂？算法太多分不清？看这篇就够了

边界框的回归策略搞不懂？算法太多分不清？看这篇就够了

AI100

10+阅读 · 2019年9月4日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

图分类：结合胶囊网络Capsule和图卷积GCN（附代码）

图分类：结合胶囊网络Capsule和图卷积GCN（附代码）

专知

149+阅读 · 2019年2月26日

时序异常检测算法概览

时序异常检测算法概览

论智

29+阅读 · 2018年8月30日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

相关论文

Asymptotically Optimal Sequential Testing with Markovian Data

Arxiv

0+阅读 · 6月12日

Group Sequential Sample Size for Comparing Two Survival Probabilities at a Specific Time Point

Arxiv

0+阅读 · 6月9日

ALMAB-DC: Active Learning, Multi-Armed Bandits, and Distributed Computing for Sequential Experimental Design and Black-Box Optimization

Arxiv

0+阅读 · 6月3日

Sequential multiple testing with multiple hypotheses and prior information on the hypothesis configuration

Arxiv

0+阅读 · 5月30日

The Counting General Dominating Set Framework

Arxiv

0+阅读 · 5月19日

interwhen: A Generalizable Framework for Steering Reasoning Models with Test-time Verification

Arxiv

0+阅读 · 5月13日

Informative Simultaneous Confidence Intervals for Graphical Group Sequential Test Procedures

Arxiv

0+阅读 · 5月12日

Sequential Randomization Tests Using e-values: Applications for trial monitoring

Arxiv

0+阅读 · 5月10日

Optimal Error Exponents for Composite Sequential Quantum Hypothesis Testing

Arxiv

0+阅读 · 5月10日

Optimal Error Exponents for Composite Sequential Quantum Hypothesis Testing

Arxiv

0+阅读 · 5月6日

相关基金

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

9+阅读 · 2015年12月31日

多重假设检验中的k-FWER控制

国家自然科学基金

0+阅读 · 2015年12月31日

类簇级测试中类测试序的生成技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

多重比较中控制FDR的有效检验方法

国家自然科学基金

0+阅读 · 2014年12月31日

一般最小低阶混杂设计中混杂结构的研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

多元数据与函数型数据的序贯检验方法与控制图研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员