Fixed-Horizon Self-Normalized Inference for Adaptive Experiments via Martingale AIPW/DML with Logged Propensities - 专知论文

会员服务 ·

0

方差 · 时域 · 自适应 · 归一化 · 推断 ·

Fixed-Horizon Self-Normalized Inference for Adaptive Experiments via Martingale AIPW/DML with Logged Propensities

翻译：固定时域自归一化推断：基于记录倾向性的鞅AIPW/DML方法在自适应实验中的应用

from arxiv, 32 pages. Comments welcome

Adaptive randomized experiments update treatment probabilities as data accrue, but still require an end-of-study interval for the average treatment effect (ATE) at a prespecified horizon. Under adaptive assignment, propensities can keep changing, so the predictable quadratic variation of AIPW/DML score increments may remain random. When no deterministic variance limit exists, Wald statistics normalized by a single long-run variance target can be conditionally miscalibrated given the realized variance regime. We assume no interference, sequential randomization, i.i.d. arrivals, and executed overlap on a prespecified scored set, and we require two auditable pipeline conditions: the platform logs the executed randomization probability for each unit, and the nuisance regressions used to score unit $t$ are constructed predictably from past data only. These conditions make the centered AIPW/DML scores an exact martingale difference sequence. Using self-normalized martingale limit theory, we show that the Studentized statistic, with variance estimated by realized quadratic variation, is asymptotically N(0,1) at the prespecified horizon, even without variance stabilization. Simulations validate the theory and highlight when standard fixed-variance Wald reporting fails.

翻译：自适应随机化实验在数据积累过程中不断更新处理概率，但仍需在预设时域处为平均处理效应（ATE）提供研究结束时的区间估计。在自适应分配下，倾向性可能持续变化，导致AIPW/DML评分增量的可预测二次变差仍保持随机性。当不存在确定性方差极限时，基于单一长期方差目标归一化的Wald统计量在给定已实现方差机制下可能出现条件性校准偏差。我们假设不存在干扰效应、满足序贯随机化、独立同分布个体到达，并在预设评分集上执行重叠性要求，同时提出两项可审计的流程条件：平台记录每个单元的已执行随机化概率，且用于对单元$t$评分的干扰回归仅基于历史数据可预测地构建。这些条件使得中心化的AIPW/DML评分构成精确的鞅差序列。利用自归一化鞅极限理论，我们证明即使没有方差稳定性，采用已实现二次变差估计方差的Student化统计量在预设时域处渐近服从N(0,1)分布。仿真实验验证了理论结果，并揭示了标准固定方差Wald报告方法失效的情形。

0

相关内容

【ICML2025】GCAL：使图模型适应不断演变的领域偏移

【ICML2025】GCAL：使图模型适应不断演变的领域偏移

专知会员服务

9+阅读 · 2025年5月23日

【ICML2025】用于概率时间序列预测的非平稳扩散方法

【ICML2025】用于概率时间序列预测的非平稳扩散方法

专知会员服务

10+阅读 · 2025年5月10日

【ICLR2025】通过自适应熵感知优化实现稳健的多模态开放集测试时自适应

【ICLR2025】通过自适应熵感知优化实现稳健的多模态开放集测试时自适应

专知会员服务

10+阅读 · 2025年1月24日

【CMU博士论文】强化学习中策略评估的统计推断

【CMU博士论文】强化学习中策略评估的统计推断

专知会员服务

26+阅读 · 2024年9月15日

【AAAI2024】TimesURL: 自监着对比学习在通用时间序列表征学习中的应用

【AAAI2024】TimesURL: 自监着对比学习在通用时间序列表征学习中的应用

专知会员服务

35+阅读 · 2023年12月28日

【ICML2023】特征和标签偏移下时间序列的域适应

【ICML2023】特征和标签偏移下时间序列的域适应

专知会员服务

26+阅读 · 2023年4月26日

【ICML2022】用神经控制微分方程建立反事实结果的连续时间模型

【ICML2022】用神经控制微分方程建立反事实结果的连续时间模型

专知会员服务

35+阅读 · 2022年6月24日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

58+阅读 · 2021年3月31日

【ICML2020投稿论文-DeepMind】时序差分学习的推理与泛化，Temporal Difference Learning

专知会员服务

26+阅读 · 2020年3月16日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

无所不能的Self-Attention！洛桑理工ICLR2020论文验证「自注意力可以表达任何CNN卷积滤波层」

无所不能的Self-Attention！洛桑理工ICLR2020论文验证「自注意力可以表达任何CNN卷积滤波层」

专知

24+阅读 · 2020年1月12日

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

专知

16+阅读 · 2019年12月29日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

解析广泛应用于NLP的自注意力机制（附论文、源码）

解析广泛应用于NLP的自注意力机制（附论文、源码）

数据派THU

12+阅读 · 2018年4月3日

基于自适应学习平台促进学生个性化学习的研究

基于自适应学习平台促进学生个性化学习的研究

MOOC

12+阅读 · 2018年4月2日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

极市分享|王晋东迁移学习中的领域自适应方法

极市分享|王晋东迁移学习中的领域自适应方法

极市平台

10+阅读 · 2017年12月11日

分数阶随机共振行为机制及其自适应控制与强色噪声背景中的微弱信号检测

国家自然科学基金

0+阅读 · 2015年12月31日

随机非线性量化反馈系统的自适应模糊控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

分数随机微分方程的定性理论研究及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

分数阶时滞随机微分方程中的随机共振现象与行为研究

国家自然科学基金

0+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

劣者淘汰两阶段自适应临床试验的设计和分析

国家自然科学基金

0+阅读 · 2014年12月31日

随机延迟微分方程数值解的延迟依赖稳定性及自适应技术

国家自然科学基金

0+阅读 · 2014年12月31日

协方差阵的推断及在方向数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Arxiv

0+阅读 · 3月9日

Stabilizing Thompson Sampling with Null Hypothesis Bayesian Response-Adaptive Randomization

Arxiv

0+阅读 · 3月9日

Stabilizing Test-Time Adaptation of High-Dimensional Simulation Surrogates via D-Optimal Statistics

Arxiv

0+阅读 · 2月17日

Anytime-Valid Inference in Adaptive Experiments: Covariate Adjustment and Balanced Power

Arxiv

0+阅读 · 2月13日

Adaptive Off-Policy Inference for M-Estimators Under Model Misspecification

Arxiv

0+阅读 · 2月8日

E-values for Adaptive Clinical Trials: Anytime-Valid Monitoring in Practice

Arxiv

0+阅读 · 2月6日

Federated Causal Inference from Multi-Site Observational Data via Propensity Score Aggregation

Arxiv

0+阅读 · 2月3日

Cumulative Treatment Effect Testing under Continuous Time Reinforcement Learning

Arxiv

0+阅读 · 2月2日

AdaptNC: Adaptive Nonconformity Scores for Uncertainty-Aware Autonomous Systems in Dynamic Environments

Arxiv

0+阅读 · 2月2日

Adaptive Benign Overfitting (ABO): Overparameterized RLS for Online Learning in Non-stationary Time-series

Arxiv

0+阅读 · 1月29日

VIP会员

文章信息

相关主题

最新内容

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

10+阅读 · 4月18日

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

9+阅读 · 4月18日

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

专知会员服务

8+阅读 · 4月18日

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

专知会员服务

14+阅读 · 4月18日

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

专知会员服务

7+阅读 · 4月18日

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

专知会员服务

9+阅读 · 4月18日

人工智能在战场行动中的演进及伊朗案例

人工智能在战场行动中的演进及伊朗案例

专知会员服务

7+阅读 · 4月18日

美AI公司Anthropic推出网络安全模型“Mythos”

美AI公司Anthropic推出网络安全模型“Mythos”

专知会员服务

4+阅读 · 4月18日

【博士论文】面向城市环境的可解释计算机视觉

【博士论文】面向城市环境的可解释计算机视觉

专知会员服务

5+阅读 · 4月18日

【CVPR2026】SEATrack：一种简明、高效且具备自适应能力的多模态跟踪器

【CVPR2026】SEATrack：一种简明、高效且具备自适应能力的多模态跟踪器

专知会员服务

4+阅读 · 4月18日

大语言模型的自改进机制：技术综述与未来展望

大语言模型的自改进机制：技术综述与未来展望

专知会员服务

7+阅读 · 4月18日

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

专知会员服务

11+阅读 · 4月18日

《分布式军事人工智能理论：部分可观测与通信条件下的协调约束多智能体强化学习》

《分布式军事人工智能理论：部分可观测与通信条件下的协调约束多智能体强化学习》

专知会员服务

11+阅读 · 4月18日

《第四代军事特种作战部队选拔与评估》

《第四代军事特种作战部队选拔与评估》

专知会员服务

3+阅读 · 4月18日

《迈向可解释强化学习及面向战略决策的定制化学习基准》（70页）

《迈向可解释强化学习及面向战略决策的定制化学习基准》（70页）

专知会员服务

6+阅读 · 4月18日

相关VIP内容

【ICML2025】GCAL：使图模型适应不断演变的领域偏移

【ICML2025】GCAL：使图模型适应不断演变的领域偏移

专知会员服务

9+阅读 · 2025年5月23日

【ICML2025】用于概率时间序列预测的非平稳扩散方法

【ICML2025】用于概率时间序列预测的非平稳扩散方法

专知会员服务

10+阅读 · 2025年5月10日

【ICLR2025】通过自适应熵感知优化实现稳健的多模态开放集测试时自适应

【ICLR2025】通过自适应熵感知优化实现稳健的多模态开放集测试时自适应

专知会员服务

10+阅读 · 2025年1月24日

【CMU博士论文】强化学习中策略评估的统计推断

【CMU博士论文】强化学习中策略评估的统计推断

专知会员服务

26+阅读 · 2024年9月15日

【AAAI2024】TimesURL: 自监着对比学习在通用时间序列表征学习中的应用

【AAAI2024】TimesURL: 自监着对比学习在通用时间序列表征学习中的应用

专知会员服务

35+阅读 · 2023年12月28日

【ICML2023】特征和标签偏移下时间序列的域适应

【ICML2023】特征和标签偏移下时间序列的域适应

专知会员服务

26+阅读 · 2023年4月26日

【ICML2022】用神经控制微分方程建立反事实结果的连续时间模型

【ICML2022】用神经控制微分方程建立反事实结果的连续时间模型

专知会员服务

35+阅读 · 2022年6月24日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

58+阅读 · 2021年3月31日

【ICML2020投稿论文-DeepMind】时序差分学习的推理与泛化，Temporal Difference Learning

专知会员服务

26+阅读 · 2020年3月16日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《利用大语言模型增强多域作战兵棋推演》（报告）

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

相关资讯

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

无所不能的Self-Attention！洛桑理工ICLR2020论文验证「自注意力可以表达任何CNN卷积滤波层」

无所不能的Self-Attention！洛桑理工ICLR2020论文验证「自注意力可以表达任何CNN卷积滤波层」

专知

24+阅读 · 2020年1月12日

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

专知

16+阅读 · 2019年12月29日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

解析广泛应用于NLP的自注意力机制（附论文、源码）

解析广泛应用于NLP的自注意力机制（附论文、源码）

数据派THU

12+阅读 · 2018年4月3日

基于自适应学习平台促进学生个性化学习的研究

基于自适应学习平台促进学生个性化学习的研究

MOOC

12+阅读 · 2018年4月2日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

极市分享|王晋东迁移学习中的领域自适应方法

极市分享|王晋东迁移学习中的领域自适应方法

极市平台

10+阅读 · 2017年12月11日

相关论文

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Arxiv

0+阅读 · 3月9日

Stabilizing Thompson Sampling with Null Hypothesis Bayesian Response-Adaptive Randomization

Arxiv

0+阅读 · 3月9日

Stabilizing Test-Time Adaptation of High-Dimensional Simulation Surrogates via D-Optimal Statistics

Arxiv

0+阅读 · 2月17日

Anytime-Valid Inference in Adaptive Experiments: Covariate Adjustment and Balanced Power

Arxiv

0+阅读 · 2月13日

Adaptive Off-Policy Inference for M-Estimators Under Model Misspecification

Arxiv

0+阅读 · 2月8日

E-values for Adaptive Clinical Trials: Anytime-Valid Monitoring in Practice

Arxiv

0+阅读 · 2月6日

Federated Causal Inference from Multi-Site Observational Data via Propensity Score Aggregation

Arxiv

0+阅读 · 2月3日

Cumulative Treatment Effect Testing under Continuous Time Reinforcement Learning

Arxiv

0+阅读 · 2月2日

AdaptNC: Adaptive Nonconformity Scores for Uncertainty-Aware Autonomous Systems in Dynamic Environments

Arxiv

0+阅读 · 2月2日

Adaptive Benign Overfitting (ABO): Overparameterized RLS for Online Learning in Non-stationary Time-series

Arxiv

0+阅读 · 1月29日

相关基金

分数阶随机共振行为机制及其自适应控制与强色噪声背景中的微弱信号检测

国家自然科学基金

0+阅读 · 2015年12月31日

随机非线性量化反馈系统的自适应模糊控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

分数随机微分方程的定性理论研究及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

分数阶时滞随机微分方程中的随机共振现象与行为研究

国家自然科学基金

0+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

劣者淘汰两阶段自适应临床试验的设计和分析

国家自然科学基金

0+阅读 · 2014年12月31日

随机延迟微分方程数值解的延迟依赖稳定性及自适应技术

国家自然科学基金

0+阅读 · 2014年12月31日

协方差阵的推断及在方向数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员