Post-Experiment Decisions: The Dual Adjustments for Rollout and Downstream Optimizations - 专知论文

会员服务 ·

0

运营 · 贝叶斯 · 多场景 · 小样本 · 样本 ·

Post-Experiment Decisions: The Dual Adjustments for Rollout and Downstream Optimizations

翻译：实验后决策：面向推广与下游优化的双重调整

Guoxing He,Dan Yang,Wei Zhang

Firms increasingly use randomized experiments to decide whether to scale up an intervention and, if so, how to re-optimize related operational choices such as inventory, capacity, or pricing. In many settings, experiments are performed on small samples, so the estimated effect of the intervention is uncertain. A common practice is to plug a 'significant' estimate of the effect into both (i) the rollout rule and (ii) the downstream optimization. However, this can lead to avoidable losses because the costs of over- versus under-estimating the effect are often asymmetric. The technically ideal approach is to obtain a data-dependent decision rule that minimizes the Bayes risk, but this lacks transparency and requires more computations. We propose Predict-Adjust-Then-Rollout-Optimize (PATRO), a plug-in approach that keeps the standard estimate, but makes data-independent adjustments, respectively, for the two types of decision. We show that the two adjustments can be substitutes or complements and provide an alternating-iteration method to compute the pair. PATRO performs both in theory and numerically close or equivalent to the Bayes-optimal benchmark, making it a simple, effective way to convert noisy experimental results into better rollout and operational decisions.

翻译：企业越来越多地采用随机实验来决定是否扩大干预措施的实施规模，并在决定推广时，如何重新优化相关的运营选择，如库存、产能或定价。在许多场景中，实验基于小样本进行，因此干预效果的估计存在不确定性。常见的做法是将一个“显著”的效果估计值同时代入（i）推广规则和（ii）下游优化中。然而，这种做法可能导致可避免的损失，因为高估与低估效果的成本通常是不对称的。技术上的理想方法是获得一个数据依赖的决策规则，以最小化贝叶斯风险，但这缺乏透明度且需要更多计算。我们提出了预测-调整-然后推广-优化（Predict-Adjust-Then-Rollout-Optimize, PATRO），这是一种插件方法，它保留了标准的估计值，但针对两种决策类型分别进行数据独立的调整。我们证明了这两种调整可以是替代或互补关系，并提供了一种交替迭代方法来计算这对调整量。PATRO在理论和数值上均表现接近或等同于贝叶斯最优基准，使其成为一种将嘈杂的实验结果转化为更优推广与运营决策的简单有效方法。

0

相关内容

关乎渠道，用户，数据，商务和活动的各种思考和求索。运筹于帷幄之中，决胜于千里之外。学习运营：运营、产品运营（互联网运营）

【博士论文】知识引导的序列决策算法：整合图结构、演示数据、人类经验与跨智能体经验

【博士论文】知识引导的序列决策算法：整合图结构、演示数据、人类经验与跨智能体经验

专知会员服务

17+阅读 · 3月30日

基于因果推断的推荐系统去偏研究

基于因果推断的推荐系统去偏研究

专知会员服务

21+阅读 · 2024年11月10日

复杂处理下的因果推断：综述

复杂处理下的因果推断：综述

专知会员服务

34+阅读 · 2024年7月22日

《支持、理解和改进决策的因果推理方法》259页

《支持、理解和改进决策的因果推理方法》259页

专知会员服务

39+阅读 · 2024年4月19日

【ETHZ博士论文】因果机器学习在数据驱动决策中的方法与应用，293页pdf

【ETHZ博士论文】因果机器学习在数据驱动决策中的方法与应用，293页pdf

专知会员服务

44+阅读 · 2024年1月10日

《目标搜索网格世界中决策复杂性的影响：基于实例的学习与强化学习智能体的比较》CMU动态决策实验室

《目标搜索网格世界中决策复杂性的影响：基于实例的学习与强化学习智能体的比较》CMU动态决策实验室

专知会员服务

26+阅读 · 2023年8月1日

McGill大学等最新《不确定性决策下的上下文优化方法》综述

McGill大学等最新《不确定性决策下的上下文优化方法》综述

专知会员服务

33+阅读 · 2023年6月25日

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

专知会员服务

108+阅读 · 2022年6月17日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

最新「因果推断Causal Inference」综述论文38页pdf，Buffalo、Georgia、阿里巴巴、Virginia

专知会员服务

183+阅读 · 2020年2月11日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

50+阅读 · 2022年11月16日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

深度 | 推荐系统评估

深度 | 推荐系统评估

AI100

24+阅读 · 2019年3月16日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

推荐｜机器学习中的模型评价、模型选择和算法选择！

推荐｜机器学习中的模型评价、模型选择和算法选择！

全球人工智能

10+阅读 · 2018年2月5日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

信息不完全的双边匹配决策方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于后悔理论的多属性决策方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

人类双向选择行为的统计特征分析与预测方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

服务团购中平台/商户决策优化与协调研究

国家自然科学基金

0+阅读 · 2014年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

线上渠道交互对线下渠道绩效的影响：基于双路径的理论和实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

多重比较中控制FDR的有效检验方法

国家自然科学基金

0+阅读 · 2014年12月31日

Forward-Looking与Backward-Looking相结合的投资组合管理

国家自然科学基金

1+阅读 · 2014年12月31日

劣者淘汰两阶段自适应临床试验的设计和分析

国家自然科学基金

0+阅读 · 2014年12月31日

统计估计与决策优化在库存和定价管理中的集成研究

国家自然科学基金

0+阅读 · 2014年12月31日

Two-Sided Prioritized Ranking: A Coherency-Preserving Design for Marketplace Experiments

Arxiv

0+阅读 · 3月15日

Cluster-Level Experiments using Temporal Switchback Designs: Precision Gains in Pricing A/B Tests at LATAM Airlines

Arxiv

0+阅读 · 3月4日

Predictively Oriented Posteriors

Arxiv

0+阅读 · 2月20日

Ex-post Stability under Two-Sided Matching: Complexity and Characterization

Arxiv

0+阅读 · 2月20日

Experimenting under Stochastic Congestion

Arxiv

0+阅读 · 2月15日

Optimal Decision-Making Based on Prediction Sets

Arxiv

0+阅读 · 2月8日

Balancing Covariates in Survey Experiments

Arxiv

0+阅读 · 2月7日

Decision-Focused Sequential Experimental Design: A Directional Uncertainty-Guided Approach

Arxiv

0+阅读 · 2月5日

Singleton-Optimized Conformal Prediction

Arxiv

0+阅读 · 2月3日

Experimental Designs for Multi-Item Multi-Period Inventory Control

Arxiv

0+阅读 · 1月31日

VIP会员

文章信息

相关主题

最新内容

DeepSeek 版Claude Code，免费小白安装教程来了！

DeepSeek 版Claude Code，免费小白安装教程来了！

专知会员服务

10+阅读 · 5月5日

【ICML Spotlight 2026】 T²PO: 不确定性引导的探索控制框架，实现稳定多轮Agentic强化学习

【ICML Spotlight 2026】 T²PO: 不确定性引导的探索控制框架，实现稳定多轮Agentic强化学习

专知会员服务

5+阅读 · 5月5日

基础模型驱动的工业智能体：技术成熟度、能力变迁与未竟之挑战

基础模型驱动的工业智能体：技术成熟度、能力变迁与未竟之挑战

专知会员服务

7+阅读 · 5月5日

《机动炮兵的演进与未来：技术进步、历史沿革与炮兵作战前瞻》

《机动炮兵的演进与未来：技术进步、历史沿革与炮兵作战前瞻》

专知会员服务

7+阅读 · 5月5日

《火炮弹药快速效能建模：提升互操作性与技术优势》（报告）

《火炮弹药快速效能建模：提升互操作性与技术优势》（报告）

专知会员服务

9+阅读 · 5月5日

《美空军条令出版物 2-0：情报（2026版）》

《美空军条令出版物 2-0：情报（2026版）》

专知会员服务

14+阅读 · 5月5日

美陆军“飞蝇陷阱5.0”项目将新兴技术交到作战人员手中

美陆军“飞蝇陷阱5.0”项目将新兴技术交到作战人员手中

专知会员服务

6+阅读 · 5月5日

帕兰提尔 Gotham：一个游戏规则改变器

帕兰提尔 Gotham：一个游戏规则改变器

专知会员服务

9+阅读 · 5月5日

【ICML 2026】用测试时训练线性化视觉Transformer：T⁵ 实现 Softmax 注意力到线性复杂度的快速转换

【ICML 2026】用测试时训练线性化视觉Transformer：T⁵ 实现 Softmax 注意力到线性复杂度的快速转换

专知会员服务

3+阅读 · 5月5日

【AAAI 2026】大模型做知识蒸馏：CMM将LLM特征拆解给小模型协同学习

【AAAI 2026】大模型做知识蒸馏：CMM将LLM特征拆解给小模型协同学习

专知会员服务

3+阅读 · 5月5日

【ICML Spotlight 2026 】NonZero：交互引导探索的多智能体蒙特卡洛树搜索

【ICML Spotlight 2026 】NonZero：交互引导探索的多智能体蒙特卡洛树搜索

专知会员服务

8+阅读 · 5月4日

【综述】机器人学习中的世界模型：全面综述

【综述】机器人学习中的世界模型：全面综述

专知会员服务

13+阅读 · 5月4日

伊朗的导弹-无人机行动及其对美国威慑的影响

伊朗的导弹-无人机行动及其对美国威慑的影响

专知会员服务

9+阅读 · 5月4日

《未来战术无人机系统案例研究：量身定制采办策略方法》100页报告

《未来战术无人机系统案例研究：量身定制采办策略方法》100页报告

专知会员服务

10+阅读 · 5月4日

战争贩子：2026年第一季度美国对中东潜在军售激增

战争贩子：2026年第一季度美国对中东潜在军售激增

专知会员服务

7+阅读 · 5月4日

相关VIP内容

【博士论文】知识引导的序列决策算法：整合图结构、演示数据、人类经验与跨智能体经验

【博士论文】知识引导的序列决策算法：整合图结构、演示数据、人类经验与跨智能体经验

专知会员服务

17+阅读 · 3月30日

基于因果推断的推荐系统去偏研究

基于因果推断的推荐系统去偏研究

专知会员服务

21+阅读 · 2024年11月10日

复杂处理下的因果推断：综述

复杂处理下的因果推断：综述

专知会员服务

34+阅读 · 2024年7月22日

《支持、理解和改进决策的因果推理方法》259页

《支持、理解和改进决策的因果推理方法》259页

专知会员服务

39+阅读 · 2024年4月19日

【ETHZ博士论文】因果机器学习在数据驱动决策中的方法与应用，293页pdf

【ETHZ博士论文】因果机器学习在数据驱动决策中的方法与应用，293页pdf

专知会员服务

44+阅读 · 2024年1月10日

《目标搜索网格世界中决策复杂性的影响：基于实例的学习与强化学习智能体的比较》CMU动态决策实验室

《目标搜索网格世界中决策复杂性的影响：基于实例的学习与强化学习智能体的比较》CMU动态决策实验室

专知会员服务

26+阅读 · 2023年8月1日

McGill大学等最新《不确定性决策下的上下文优化方法》综述

McGill大学等最新《不确定性决策下的上下文优化方法》综述

专知会员服务

33+阅读 · 2023年6月25日

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

专知会员服务

108+阅读 · 2022年6月17日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

最新「因果推断Causal Inference」综述论文38页pdf，Buffalo、Georgia、阿里巴巴、Virginia

专知会员服务

183+阅读 · 2020年2月11日

热门VIP内容

开通专知VIP会员享更多权益服务

【ICML Spotlight 2026】 T²PO: 不确定性引导的探索控制框架，实现稳定多轮Agentic强化学习

《机动炮兵的演进与未来：技术进步、历史沿革与炮兵作战前瞻》

DeepSeek 版Claude Code，免费小白安装教程来了！

基础模型驱动的工业智能体：技术成熟度、能力变迁与未竟之挑战

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

50+阅读 · 2022年11月16日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

深度 | 推荐系统评估

深度 | 推荐系统评估

AI100

24+阅读 · 2019年3月16日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

推荐｜机器学习中的模型评价、模型选择和算法选择！

推荐｜机器学习中的模型评价、模型选择和算法选择！

全球人工智能

10+阅读 · 2018年2月5日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

相关论文

Two-Sided Prioritized Ranking: A Coherency-Preserving Design for Marketplace Experiments

Arxiv

0+阅读 · 3月15日

Cluster-Level Experiments using Temporal Switchback Designs: Precision Gains in Pricing A/B Tests at LATAM Airlines

Arxiv

0+阅读 · 3月4日

Predictively Oriented Posteriors

Arxiv

0+阅读 · 2月20日

Ex-post Stability under Two-Sided Matching: Complexity and Characterization

Arxiv

0+阅读 · 2月20日

Experimenting under Stochastic Congestion

Arxiv

0+阅读 · 2月15日

Optimal Decision-Making Based on Prediction Sets

Arxiv

0+阅读 · 2月8日

Balancing Covariates in Survey Experiments

Arxiv

0+阅读 · 2月7日

Decision-Focused Sequential Experimental Design: A Directional Uncertainty-Guided Approach

Arxiv

0+阅读 · 2月5日

Singleton-Optimized Conformal Prediction

Arxiv

0+阅读 · 2月3日

Experimental Designs for Multi-Item Multi-Period Inventory Control

Arxiv

0+阅读 · 1月31日

相关基金

信息不完全的双边匹配决策方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于后悔理论的多属性决策方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

人类双向选择行为的统计特征分析与预测方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

服务团购中平台/商户决策优化与协调研究

国家自然科学基金

0+阅读 · 2014年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

线上渠道交互对线下渠道绩效的影响：基于双路径的理论和实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

多重比较中控制FDR的有效检验方法

国家自然科学基金

0+阅读 · 2014年12月31日

Forward-Looking与Backward-Looking相结合的投资组合管理

国家自然科学基金

1+阅读 · 2014年12月31日

劣者淘汰两阶段自适应临床试验的设计和分析

国家自然科学基金

0+阅读 · 2014年12月31日

统计估计与决策优化在库存和定价管理中的集成研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员