因果森林中的诚实性：何时有益，何时有害 (Honesty in Causal Forests: When It Helps and When It Hurts) - 专知论文

会员服务 ·

0

拟合 · 异质 · 异质性 · 过拟合 · 运营 ·

Honesty in Causal Forests: When It Helps and When It Hurts

翻译：因果森林中的诚实性：何时有益，何时有害

Yanfang Hou,Carlos Fernández-Loría

Causal forests estimate how treatment effects vary across individuals, guiding personalized interventions in areas like marketing, operations, and public policy. A standard modeling practice with this method is honest estimation: dividing the data into two samples, one to define subgroups and another to estimate treatment effects within them. This is intended to reduce overfitting and is the default in many software packages. But is it the right choice? In this paper, we show that honest estimation can reduce the accuracy of individual-level treatment effect estimates, especially when there are substantial differences in how individuals respond to treatment, and the data is rich enough to uncover those differences. The core issue is a classic bias-variance trade-off: honesty lowers the risk of overfitting but increases the risk of underfitting, because it limits the data available to detect and model heterogeneity. Across 7,500 benchmark datasets, we find that the cost of using honesty by default can be as high as requiring 25% more data to match the performance of models trained without it. We argue that honesty is best understood as a form of regularization and its use should be guided by application goals and empirical evaluation, not adopted reflexively.

翻译：因果森林用于估计个体间处理效应的异质性，从而在营销、运营和公共政策等领域指导个性化干预。使用该方法时，一种标准的建模实践是诚实估计：将数据分为两个样本，一个用于定义子组，另一个用于估计这些子组内的处理效应。这种做法旨在减少过拟合，并且是许多软件包中的默认设置。但它是否总是正确的选择？本文证明，诚实估计可能会降低个体层面处理效应估计的准确性，尤其是在个体对处理的响应存在显著差异，且数据足够丰富以揭示这些差异的情况下。其核心问题是一个经典的偏差-方差权衡：诚实性降低了过拟合的风险，但增加了欠拟合的风险，因为它限制了可用于检测和建模异质性的数据。在7,500个基准数据集上的实验表明，默认使用诚实性的代价可能高达需要额外25%的数据才能达到不使用诚实性所训练模型的性能。我们认为，诚实性最好被理解为一种正则化形式，其使用应基于应用目标和实证评估来指导，而非机械地采用。

0

相关内容

【新书】实际因果关系，

【新书】实际因果关系，

专知会员服务

40+阅读 · 2024年10月24日

复杂处理下的因果推断：综述

复杂处理下的因果推断：综述

专知会员服务

34+阅读 · 2024年7月22日

《因果ABM：基于智能体的建模以学习可靠因果模型》2022美国南佛罗里达大学等26页论文

《因果ABM：基于智能体的建模以学习可靠因果模型》2022美国南佛罗里达大学等26页论文

专知会员服务

46+阅读 · 2023年1月5日

因果如何用于推荐？清华等最新《推荐系统中的因果推理》综述论文，29页pdf阐述因果推荐方法体系

因果如何用于推荐？清华等最新《推荐系统中的因果推理》综述论文，29页pdf阐述因果推荐方法体系

专知会员服务

48+阅读 · 2022年8月31日

《异构观测数据中的联合因果推理》美国艾莫利大学、微软、约翰霍普金斯大学、哈佛大学、斯坦福大学等联合发表最新论文63页PDF

《异构观测数据中的联合因果推理》美国艾莫利大学、微软、约翰霍普金斯大学、哈佛大学、斯坦福大学等联合发表最新论文63页PDF

专知会员服务

29+阅读 · 2022年4月28日

因果如何用于推荐？中科大最新WWW2022《因果推荐: 进展与未来方向》教程，附123页ppt

因果如何用于推荐？中科大最新WWW2022《因果推荐: 进展与未来方向》教程，附123页ppt

专知会员服务

108+阅读 · 2022年4月28日

带核的因果模型:治疗效果，反事实，调解，和代理，57页ppt

带核的因果模型:治疗效果，反事实，调解，和代理，57页ppt

专知会员服务

31+阅读 · 2022年2月21日

因果推断，Causal Inference：The Mixtape

因果推断，Causal Inference：The Mixtape

专知会员服务

110+阅读 · 2021年8月27日

因果关联学习，Causal Relational Learning

因果关联学习，Causal Relational Learning

专知会员服务

185+阅读 · 2020年4月21日

最新「因果推断Causal Inference」综述论文38页pdf，Buffalo、Georgia、阿里巴巴、Virginia

专知会员服务

183+阅读 · 2020年2月11日

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

专知

12+阅读 · 2022年11月25日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

12+阅读 · 2020年7月21日

异常检测怎么做，试试孤立随机森林算法（附代码）

异常检测怎么做，试试孤立随机森林算法（附代码）

机器之心

16+阅读 · 2020年3月15日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

论文浅尝 | 时序与因果关系联合推理

论文浅尝 | 时序与因果关系联合推理

开放知识图谱

36+阅读 · 2019年6月23日

哈佛大学Miguel Hernan科学家最新2019年《因果推断:概念与方法》书稿终版，280页讲解因果效应（附下载）

哈佛大学Miguel Hernan科学家最新2019年《因果推断:概念与方法》书稿终版，280页讲解因果效应（附下载）

专知

77+阅读 · 2019年1月3日

推荐：一文读懂随机森林的解释和实现（附python代码）

推荐：一文读懂随机森林的解释和实现（附python代码）

数据分析

38+阅读 · 2018年12月4日

相关性≠因果：概率图模型和do-calculus

相关性≠因果：概率图模型和do-calculus

论智

31+阅读 · 2018年10月29日

处理效应差异中位数的有效估计

国家自然科学基金

0+阅读 · 2015年12月31日

社会信任程度对于审计师行为的影响及经济后果研究——基于事务所和签字审计师层面

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

黄土高原区退耕还林政策生态效率评价与提升路径

国家自然科学基金

0+阅读 · 2014年12月31日

基于部分核实数据的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

自然灾害风险的时空尺度效应分析与推绎技术研究—以农业旱灾风险为例

国家自然科学基金

0+阅读 · 2014年12月31日

异质性约束下黄土高原苹果干旱风险的分类适应性管理研究

国家自然科学基金

0+阅读 · 2014年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

The Honest Truth About Causal Trees: Accuracy Limits for Heterogeneous Treatment Effect Estimation

Arxiv

0+阅读 · 3月17日

Bounding causal effects with an unknown mixture of informative and non-informative missingness

Bounding causal effects with an unknown mixture of informative and non-informative missingness

Arxiv

0+阅读 · 3月17日

Policy relevance of causal quantities in networks

Arxiv

0+阅读 · 3月9日

Estimation and Inference for Causal Explainability

Arxiv

0+阅读 · 3月6日

Individualized Causal Effects under Network Interference with Combinatorial Treatments

Arxiv

0+阅读 · 2月23日

On the Granularity of Causal Effect Identifiability

Arxiv

0+阅读 · 2月23日

Causality is Key for Interpretability Claims to Generalise

Arxiv

0+阅读 · 2月18日

Estimation Strategies for Causal Decomposition Analysis with Allowability Specifications

Arxiv

0+阅读 · 2月8日

Causal-Adapter: Taming Text-to-Image Diffusion for Faithful Counterfactual Generation

Arxiv

0+阅读 · 2月4日

Validating Causal Message Passing Against Network-Aware Methods on Real Experiments

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

大语言模型溯因推理的统一分类学与综述

大语言模型溯因推理的统一分类学与综述

专知会员服务

0+阅读 · 今天12:07

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

专知会员服务

0+阅读 · 今天11:54

大语言模型与国防战略：升级风险与国家安全挑战（综述）

大语言模型与国防战略：升级风险与国家安全挑战（综述）

专知会员服务

5+阅读 · 今天4:52

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

专知会员服务

9+阅读 · 4月11日

以机器速度作战：人工智能与美陆军反火力作战——第二部分

以机器速度作战：人工智能与美陆军反火力作战——第二部分

专知会员服务

7+阅读 · 4月11日

以机器速度作战：人工智能与美陆军反火力作战——第一部分

以机器速度作战：人工智能与美陆军反火力作战——第一部分

专知会员服务

5+阅读 · 4月11日

大视觉语言模型的高效推理：瓶颈剖析、关键技术与未来展望

大视觉语言模型的高效推理：瓶颈剖析、关键技术与未来展望

专知会员服务

6+阅读 · 4月11日

面向空中机器人的视觉语言导航：迈向大语言模型时代

面向空中机器人的视觉语言导航：迈向大语言模型时代

专知会员服务

6+阅读 · 4月11日

美/以-伊战争：停火与后续情景与影响分析

美/以-伊战争：停火与后续情景与影响分析

专知会员服务

3+阅读 · 4月11日

《美军如何实现快速、持续的小型无人机系统采办策略研究》最新110页

《美军如何实现快速、持续的小型无人机系统采办策略研究》最新110页

专知会员服务

6+阅读 · 4月11日

美国-以色列-伊朗战争：是否会动用地面部队？

美国-以色列-伊朗战争：是否会动用地面部队？

专知会员服务

2+阅读 · 4月11日

伊朗冲突中的算法战：“史诗怒火”行动与人工智能战场

伊朗冲突中的算法战：“史诗怒火”行动与人工智能战场

专知会员服务

7+阅读 · 4月11日

《美陆军技术出版物：伤员响应、战术战伤救护与急救》2026最新254页

《美陆军技术出版物：伤员响应、战术战伤救护与急救》2026最新254页

专知会员服务

4+阅读 · 4月11日

美国协同作战飞机项目新型无人机发动机

美国协同作战飞机项目新型无人机发动机

专知会员服务

2+阅读 · 4月11日

反无人机 | 美陆军测试“金盾”传感器-射手网络，以机器速度进行反无人机蜂群

反无人机 | 美陆军测试“金盾”传感器-射手网络，以机器速度进行反无人机蜂群

专知会员服务

3+阅读 · 4月11日

相关VIP内容

【新书】实际因果关系，

【新书】实际因果关系，

专知会员服务

40+阅读 · 2024年10月24日

复杂处理下的因果推断：综述

复杂处理下的因果推断：综述

专知会员服务

34+阅读 · 2024年7月22日

《因果ABM：基于智能体的建模以学习可靠因果模型》2022美国南佛罗里达大学等26页论文

《因果ABM：基于智能体的建模以学习可靠因果模型》2022美国南佛罗里达大学等26页论文

专知会员服务

46+阅读 · 2023年1月5日

因果如何用于推荐？清华等最新《推荐系统中的因果推理》综述论文，29页pdf阐述因果推荐方法体系

因果如何用于推荐？清华等最新《推荐系统中的因果推理》综述论文，29页pdf阐述因果推荐方法体系

专知会员服务

48+阅读 · 2022年8月31日

《异构观测数据中的联合因果推理》美国艾莫利大学、微软、约翰霍普金斯大学、哈佛大学、斯坦福大学等联合发表最新论文63页PDF

《异构观测数据中的联合因果推理》美国艾莫利大学、微软、约翰霍普金斯大学、哈佛大学、斯坦福大学等联合发表最新论文63页PDF

专知会员服务

29+阅读 · 2022年4月28日

因果如何用于推荐？中科大最新WWW2022《因果推荐: 进展与未来方向》教程，附123页ppt

因果如何用于推荐？中科大最新WWW2022《因果推荐: 进展与未来方向》教程，附123页ppt

专知会员服务

108+阅读 · 2022年4月28日

带核的因果模型:治疗效果，反事实，调解，和代理，57页ppt

带核的因果模型:治疗效果，反事实，调解，和代理，57页ppt

专知会员服务

31+阅读 · 2022年2月21日

因果推断，Causal Inference：The Mixtape

因果推断，Causal Inference：The Mixtape

专知会员服务

110+阅读 · 2021年8月27日

因果关联学习，Causal Relational Learning

因果关联学习，Causal Relational Learning

专知会员服务

185+阅读 · 2020年4月21日

最新「因果推断Causal Inference」综述论文38页pdf，Buffalo、Georgia、阿里巴巴、Virginia

专知会员服务

183+阅读 · 2020年2月11日

热门VIP内容

开通专知VIP会员享更多权益服务

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

大语言模型溯因推理的统一分类学与综述

大语言模型与国防战略：升级风险与国家安全挑战（综述）

相关资讯

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

专知

12+阅读 · 2022年11月25日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

12+阅读 · 2020年7月21日

异常检测怎么做，试试孤立随机森林算法（附代码）

异常检测怎么做，试试孤立随机森林算法（附代码）

机器之心

16+阅读 · 2020年3月15日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

论文浅尝 | 时序与因果关系联合推理

论文浅尝 | 时序与因果关系联合推理

开放知识图谱

36+阅读 · 2019年6月23日

哈佛大学Miguel Hernan科学家最新2019年《因果推断:概念与方法》书稿终版，280页讲解因果效应（附下载）

哈佛大学Miguel Hernan科学家最新2019年《因果推断:概念与方法》书稿终版，280页讲解因果效应（附下载）

专知

77+阅读 · 2019年1月3日

推荐：一文读懂随机森林的解释和实现（附python代码）

推荐：一文读懂随机森林的解释和实现（附python代码）

数据分析

38+阅读 · 2018年12月4日

相关性≠因果：概率图模型和do-calculus

相关性≠因果：概率图模型和do-calculus

论智

31+阅读 · 2018年10月29日

相关论文

The Honest Truth About Causal Trees: Accuracy Limits for Heterogeneous Treatment Effect Estimation

Arxiv

0+阅读 · 3月17日

Bounding causal effects with an unknown mixture of informative and non-informative missingness

Bounding causal effects with an unknown mixture of informative and non-informative missingness

Arxiv

0+阅读 · 3月17日

Policy relevance of causal quantities in networks

Arxiv

0+阅读 · 3月9日

Estimation and Inference for Causal Explainability

Arxiv

0+阅读 · 3月6日

Individualized Causal Effects under Network Interference with Combinatorial Treatments

Arxiv

0+阅读 · 2月23日

On the Granularity of Causal Effect Identifiability

Arxiv

0+阅读 · 2月23日

Causality is Key for Interpretability Claims to Generalise

Arxiv

0+阅读 · 2月18日

Estimation Strategies for Causal Decomposition Analysis with Allowability Specifications

Arxiv

0+阅读 · 2月8日

Causal-Adapter: Taming Text-to-Image Diffusion for Faithful Counterfactual Generation

Arxiv

0+阅读 · 2月4日

Validating Causal Message Passing Against Network-Aware Methods on Real Experiments

Arxiv

0+阅读 · 2月4日

相关基金

处理效应差异中位数的有效估计

国家自然科学基金

0+阅读 · 2015年12月31日

社会信任程度对于审计师行为的影响及经济后果研究——基于事务所和签字审计师层面

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

黄土高原区退耕还林政策生态效率评价与提升路径

国家自然科学基金

0+阅读 · 2014年12月31日

基于部分核实数据的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

自然灾害风险的时空尺度效应分析与推绎技术研究—以农业旱灾风险为例

国家自然科学基金

0+阅读 · 2014年12月31日

异质性约束下黄土高原苹果干旱风险的分类适应性管理研究

国家自然科学基金

0+阅读 · 2014年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员