Random Forests (Breiman, 2001) is a successful and widely used regression and classification algorithm. Part of its appeal and reason for its versatility is its (implicit) construction of a kernel-type weighting function on training data, which can also be used for targets other than the original mean estimation. We propose a novel forest construction for multivariate responses based on their joint conditional distribution, independent of the estimation target and the data model. It uses a new splitting criterion based on the MMD distributional metric, which is suitable for detecting heterogeneity in multivariate distributions. The induced weights define an estimate of the full conditional distribution, which in turn can be used for arbitrary and potentially complicated targets of interest. The method is very versatile and convenient to use, as we illustrate on a wide range of examples. The code is available as Python and R packages drf.


翻译:随机森林(Breiman, 2001)是一个成功和广泛使用的回归和分类算法,其部分吸引力和多功能性的部分原因在于它(隐含)在培训数据上构建一个内核型加权功能,该功能也可以用于原始平均估计以外的目标。我们提议在不依赖估计目标和数据模型的情况下,以联合有条件分布为基础,为多变量反应构筑新的森林结构。它使用基于MMD分布度的新分解标准,适合检测多变量分布中的异质。引力加权确定了完全有条件分布的估计数,而后者又可用于任意和潜在的复杂利益目标。该方法非常灵活和方便地使用,我们举例说明了广泛的例子。代码作为Python和R软件包Drf提供。

0
下载
关闭预览

相关内容

专知会员服务
52+阅读 · 2020年12月14日
【干货书】机器学习速查手册,135页pdf
专知会员服务
127+阅读 · 2020年11月20日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
108+阅读 · 2020年5月3日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
已删除
将门创投
3+阅读 · 2017年10月12日
VIP会员
最新内容
2026“人工智能+”行业发展蓝皮书(附下载)
专知会员服务
5+阅读 · 今天12:11
《强化学习数学基础》
专知会员服务
3+阅读 · 今天12:07
“Maven计划”的发展演变之“Maven智能系统”应用
《无人机革命:来自俄乌战场的启示》(报告)
专知会员服务
7+阅读 · 今天6:48
《实现联合作战能力所需的技术》58页报告
专知会员服务
4+阅读 · 今天6:30
以色列运用人工智能优化空袭警报系统
专知会员服务
4+阅读 · 今天6:20
以色列在多条战线部署AI智能体
专知会员服务
5+阅读 · 今天6:12
相关VIP内容
相关资讯
已删除
将门创投
3+阅读 · 2017年10月12日
Top
微信扫码咨询专知VIP会员