Efficient Log-Rank Updates for Random Survival Forests - 专知论文

会员服务 ·

0

准则 · 数据集 · 计算成本 · 事件 · 近似 ·

Efficient Log-Rank Updates for Random Survival Forests

翻译：高效随机生存森林的对数秩更新

Erik Sverdrup,James Yang,Michael LeBlanc

Random survival forests are widely used for estimating covariate-conditional survival functions under right-censoring. Their standard log-rank splitting criterion is typically recomputed at each candidate split. This O(M) cost per split, with M the number of distinct event times in a node, creates a bottleneck for large cohort datasets with long follow-up. We revisit approximations proposed by LeBlanc and Crowley (1995) and develop simple constant-time updates for the log-rank criterion. The method is implemented in grf for R and reduces training time on large datasets while preserving predictive accuracy.

翻译：随机生存森林广泛应用于右删失数据下估计协变量条件生存函数。其标准的对数秩分裂准则通常在每次候选分裂时重新计算。每次分裂的O(M)计算成本（M为节点内不同事件时间数）对随访周期长的大规模队列数据集构成瓶颈。我们重新审视了LeBlanc和Crowley（1995）提出的近似方法，开发了简单的常数时间更新对数秩准则算法。该方法已在R包grf中实现，在保持预测精度的同时显著减少了大数据集的训练时间。

0

相关内容

《概率结果下全局最优决策的高效树生成方法》最新30页报告

《概率结果下全局最优决策的高效树生成方法》最新30页报告

专知会员服务

17+阅读 · 2025年5月6日

《基于随机森林的Q学习算法：迈向可解释人工智能》最新90页

《基于随机森林的Q学习算法：迈向可解释人工智能》最新90页

专知会员服务

32+阅读 · 2025年3月15日

中科院计算所最新《时态数据因果发现》综述，50页pdf详述多元时间和事件序列因果发现

中科院计算所最新《时态数据因果发现》综述，50页pdf详述多元时间和事件序列因果发现

专知会员服务

86+阅读 · 2023年3月23日

【ICML2021】随机森林机器遗忘

专知会员服务

21+阅读 · 2021年8月9日

南大周志华团队开源深度森林软件包DF21：训练效率高、超参数少，普通设备就能跑

专知会员服务

21+阅读 · 2021年2月1日

【Google】具有秩-1因子的高效可扩展贝叶斯神经网络，Efficient and Scalable Bayesian Neural Nets with Rank-1 Factors

【Google】具有秩-1因子的高效可扩展贝叶斯神经网络，Efficient and Scalable Bayesian Neural Nets with Rank-1 Factors

专知会员服务

14+阅读 · 2020年5月19日

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

专知会员服务

33+阅读 · 2020年4月26日

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

专知会员服务

42+阅读 · 2020年3月10日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

71+阅读 · 2020年1月17日

【论文推荐】NGBoost:用于概率预测的自然梯度增强（NGBoost: Natural Gradient Boosting for Probabilistic Prediction）

【论文推荐】NGBoost:用于概率预测的自然梯度增强（NGBoost: Natural Gradient Boosting for Probabilistic Prediction）

专知会员服务

18+阅读 · 2019年12月25日

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AINLP

10+阅读 · 2021年2月6日

异常检测怎么做，试试孤立随机森林算法（附代码）

异常检测怎么做，试试孤立随机森林算法（附代码）

机器之心

16+阅读 · 2020年3月15日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

周志华团队：深度森林挑战多标签学习，9大数据集超越传统方法

周志华团队：深度森林挑战多标签学习，9大数据集超越传统方法

新智元

18+阅读 · 2019年11月20日

推荐：一文读懂随机森林的解释和实现（附python代码）

推荐：一文读懂随机森林的解释和实现（附python代码）

数据分析

38+阅读 · 2018年12月4日

NLP-Progress记录NLP最新数据集、论文和代码: 助你紧跟NLP前沿

NLP-Progress记录NLP最新数据集、论文和代码: 助你紧跟NLP前沿

中国人工智能学会

12+阅读 · 2018年11月15日

使用随机森林分类器预测森林火灾规模

使用随机森林分类器预测森林火灾规模

论智

13+阅读 · 2018年5月15日

R语言之数据分析高级方法「时间序列」

R语言之数据分析高级方法「时间序列」

R语言中文社区

17+阅读 · 2018年4月24日

【论文推荐】最新7篇条件随机场（CRF）相关论文—图像标注、对抗学习、端到端、注意力机制、三维人体姿态、图像分割、行为分割和识别

【论文推荐】最新7篇条件随机场（CRF）相关论文—图像标注、对抗学习、端到端、注意力机制、三维人体姿态、图像分割、行为分割和识别

专知

16+阅读 · 2018年2月13日

绝对干货 | 随机梯度下降算法综述

绝对干货 | 随机梯度下降算法综述

菜鸟的机器学习

15+阅读 · 2017年10月30日

微进化机制中群体基因组数据分析的新方法研究

国家自然科学基金

0+阅读 · 2016年12月31日

几类随机种群模型的几乎必然持久性研究

国家自然科学基金

0+阅读 · 2015年12月31日

几类随机指数函数空间的应用

国家自然科学基金

0+阅读 · 2015年12月31日

随机Kolmogorov型系统及其数值解的渐近性质分析

国家自然科学基金

0+阅读 · 2015年12月31日

超高维生存数据变量筛选和选择中若干问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于枯枝落叶层水分原位测定方法创新的森林土壤水分迁移模型检验与评价

国家自然科学基金

0+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

排序集抽样下随机删失数据的非参数估计

国家自然科学基金

1+阅读 · 2014年12月31日

基于背包式MLS与UAV遥感协同的单木-林分尺度森林地上生物量精细反演

国家自然科学基金

1+阅读 · 2014年12月31日

联合雷达干涉、摄影测量与激光雷达数据的区域森林生物量制图研究

国家自然科学基金

0+阅读 · 2014年12月31日

Statistical Advantages of Oblique Randomized Decision Trees and Forests

Arxiv

0+阅读 · 6月16日

TrIM: Transformed Iterative Mondrian Forests for Gradient-based Dimension Reduction and High-Dimensional Regression

Arxiv

0+阅读 · 6月15日

On the Equivalence of Instantaneous and Mechanistic Reproduction Numbers

Arxiv

0+阅读 · 6月13日

Comparison Patrols on Drifting Orders: Certified Rank Maintenance, Evolving Planar Maxima, and Selection under Drifting Fitness

Arxiv

0+阅读 · 6月12日

Correcting Variable Importance Scored by Random Forests

Arxiv

0+阅读 · 6月9日

Honesty in Causal Forests: When It Helps and When It Hurts

Arxiv

0+阅读 · 6月2日

Decision-Path Patterns as Tree Reliability Signals: Path-based Adaptive Weighting for Random Forest Classification

Arxiv

0+阅读 · 5月27日

Consistency of Honest Decision Trees and Random Forests

Arxiv

0+阅读 · 5月20日

Asymptotic properties of the MLE in distributional regression under random censoring

Arxiv

0+阅读 · 5月15日

Principled Federated Random Forests for Heterogeneous Data

Arxiv

0+阅读 · 5月7日

VIP会员

文章信息

相关主题

最新内容

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

6+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

2+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

1+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

1+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

6+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

5+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

9+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

7+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

10+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

相关VIP内容

《概率结果下全局最优决策的高效树生成方法》最新30页报告

《概率结果下全局最优决策的高效树生成方法》最新30页报告

专知会员服务

17+阅读 · 2025年5月6日

《基于随机森林的Q学习算法：迈向可解释人工智能》最新90页

《基于随机森林的Q学习算法：迈向可解释人工智能》最新90页

专知会员服务

32+阅读 · 2025年3月15日

中科院计算所最新《时态数据因果发现》综述，50页pdf详述多元时间和事件序列因果发现

中科院计算所最新《时态数据因果发现》综述，50页pdf详述多元时间和事件序列因果发现

专知会员服务

86+阅读 · 2023年3月23日

【ICML2021】随机森林机器遗忘

专知会员服务

21+阅读 · 2021年8月9日

南大周志华团队开源深度森林软件包DF21：训练效率高、超参数少，普通设备就能跑

专知会员服务

21+阅读 · 2021年2月1日

【Google】具有秩-1因子的高效可扩展贝叶斯神经网络，Efficient and Scalable Bayesian Neural Nets with Rank-1 Factors

【Google】具有秩-1因子的高效可扩展贝叶斯神经网络，Efficient and Scalable Bayesian Neural Nets with Rank-1 Factors

专知会员服务

14+阅读 · 2020年5月19日

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

专知会员服务

33+阅读 · 2020年4月26日

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

专知会员服务

42+阅读 · 2020年3月10日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

71+阅读 · 2020年1月17日

【论文推荐】NGBoost:用于概率预测的自然梯度增强（NGBoost: Natural Gradient Boosting for Probabilistic Prediction）

【论文推荐】NGBoost:用于概率预测的自然梯度增强（NGBoost: Natural Gradient Boosting for Probabilistic Prediction）

专知会员服务

18+阅读 · 2019年12月25日

热门VIP内容

开通专知VIP会员享更多权益服务

巡飞弹与反无人机系统——现代战场的两大支柱

《北约数字教官网络发展路径》128页报告

无人机自主控制与人工智能：系统性综述

《打造“黄金舰队”》57页报告

相关资讯

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AINLP

10+阅读 · 2021年2月6日

异常检测怎么做，试试孤立随机森林算法（附代码）

异常检测怎么做，试试孤立随机森林算法（附代码）

机器之心

16+阅读 · 2020年3月15日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

周志华团队：深度森林挑战多标签学习，9大数据集超越传统方法

周志华团队：深度森林挑战多标签学习，9大数据集超越传统方法

新智元

18+阅读 · 2019年11月20日

推荐：一文读懂随机森林的解释和实现（附python代码）

推荐：一文读懂随机森林的解释和实现（附python代码）

数据分析

38+阅读 · 2018年12月4日

NLP-Progress记录NLP最新数据集、论文和代码: 助你紧跟NLP前沿

NLP-Progress记录NLP最新数据集、论文和代码: 助你紧跟NLP前沿

中国人工智能学会

12+阅读 · 2018年11月15日

使用随机森林分类器预测森林火灾规模

使用随机森林分类器预测森林火灾规模

论智

13+阅读 · 2018年5月15日

R语言之数据分析高级方法「时间序列」

R语言之数据分析高级方法「时间序列」

R语言中文社区

17+阅读 · 2018年4月24日

【论文推荐】最新7篇条件随机场（CRF）相关论文—图像标注、对抗学习、端到端、注意力机制、三维人体姿态、图像分割、行为分割和识别

【论文推荐】最新7篇条件随机场（CRF）相关论文—图像标注、对抗学习、端到端、注意力机制、三维人体姿态、图像分割、行为分割和识别

专知

16+阅读 · 2018年2月13日

绝对干货 | 随机梯度下降算法综述

绝对干货 | 随机梯度下降算法综述

菜鸟的机器学习

15+阅读 · 2017年10月30日

相关论文

Statistical Advantages of Oblique Randomized Decision Trees and Forests

Arxiv

0+阅读 · 6月16日

TrIM: Transformed Iterative Mondrian Forests for Gradient-based Dimension Reduction and High-Dimensional Regression

Arxiv

0+阅读 · 6月15日

On the Equivalence of Instantaneous and Mechanistic Reproduction Numbers

Arxiv

0+阅读 · 6月13日

Comparison Patrols on Drifting Orders: Certified Rank Maintenance, Evolving Planar Maxima, and Selection under Drifting Fitness

Arxiv

0+阅读 · 6月12日

Correcting Variable Importance Scored by Random Forests

Arxiv

0+阅读 · 6月9日

Honesty in Causal Forests: When It Helps and When It Hurts

Arxiv

0+阅读 · 6月2日

Decision-Path Patterns as Tree Reliability Signals: Path-based Adaptive Weighting for Random Forest Classification

Arxiv

0+阅读 · 5月27日

Consistency of Honest Decision Trees and Random Forests

Arxiv

0+阅读 · 5月20日

Asymptotic properties of the MLE in distributional regression under random censoring

Arxiv

0+阅读 · 5月15日

Principled Federated Random Forests for Heterogeneous Data

Arxiv

0+阅读 · 5月7日

相关基金

微进化机制中群体基因组数据分析的新方法研究

国家自然科学基金

0+阅读 · 2016年12月31日

几类随机种群模型的几乎必然持久性研究

国家自然科学基金

0+阅读 · 2015年12月31日

几类随机指数函数空间的应用

国家自然科学基金

0+阅读 · 2015年12月31日

随机Kolmogorov型系统及其数值解的渐近性质分析

国家自然科学基金

0+阅读 · 2015年12月31日

超高维生存数据变量筛选和选择中若干问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于枯枝落叶层水分原位测定方法创新的森林土壤水分迁移模型检验与评价

国家自然科学基金

0+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

排序集抽样下随机删失数据的非参数估计

国家自然科学基金

1+阅读 · 2014年12月31日

基于背包式MLS与UAV遥感协同的单木-林分尺度森林地上生物量精细反演

国家自然科学基金

1+阅读 · 2014年12月31日

联合雷达干涉、摄影测量与激光雷达数据的区域森林生物量制图研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员