U-learning for Prediction Inference via Combinatory Multi-Subsampling: With Applications to LASSO and Neural Networks - 专知论文

会员服务 ·

0

推断 · 子采样 · 表观遗传 · DNA甲基化 · 广义 ·

U-learning for Prediction Inference via Combinatory Multi-Subsampling: With Applications to LASSO and Neural Networks

翻译：基于组合多重子采样的U学习用于预测推断：以LASSO和神经网络为例

Epigenetic aging clocks play a pivotal role in estimating an individual's biological age through the examination of DNA methylation patterns at numerous CpG (Cytosine-phosphate-Guanine) sites within their genome. However, making valid inferences on predicted epigenetic ages, or more broadly, on predictions derived from high-dimensional inputs, presents challenges. We introduce a novel U-learning approach via combinatory multi-subsampling for making ensemble predictions and constructing confidence intervals for predictions of continuous outcomes when traditional asymptotic methods are not applicable. More specifically, our approach conceptualizes the ensemble estimators within the framework of generalized U-statistics and invokes the Hájek projection for deriving the variances of predictions and constructing confidence intervals with valid conditional coverage probabilities. We apply our approach to two commonly used predictive algorithms, Lasso and deep neural networks (DNNs), and illustrate the validity of inferences with extensive numerical studies. We have applied these methods to predict the DNA methylation age (DNAmAge) of patients with various health conditions, aiming to accurately characterize the aging process and potentially guide anti-aging interventions.

翻译：表观遗传衰老时钟通过检测个体基因组中大量CpG（胞嘧啶-磷酸-鸟嘌呤）位点的DNA甲基化模式，在评估个体生物学年龄方面发挥着关键作用。然而，对预测的表观遗传年龄（或更广义而言，对高维输入产生的预测结果）进行有效推断仍面临挑战。本文提出一种基于组合多重子采样的新型U学习方法，用于在传统渐近方法不适用时构建连续结果预测的集成估计及置信区间。具体而言，该方法将集成估计器置于广义U统计量框架中进行概念化，并借助Hájek投影推导预测方差，从而构建具有有效条件覆盖概率的置信区间。我们将该方法应用于两种常用预测算法——LASSO和深度神经网络（DNN），并通过大量数值研究验证推断的有效性。这些方法已应用于预测不同健康状况患者的DNA甲基化年龄（DNAmAge），旨在精确表征衰老过程，并为抗衰老干预提供潜在指导。

0

相关内容

【牛津大学博士论文】用于姿态验证、亲和度预测和输入归因的深度神经网络，133页pdf

【牛津大学博士论文】用于姿态验证、亲和度预测和输入归因的深度神经网络，133页pdf

专知会员服务

13+阅读 · 2023年7月30日

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

专知会员服务

72+阅读 · 2023年4月3日

基于人工智能(AI)的蛋白结构预测工具合集

基于人工智能(AI)的蛋白结构预测工具合集

专知会员服务

10+阅读 · 2022年8月25日

AI算法 | GRaSP-web-一种基于残基邻域图预测结合位点的机器学习策略

AI算法 | GRaSP-web-一种基于残基邻域图预测结合位点的机器学习策略

专知会员服务

11+阅读 · 2022年8月14日

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

专知会员服务

130+阅读 · 2020年7月6日

超越三元组:基于超关系知识图谱嵌入的链接预测，Beyond Triplets: Hyper-Relational Knowledge Graph Embedding for Link Prediction

专知会员服务

78+阅读 · 2020年5月11日

【UCLA论文】利用神经网络进行时间序列预测的综合分析，Comprehensive Analysis of Time Series Forecasting Using Neural Networks

【UCLA论文】利用神经网络进行时间序列预测的综合分析，Comprehensive Analysis of Time Series Forecasting Using Neural Networks

专知会员服务

97+阅读 · 2020年2月3日

【华侨大学】基于混合深度学习算法的疾病预测模型

【华侨大学】基于混合深度学习算法的疾病预测模型

专知会员服务

97+阅读 · 2020年1月21日

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

专知会员服务

104+阅读 · 2019年12月30日

【论文强烈推荐】基于卷积神经网络的基因组序列基序的表示学习，Representation learning of genomic sequence motifs with convolutional neural networks

【论文强烈推荐】基于卷积神经网络的基因组序列基序的表示学习，Representation learning of genomic sequence motifs with convolutional neural networks

专知会员服务

12+阅读 · 2019年12月21日

基于图神经网络的推荐算法总结

基于图神经网络的推荐算法总结

机器学习与推荐算法

25+阅读 · 2021年9月30日

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

数据分析

28+阅读 · 2019年5月23日

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

量化投资与机器学习

25+阅读 · 2018年11月20日

基于 Keras 用 LSTM 网络做时间序列预测

基于 Keras 用 LSTM 网络做时间序列预测

R语言中文社区

21+阅读 · 2018年8月6日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

教程 | 基于Keras的LSTM多变量时间序列预测

教程 | 基于Keras的LSTM多变量时间序列预测

机器之心

20+阅读 · 2017年10月30日

如何在Python中用LSTM网络进行时间序列预测

如何在Python中用LSTM网络进行时间序列预测

AI100

17+阅读 · 2017年8月5日

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

全球人工智能

14+阅读 · 2017年7月26日

基于串联质谱数据的多肽鉴定半监督学习并行算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习与超CpG分割的人类全基因组差异甲基化研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构网络的致病基因及其复合物预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

对具有非平衡多标签特性的蛋白质功能类型分类预测研究

国家自然科学基金

0+阅读 · 2014年12月31日

短波认知ALE系统中基于深度学习-GP混合模型的多维谱预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向蛋白质分子位点标记的多源特征提取和深度序列学习方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

种群遗传学的多人交互式学习研究

国家自然科学基金

0+阅读 · 2014年12月31日

EIDOS: Latent-Space Predictive Learning for Time Series Foundation Models

Arxiv

0+阅读 · 2月15日

ARM: Refining Multivariate Forecasting with Adaptive Temporal-Contextual Learning

Arxiv

0+阅读 · 2月5日

Neural Networks Learn Generic Multi-Index Models Near Information-Theoretic Limit

Arxiv

0+阅读 · 2月4日

A Multi-decoder Neural Tracking Method for Accurately Predicting Speech Intelligibility

Arxiv

0+阅读 · 2月3日

Unified Inference Framework for Single and Multi-Player Performative Prediction: Method and Asymptotic Optimality

Arxiv

0+阅读 · 2月3日

Embedding Learning on Multiplex Networks for Link Prediction

Arxiv

0+阅读 · 2月2日

Channel, Trend and Periodic-Wise Representation Learning for Multivariate Long-term Time Series Forecasting

Arxiv

0+阅读 · 1月20日

Another look at statistical inference with machine learning-imputed data

Arxiv

0+阅读 · 1月19日

Simultaneous Inference in Multiple Matrix-Variate Graphs for High-Dimensional Neural Recordings

Arxiv

0+阅读 · 1月17日

Multilevel neural simulation-based inference

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

最新内容

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

1+阅读 · 今天15:03

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

2+阅读 · 今天14:33

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

1+阅读 · 今天14:08

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

1+阅读 · 今天13:55

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

2+阅读 · 今天13:53

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

0+阅读 · 今天13:42

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

0+阅读 · 今天13:46

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

0+阅读 · 今天13:43

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

1+阅读 · 今天13:17

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

10+阅读 · 4月18日

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

9+阅读 · 4月18日

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

专知会员服务

8+阅读 · 4月18日

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

专知会员服务

14+阅读 · 4月18日

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

专知会员服务

7+阅读 · 4月18日

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

专知会员服务

9+阅读 · 4月18日

相关VIP内容

【牛津大学博士论文】用于姿态验证、亲和度预测和输入归因的深度神经网络，133页pdf

【牛津大学博士论文】用于姿态验证、亲和度预测和输入归因的深度神经网络，133页pdf

专知会员服务

13+阅读 · 2023年7月30日

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

专知会员服务

72+阅读 · 2023年4月3日

基于人工智能(AI)的蛋白结构预测工具合集

基于人工智能(AI)的蛋白结构预测工具合集

专知会员服务

10+阅读 · 2022年8月25日

AI算法 | GRaSP-web-一种基于残基邻域图预测结合位点的机器学习策略

AI算法 | GRaSP-web-一种基于残基邻域图预测结合位点的机器学习策略

专知会员服务

11+阅读 · 2022年8月14日

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

专知会员服务

130+阅读 · 2020年7月6日

超越三元组:基于超关系知识图谱嵌入的链接预测，Beyond Triplets: Hyper-Relational Knowledge Graph Embedding for Link Prediction

专知会员服务

78+阅读 · 2020年5月11日

【UCLA论文】利用神经网络进行时间序列预测的综合分析，Comprehensive Analysis of Time Series Forecasting Using Neural Networks

【UCLA论文】利用神经网络进行时间序列预测的综合分析，Comprehensive Analysis of Time Series Forecasting Using Neural Networks

专知会员服务

97+阅读 · 2020年2月3日

【华侨大学】基于混合深度学习算法的疾病预测模型

【华侨大学】基于混合深度学习算法的疾病预测模型

专知会员服务

97+阅读 · 2020年1月21日

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

专知会员服务

104+阅读 · 2019年12月30日

【论文强烈推荐】基于卷积神经网络的基因组序列基序的表示学习，Representation learning of genomic sequence motifs with convolutional neural networks

【论文强烈推荐】基于卷积神经网络的基因组序列基序的表示学习，Representation learning of genomic sequence motifs with convolutional neural networks

专知会员服务

12+阅读 · 2019年12月21日

热门VIP内容

开通专知VIP会员享更多权益服务

《高超音速武器：一项再度兴起的技术》120页slides

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

美国当前高超音速导弹发展概述

无人机蜂群建模与仿真方法

相关资讯

基于图神经网络的推荐算法总结

基于图神经网络的推荐算法总结

机器学习与推荐算法

25+阅读 · 2021年9月30日

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

数据分析

28+阅读 · 2019年5月23日

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

量化投资与机器学习

25+阅读 · 2018年11月20日

基于 Keras 用 LSTM 网络做时间序列预测

基于 Keras 用 LSTM 网络做时间序列预测

R语言中文社区

21+阅读 · 2018年8月6日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

教程 | 基于Keras的LSTM多变量时间序列预测

教程 | 基于Keras的LSTM多变量时间序列预测

机器之心

20+阅读 · 2017年10月30日

如何在Python中用LSTM网络进行时间序列预测

如何在Python中用LSTM网络进行时间序列预测

AI100

17+阅读 · 2017年8月5日

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

全球人工智能

14+阅读 · 2017年7月26日

相关论文

EIDOS: Latent-Space Predictive Learning for Time Series Foundation Models

Arxiv

0+阅读 · 2月15日

ARM: Refining Multivariate Forecasting with Adaptive Temporal-Contextual Learning

Arxiv

0+阅读 · 2月5日

Neural Networks Learn Generic Multi-Index Models Near Information-Theoretic Limit

Arxiv

0+阅读 · 2月4日

A Multi-decoder Neural Tracking Method for Accurately Predicting Speech Intelligibility

Arxiv

0+阅读 · 2月3日

Unified Inference Framework for Single and Multi-Player Performative Prediction: Method and Asymptotic Optimality

Arxiv

0+阅读 · 2月3日

Embedding Learning on Multiplex Networks for Link Prediction

Arxiv

0+阅读 · 2月2日

Channel, Trend and Periodic-Wise Representation Learning for Multivariate Long-term Time Series Forecasting

Arxiv

0+阅读 · 1月20日

Another look at statistical inference with machine learning-imputed data

Arxiv

0+阅读 · 1月19日

Simultaneous Inference in Multiple Matrix-Variate Graphs for High-Dimensional Neural Recordings

Arxiv

0+阅读 · 1月17日

Multilevel neural simulation-based inference

Arxiv

0+阅读 · 1月14日

相关基金

基于串联质谱数据的多肽鉴定半监督学习并行算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习与超CpG分割的人类全基因组差异甲基化研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构网络的致病基因及其复合物预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

对具有非平衡多标签特性的蛋白质功能类型分类预测研究

国家自然科学基金

0+阅读 · 2014年12月31日

短波认知ALE系统中基于深度学习-GP混合模型的多维谱预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向蛋白质分子位点标记的多源特征提取和深度序列学习方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

种群遗传学的多人交互式学习研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员