Sparse Variational Student-t Processes for Heavy-tailed Modeling - 专知论文

会员服务 ·

0

稀疏 · 变分 · 高斯过程 · 数据集 · 非参数 ·

Sparse Variational Student-t Processes for Heavy-tailed Modeling

翻译：稀疏变分学生t过程用于重尾建模

Jian Xu,Delu Zeng,John Paisley

The Gaussian process (GP) is a powerful tool for nonparametric modeling, but its sensitivity to outliers limits its applicability to data distributions with heavy-tails. Studentt processes offer a robust alternative for heavy tail modeling, but they lack the scalable developments of the GP to large datasets necessary for practical applications. We present Sparse Variational Student-t Processes (SVTP), the first principled framework that extends the sparse inducing point method to the Student-t process. We develop two novel inference algorithms, SVTP-UB and SVTP-MC, with theoretical guarantees, and derive a natural gradient optimization that exploits a previously unused connection between the Fisher information matrix of the multivariate Student-t distribution and the beta function (the 'beta link'). Experiments on UCI and Kaggle datasets demonstrate that SVTP significantly outperforms sparse GPs on when the data is contains outliers and heavy tails, achieving up to 3 times faster convergence and 40% lower prediction error while maintaining computational efficiency for datasets with over 200,000 samples.

翻译：高斯过程（GP）是非参数建模的强大工具，但其对异常值的敏感性限制了其在重尾数据分布中的应用。学生t过程为重尾建模提供了稳健的替代方案，但缺乏高斯过程针对实际应用所需大规模数据集的可扩展性发展。本文提出稀疏变分学生t过程（SVTP），这是首个将稀疏诱导点方法扩展到学生t过程的原理性框架。我们开发了两种具有理论保证的新型推理算法SVTP-UB和SVTP-MC，并推导出利用多元学生t分布的费希尔信息矩阵与贝塔函数（“贝塔链接”）之间先前未被使用的关联的自然梯度优化方法。在UCI和Kaggle数据集上的实验表明，当数据包含异常值和重尾特征时，SVTP显著优于稀疏高斯过程，在保持超过20万个样本数据集计算效率的同时，实现了高达3倍的收敛速度提升和40%的预测误差降低。

0

相关内容

水下通信《通信感知、可扩展高斯过程在分布式探索中的应用》186页

水下通信《通信感知、可扩展高斯过程在分布式探索中的应用》186页

专知会员服务

20+阅读 · 2025年4月30日

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

知识图谱如何时序建模？北工大等最新《时态知识图谱》综述，详述TKG的分类、进展与前景

知识图谱如何时序建模？北工大等最新《时态知识图谱》综述，详述TKG的分类、进展与前景

专知会员服务

37+阅读 · 2023年8月8日

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

专知会员服务

40+阅读 · 2023年3月12日

【干货书】使用高斯过程模型的动态系统建模与控制，281页pdf

【干货书】使用高斯过程模型的动态系统建模与控制，281页pdf

专知会员服务

55+阅读 · 2022年5月23日

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

专知会员服务

22+阅读 · 2021年12月9日

最新《高斯过程回归简明教程》，19页pdf

最新《高斯过程回归简明教程》，19页pdf

专知会员服务

73+阅读 · 2020年9月30日

TensorFlow 2.2为keras.Model加入train_step方法，开发者可自由定义模型自动训练过程

TensorFlow 2.2为keras.Model加入train_step方法，开发者可自由定义模型自动训练过程

专知会员服务

36+阅读 · 2020年3月27日

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

专知会员服务

35+阅读 · 2019年11月30日

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

专知会员服务

98+阅读 · 2019年11月19日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

稀疏大模型简述：从MoE、Sparse Attention到GLaM

稀疏大模型简述：从MoE、Sparse Attention到GLaM

夕小瑶的卖萌屋

14+阅读 · 2022年3月22日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

深度强化学习实验室

43+阅读 · 2020年7月6日

Keras作者推荐的Github项目，基于TensorFlow2的生成式模型合集

Keras作者推荐的Github项目，基于TensorFlow2的生成式模型合集

专知

15+阅读 · 2019年5月17日

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

论智

12+阅读 · 2018年10月10日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

用 LDA 和 LSA 两种方法来降维和做 Topic 建模

用 LDA 和 LSA 两种方法来降维和做 Topic 建模

AI研习社

13+阅读 · 2018年8月24日

你真的会用 t-SNE 么？有关 t-SNE 的小技巧

你真的会用 t-SNE 么？有关 t-SNE 的小技巧

专知

59+阅读 · 2018年5月28日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

基于潜变量迁移模型的复杂工业新过程实时优化方法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

14+阅读 · 2015年12月31日

高阶微分方程的周期解及多重性

国家自然科学基金

0+阅读 · 2015年12月31日

基于压缩感知的信号重建快速算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

一种全新的结构修改重分析方法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

稀疏优化问题的理论与方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

高维稀疏统计模型中的变量选择与检验

国家自然科学基金

1+阅读 · 2014年12月31日

Variational Garrote for Sparse Inverse Problems

Arxiv

0+阅读 · 3月13日

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Arxiv

0+阅读 · 3月10日

A Distributed Gaussian Process Model for Multi-Robot Mapping

Arxiv

0+阅读 · 3月7日

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Arxiv

0+阅读 · 3月7日

Generative Bayesian Computation as a Scalable Alternative to Gaussian Process Surrogates

Arxiv

0+阅读 · 2月24日

Frequentist Regret Analysis of Gaussian Process Thompson Sampling via Fractional Posteriors

Arxiv

0+阅读 · 2月16日

Diffusion Bridge Variational Inference for Deep Gaussian Processes

Arxiv

0+阅读 · 2月12日

Aggregation Models with Optimal Weights for Distributed Gaussian Processes

Arxiv

0+阅读 · 2月10日

Sparsified-Learning for High-Dimensional Heavy-Tailed Locally Stationary Time Series, Concentration and Oracle Inequalities

Arxiv

0+阅读 · 2月8日

Modelling heavy tail data with bayesian nonparametric mixtures

Arxiv

0+阅读 · 2月6日

VIP会员

文章信息

相关主题

最新内容

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

专知会员服务

10+阅读 · 今天6:39

《人工智能在全球军事与武器工业中的应用、方法论与影响》

《人工智能在全球军事与武器工业中的应用、方法论与影响》

专知会员服务

3+阅读 · 今天6:36

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

专知会员服务

7+阅读 · 今天6:28

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

4+阅读 · 今天0:51

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

4+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

7+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

6+阅读 · 4月29日

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

6+阅读 · 4月29日

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

10+阅读 · 4月29日

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

12+阅读 · 4月29日

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

8+阅读 · 4月29日

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

19+阅读 · 4月29日

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

专知会员服务

11+阅读 · 4月29日

【伯克利博士论文】深度解析 AI 智能体的失配问题

【伯克利博士论文】深度解析 AI 智能体的失配问题

专知会员服务

8+阅读 · 4月28日

智能体化世界建模：基础、能力、规律及展望

智能体化世界建模：基础、能力、规律及展望

专知会员服务

11+阅读 · 4月28日

相关VIP内容

水下通信《通信感知、可扩展高斯过程在分布式探索中的应用》186页

水下通信《通信感知、可扩展高斯过程在分布式探索中的应用》186页

专知会员服务

20+阅读 · 2025年4月30日

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

知识图谱如何时序建模？北工大等最新《时态知识图谱》综述，详述TKG的分类、进展与前景

知识图谱如何时序建模？北工大等最新《时态知识图谱》综述，详述TKG的分类、进展与前景

专知会员服务

37+阅读 · 2023年8月8日

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

专知会员服务

40+阅读 · 2023年3月12日

【干货书】使用高斯过程模型的动态系统建模与控制，281页pdf

【干货书】使用高斯过程模型的动态系统建模与控制，281页pdf

专知会员服务

55+阅读 · 2022年5月23日

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

专知会员服务

22+阅读 · 2021年12月9日

最新《高斯过程回归简明教程》，19页pdf

最新《高斯过程回归简明教程》，19页pdf

专知会员服务

73+阅读 · 2020年9月30日

TensorFlow 2.2为keras.Model加入train_step方法，开发者可自由定义模型自动训练过程

TensorFlow 2.2为keras.Model加入train_step方法，开发者可自由定义模型自动训练过程

专知会员服务

36+阅读 · 2020年3月27日

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

专知会员服务

35+阅读 · 2019年11月30日

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

专知会员服务

98+阅读 · 2019年11月19日

热门VIP内容

开通专知VIP会员享更多权益服务

《人工智能在全球军事与武器工业中的应用、方法论与影响》

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

相关资讯

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

稀疏大模型简述：从MoE、Sparse Attention到GLaM

稀疏大模型简述：从MoE、Sparse Attention到GLaM

夕小瑶的卖萌屋

14+阅读 · 2022年3月22日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

深度强化学习实验室

43+阅读 · 2020年7月6日

Keras作者推荐的Github项目，基于TensorFlow2的生成式模型合集

Keras作者推荐的Github项目，基于TensorFlow2的生成式模型合集

专知

15+阅读 · 2019年5月17日

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

论智

12+阅读 · 2018年10月10日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

用 LDA 和 LSA 两种方法来降维和做 Topic 建模

用 LDA 和 LSA 两种方法来降维和做 Topic 建模

AI研习社

13+阅读 · 2018年8月24日

你真的会用 t-SNE 么？有关 t-SNE 的小技巧

你真的会用 t-SNE 么？有关 t-SNE 的小技巧

专知

59+阅读 · 2018年5月28日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

相关论文

Variational Garrote for Sparse Inverse Problems

Arxiv

0+阅读 · 3月13日

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Arxiv

0+阅读 · 3月10日

A Distributed Gaussian Process Model for Multi-Robot Mapping

Arxiv

0+阅读 · 3月7日

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Arxiv

0+阅读 · 3月7日

Generative Bayesian Computation as a Scalable Alternative to Gaussian Process Surrogates

Arxiv

0+阅读 · 2月24日

Frequentist Regret Analysis of Gaussian Process Thompson Sampling via Fractional Posteriors

Arxiv

0+阅读 · 2月16日

Diffusion Bridge Variational Inference for Deep Gaussian Processes

Arxiv

0+阅读 · 2月12日

Aggregation Models with Optimal Weights for Distributed Gaussian Processes

Arxiv

0+阅读 · 2月10日

Sparsified-Learning for High-Dimensional Heavy-Tailed Locally Stationary Time Series, Concentration and Oracle Inequalities

Arxiv

0+阅读 · 2月8日

Modelling heavy tail data with bayesian nonparametric mixtures

Arxiv

0+阅读 · 2月6日

相关基金

基于潜变量迁移模型的复杂工业新过程实时优化方法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

14+阅读 · 2015年12月31日

高阶微分方程的周期解及多重性

国家自然科学基金

0+阅读 · 2015年12月31日

基于压缩感知的信号重建快速算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

一种全新的结构修改重分析方法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

稀疏优化问题的理论与方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

高维稀疏统计模型中的变量选择与检验

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员