Scalable Derivative Gaussian Processes via Exact Gradient Reduction - 专知论文

会员服务 ·

0

梯度 · 高斯过程 · 代价 · 高维 · 推断 ·

Scalable Derivative Gaussian Processes via Exact Gradient Reduction

翻译：基于精确梯度缩减的可扩展导数高斯过程

Hyunseok Seung,Matthias Katzfuss

Gradient observations can substantially improve Gaussian process (GP) surrogates, particularly in high-dimensional settings where function evaluations are expensive. However, exact inference with $n$ function values and $n$ full gradients in $d$ dimensions scales cubically in the joint state size, imposing an intractable $\mathcal{O}(n^3 d^3)$ computational bottleneck. We introduce TERA, a highly scalable derivative GP method based on target-specific exact gradient reduction. We prove that for stationary kernels, the gradient components orthogonal to the directions connecting the target and conditioning points are conditionally independent of the target function value; consequently, the exact conditional density is fully characterized by at most $m^2$ directional derivatives once a conditioning set of size $m$ is specified. By using these reduced, dimension-free conditionals as local factors in a Vecchia approximation, TERA effectively decouples $n$ and $d$ from the dense matrix inversion. This reduces the per-target evaluation cost to $\mathcal{O}(dm^2 + m^6)$ time and $\mathcal{O}(dm^2 + m^4)$ memory, leaving the underlying derivative GP model mathematically unchanged. Empirical evaluations demonstrate that TERA achieves state-of-the-art predictive accuracy while operating orders of magnitude faster than standard derivative GPs. Crucially, both computation time and peak GPU memory remain essentially flat with respect to $d$, enabling highly scalable inference in high-dimensional spaces.

翻译：梯度观测可显著提升高斯过程（GP）代理模型性能，尤其在函数评估代价高昂的高维场景中。然而，对$n$个函数值和$n$个完整梯度（维度$d$）执行精确推断时，计算复杂度与联合状态规模呈三次方增长，造成难以承受的$\mathcal{O}(n^3 d^3)$计算瓶颈。我们提出TERA方法——一种基于目标特异性精确梯度缩减的高可扩展导数GP技术。理论证明：对于平稳核函数，与目标点-条件点连线方向正交的梯度分量与目标函数值条件独立；因此，当指定规模为$m$的条件集后，精确条件密度完全由至多$m^2$个方向导数刻画。通过将这些降维后的无维度条件量作为Vecchia近似中的局部因子，TERA有效解耦了$n$和$d$与稠密矩阵求逆的关联。这使得每个目标点的计算代价降至$\mathcal{O}(dm^2 + m^6)$时间复杂度和$\mathcal{O}(dm^2 + m^4)$内存复杂度，且底层导数GP模型在数学上保持不变。实验评估表明，TERA在达到最先进预测精度的同时，运算速度比标准导数GP快数个数量级。关键优势在于：计算时间和峰值GPU内存均随$d$增长保持基本恒定，从而在高维空间中实现高度可扩展的推断。

0

相关内容

梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。

【剑桥博士论文】可扩展高斯过程：迭代方法与路径条件的进展

【剑桥博士论文】可扩展高斯过程：迭代方法与路径条件的进展

专知会员服务

16+阅读 · 2025年7月10日

水下通信《通信感知、可扩展高斯过程在分布式探索中的应用》186页

水下通信《通信感知、可扩展高斯过程在分布式探索中的应用》186页

专知会员服务

21+阅读 · 2025年4月30日

【NeurIPS2024】PACE：将参数高效微调中的泛化与一致性正则化结合起来

【NeurIPS2024】PACE：将参数高效微调中的泛化与一致性正则化结合起来

专知会员服务

14+阅读 · 2024年9月26日

【CMU博士论文】高斯表示的可微渲染和优化，198页pdf

【CMU博士论文】高斯表示的可微渲染和优化，198页pdf

专知会员服务

27+阅读 · 2023年10月5日

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

专知会员服务

22+阅读 · 2021年12月9日

最新《高斯过程回归简明教程》，19页pdf

最新《高斯过程回归简明教程》，19页pdf

专知会员服务

73+阅读 · 2020年9月30日

策略梯度方法的算子视图，An operator view of policy gradient methods

策略梯度方法的算子视图，An operator view of policy gradient methods

专知会员服务

11+阅读 · 2020年6月23日

【IPAM 】张量主元分析中的高维成本景观和梯度下降及其推广（High-dimensional cost landscape and gradient descent in Tensor PCA and its generalisations），附41页pdf

【IPAM 】张量主元分析中的高维成本景观和梯度下降及其推广（High-dimensional cost landscape and gradient descent in Tensor PCA and its generalisations），附41页pdf

专知会员服务

14+阅读 · 2019年11月22日

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

专知会员服务

98+阅读 · 2019年11月19日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

系列教程GNN-algorithms之三：《将图卷积简化进行到底—SGC》

系列教程GNN-algorithms之三：《将图卷积简化进行到底—SGC》

专知

10+阅读 · 2020年8月5日

从泰勒展开来看梯度下降算法

从泰勒展开来看梯度下降算法

深度学习每日摘要

13+阅读 · 2019年4月9日

解读 | 得见的高斯过程

解读 | 得见的高斯过程

机器学习算法与Python学习

14+阅读 · 2019年2月13日

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

论智

12+阅读 · 2018年10月10日

简述多种降维算法

简述多种降维算法

算法与数学之美

11+阅读 · 2018年9月23日

【泡泡一分钟】Grad-CAM（加权梯度类激活映射）：可视化解释基于梯度定位的深度网络（ICCV2017-60）

【泡泡一分钟】Grad-CAM（加权梯度类激活映射）：可视化解释基于梯度定位的深度网络（ICCV2017-60）

泡泡机器人SLAM

47+阅读 · 2018年8月1日

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

量子位

10+阅读 · 2017年12月10日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

精品公开课 | 随机梯度下降算法综述

精品公开课 | 随机梯度下降算法综述

七月在线实验室

13+阅读 · 2017年7月11日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

14+阅读 · 2015年12月31日

高阶微分方程的周期解及多重性

国家自然科学基金

0+阅读 · 2015年12月31日

复杂工程产品基于多可信度近似的设计优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

梯度光滑法计算流体力学的算法理论研究和程序开发

国家自然科学基金

2+阅读 · 2015年12月31日

高斯序列与过程的极值理论

国家自然科学基金

2+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶偏微分方程与近场动力学等非局部模型的高保真快速算法与数值分析

国家自然科学基金

1+阅读 · 2014年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

Improving Linear Regression on Small Datasets via Gaussian Process and Extreme Value Theory-Based Data Augmentation

Arxiv

0+阅读 · 6月16日

GauS: Differentiable Scheduling Optimization via Gaussian Reparameterization

Arxiv

0+阅读 · 6月15日

GraphGP: Scalable Gaussian Processes with Vecchia's Approximation

Arxiv

0+阅读 · 6月9日

Adaptive Prior Selection in Gaussian Process Bandits with Thompson Sampling

Arxiv

0+阅读 · 6月8日

Gaussian Process Latent Factor Regression for Low-Data, High-Dimensional Output Problems

Arxiv

0+阅读 · 6月4日

SIKA-GP: Accelerating Gaussian Process Inference with Sparse Inducing Kernel Approximations for Bayesian Deep Learning

Arxiv

0+阅读 · 5月26日

Vecchia-Inducing-Points Full-Scale Approximations for Gaussian Processes

Arxiv

0+阅读 · 5月22日

An accuracy-runtime trade-off comparison of scalable Gaussian process approximations for spatial data

Arxiv

0+阅读 · 5月19日

Deep Gaussian Process Emulation with gradient Information and Sequential Design for Simulators with Sharp Variations

Arxiv

0+阅读 · 5月9日

Generalized and Scalable Deep Gaussian Process Emulation

Arxiv

0+阅读 · 3月25日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

【剑桥博士论文】可扩展高斯过程：迭代方法与路径条件的进展

【剑桥博士论文】可扩展高斯过程：迭代方法与路径条件的进展

专知会员服务

16+阅读 · 2025年7月10日

水下通信《通信感知、可扩展高斯过程在分布式探索中的应用》186页

水下通信《通信感知、可扩展高斯过程在分布式探索中的应用》186页

专知会员服务

21+阅读 · 2025年4月30日

【NeurIPS2024】PACE：将参数高效微调中的泛化与一致性正则化结合起来

【NeurIPS2024】PACE：将参数高效微调中的泛化与一致性正则化结合起来

专知会员服务

14+阅读 · 2024年9月26日

【CMU博士论文】高斯表示的可微渲染和优化，198页pdf

【CMU博士论文】高斯表示的可微渲染和优化，198页pdf

专知会员服务

27+阅读 · 2023年10月5日

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

专知会员服务

22+阅读 · 2021年12月9日

最新《高斯过程回归简明教程》，19页pdf

最新《高斯过程回归简明教程》，19页pdf

专知会员服务

73+阅读 · 2020年9月30日

策略梯度方法的算子视图，An operator view of policy gradient methods

策略梯度方法的算子视图，An operator view of policy gradient methods

专知会员服务

11+阅读 · 2020年6月23日

【IPAM 】张量主元分析中的高维成本景观和梯度下降及其推广（High-dimensional cost landscape and gradient descent in Tensor PCA and its generalisations），附41页pdf

【IPAM 】张量主元分析中的高维成本景观和梯度下降及其推广（High-dimensional cost landscape and gradient descent in Tensor PCA and its generalisations），附41页pdf

专知会员服务

14+阅读 · 2019年11月22日

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

专知会员服务

98+阅读 · 2019年11月19日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

系列教程GNN-algorithms之三：《将图卷积简化进行到底—SGC》

系列教程GNN-algorithms之三：《将图卷积简化进行到底—SGC》

专知

10+阅读 · 2020年8月5日

从泰勒展开来看梯度下降算法

从泰勒展开来看梯度下降算法

深度学习每日摘要

13+阅读 · 2019年4月9日

解读 | 得见的高斯过程

解读 | 得见的高斯过程

机器学习算法与Python学习

14+阅读 · 2019年2月13日

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

论智

12+阅读 · 2018年10月10日

简述多种降维算法

简述多种降维算法

算法与数学之美

11+阅读 · 2018年9月23日

【泡泡一分钟】Grad-CAM（加权梯度类激活映射）：可视化解释基于梯度定位的深度网络（ICCV2017-60）

【泡泡一分钟】Grad-CAM（加权梯度类激活映射）：可视化解释基于梯度定位的深度网络（ICCV2017-60）

泡泡机器人SLAM

47+阅读 · 2018年8月1日

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

量子位

10+阅读 · 2017年12月10日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

精品公开课 | 随机梯度下降算法综述

精品公开课 | 随机梯度下降算法综述

七月在线实验室

13+阅读 · 2017年7月11日

相关论文

Improving Linear Regression on Small Datasets via Gaussian Process and Extreme Value Theory-Based Data Augmentation

Arxiv

0+阅读 · 6月16日

GauS: Differentiable Scheduling Optimization via Gaussian Reparameterization

Arxiv

0+阅读 · 6月15日

GraphGP: Scalable Gaussian Processes with Vecchia's Approximation

Arxiv

0+阅读 · 6月9日

Adaptive Prior Selection in Gaussian Process Bandits with Thompson Sampling

Arxiv

0+阅读 · 6月8日

Gaussian Process Latent Factor Regression for Low-Data, High-Dimensional Output Problems

Arxiv

0+阅读 · 6月4日

SIKA-GP: Accelerating Gaussian Process Inference with Sparse Inducing Kernel Approximations for Bayesian Deep Learning

Arxiv

0+阅读 · 5月26日

Vecchia-Inducing-Points Full-Scale Approximations for Gaussian Processes

Arxiv

0+阅读 · 5月22日

An accuracy-runtime trade-off comparison of scalable Gaussian process approximations for spatial data

Arxiv

0+阅读 · 5月19日

Deep Gaussian Process Emulation with gradient Information and Sequential Design for Simulators with Sharp Variations

Arxiv

0+阅读 · 5月9日

Generalized and Scalable Deep Gaussian Process Emulation

Arxiv

0+阅读 · 3月25日

相关基金

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

14+阅读 · 2015年12月31日

高阶微分方程的周期解及多重性

国家自然科学基金

0+阅读 · 2015年12月31日

复杂工程产品基于多可信度近似的设计优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

梯度光滑法计算流体力学的算法理论研究和程序开发

国家自然科学基金

2+阅读 · 2015年12月31日

高斯序列与过程的极值理论

国家自然科学基金

2+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶偏微分方程与近场动力学等非局部模型的高保真快速算法与数值分析

国家自然科学基金

1+阅读 · 2014年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员