雅可比正则化稳定神经微分方程的长期积分 (Jacobian Regularization Stabilizes Long-Term Integration of Neural Differential Equations) - 专知论文

会员服务 ·

0

正则化 · 展开 · 方向导数 · 神经微分方程 · 系统 ·

Jacobian Regularization Stabilizes Long-Term Integration of Neural Differential Equations

翻译：雅可比正则化稳定神经微分方程的长期积分

Maya Janvier,Julien Salomon,Etienne Meunier

Hybrid models and Neural Differential Equations (NDE) are getting increasingly important for the modeling of physical systems, however they often encounter stability and accuracy issues during long-term integration. Training on unrolled trajectories is known to limit these divergences but quickly becomes too expensive due to the need for computing gradients over an iterative process. In this paper, we demonstrate that regularizing the Jacobian of the NDE model via its directional derivatives during training stabilizes long-term integration in the challenging context of short training rollouts. We design two regularizations, one for the case of known dynamics where we can directly derive the directional derivatives of the dynamic and one for the case of unknown dynamics where they are approximated using finite differences. Both methods, while having a far lower cost compared to long rollouts during training, are successful in improving the stability of long-term simulations for several ordinary and partial differential equations, opening up the door to training NDE methods for long-term integration of large scale systems.

翻译：混合模型与神经微分方程（NDE）在物理系统建模中日益重要，然而它们在长期积分过程中常遇到稳定性与精度问题。已知在展开轨迹上进行训练可限制这些发散，但由于需要在迭代过程中计算梯度，其计算成本迅速变得过高。本文证明，在训练期间通过方向导数对NDE模型的雅可比矩阵进行正则化，可在短训练展开这一挑战性背景下稳定长期积分。我们设计了两种正则化方法：一种适用于动力学已知的情况，可直接推导动力学的方向导数；另一种适用于动力学未知的情况，其中方向导数通过有限差分近似。两种方法在训练期间的计算成本远低于长展开轨迹，均成功提升了若干常微分方程与偏微分方程长期模拟的稳定性，为训练适用于大规模系统长期积分的NDE方法开辟了道路。

0

相关内容

正则化

在数学，统计学和计算机科学中，尤其是在机器学习和逆问题中，正则化是添加信息以解决不适定问题或防止过度拟合的过程。正则化适用于不适定的优化问题中的目标函数。

【CIKM2025教程】用于连续时间分析的神经微分方程

【CIKM2025教程】用于连续时间分析的神经微分方程

专知会员服务

16+阅读 · 2025年11月16日

图神经网络与常微分方程及其应用：结合微分方程与图神经网络的全面综述

图神经网络与常微分方程及其应用：结合微分方程与图神经网络的全面综述

专知会员服务

17+阅读 · 2025年4月3日

图神经常微分方程综述

图神经常微分方程综述

专知会员服务

25+阅读 · 2024年8月4日

基于神经网络的偏微分方程求解方法研究综述

基于神经网络的偏微分方程求解方法研究综述

专知会员服务

72+阅读 · 2022年12月7日

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

专知会员服务

33+阅读 · 2022年3月4日

牛津大学Patrick231页博士论文全面阐述《神经微分方程》Jeff Dean点赞

牛津大学Patrick231页博士论文全面阐述《神经微分方程》Jeff Dean点赞

专知会员服务

62+阅读 · 2022年2月10日

【AAAI 2022】神经分段常时滞微分方程

【AAAI 2022】神经分段常时滞微分方程

专知会员服务

35+阅读 · 2022年1月14日

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

专知会员服务

60+阅读 · 2020年11月21日

【2020新书】利用Simulink进行MATLAB仿真，对常微分方程和偏微分方程进行编程和仿真，495pdf

【2020新书】利用Simulink进行MATLAB仿真，对常微分方程和偏微分方程进行编程和仿真，495pdf

专知会员服务

72+阅读 · 2020年4月10日

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

专知会员服务

54+阅读 · 2020年3月5日

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

26+阅读 · 2021年1月30日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

量子位

17+阅读 · 2019年12月2日

神经网络常微分方程 (Neural ODEs) 解析

神经网络常微分方程 (Neural ODEs) 解析

AI科技评论

42+阅读 · 2019年8月9日

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

专知

41+阅读 · 2019年1月22日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

新型快速高稳定性时域积分方程算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性双曲型随机偏微分方程及其相关研究

国家自然科学基金

0+阅读 · 2015年12月31日

分数随机微分方程的定性理论研究及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

若干偏微分方程控制系统的适定正则性及稳定性分析

国家自然科学基金

0+阅读 · 2015年12月31日

随机微分方程解的稳定性和矩有界性

国家自然科学基金

0+阅读 · 2015年12月31日

超线性增长条件下的混杂型随机时滞微分方程

国家自然科学基金

0+阅读 · 2014年12月31日

几类高阶非线性行波方程的精确解,分支和复杂动力学研究

国家自然科学基金

0+阅读 · 2014年12月31日

关于分数阶偏泛函微分方程基本理论的研究

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶偏微分方程与近场动力学等非局部模型的高保真快速算法与数值分析

国家自然科学基金

1+阅读 · 2014年12月31日

微分代数方程中的误差可控计算理论与算法

国家自然科学基金

0+阅读 · 2014年12月31日

BEACONS: Bounded-Error, Algebraically-Composable Neural Solvers for Partial Differential Equations

Arxiv

0+阅读 · 2月16日

Unbiased Approximate Vector-Jacobian Products for Efficient Backpropagation

Arxiv

0+阅读 · 2月16日

Why Deep Jacobian Spectra Separate: Depth-Induced Scaling and Singular-Vector Alignment

Arxiv

0+阅读 · 2月16日

Stable Differentiable Modal Synthesis for Learning Nonlinear Dynamics

Arxiv

0+阅读 · 2月12日

Direct Learning of Calibration-Aware Uncertainty for Neural PDE Surrogates

Arxiv

0+阅读 · 2月11日

Differentiable Logic Synthesis: Spectral Coefficient Selection via Sinkhorn-Constrained Composition

Arxiv

0+阅读 · 2月9日

Automatic and Structure-Aware Sparsification of Hybrid Neural ODEs

Arxiv

0+阅读 · 2月7日

Neural Geometry for PDEs: Regularity, Stability, and Convergence Guarantees

Arxiv

0+阅读 · 2月2日

DeNOTS: Stable Deep Neural ODEs for Time Series

Arxiv

0+阅读 · 1月26日

Stable Differentiable Modal Synthesis for Learning Nonlinear Dynamics

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

神经微分方程

相关VIP内容

【CIKM2025教程】用于连续时间分析的神经微分方程

【CIKM2025教程】用于连续时间分析的神经微分方程

专知会员服务

16+阅读 · 2025年11月16日

图神经网络与常微分方程及其应用：结合微分方程与图神经网络的全面综述

图神经网络与常微分方程及其应用：结合微分方程与图神经网络的全面综述

专知会员服务

17+阅读 · 2025年4月3日

图神经常微分方程综述

图神经常微分方程综述

专知会员服务

25+阅读 · 2024年8月4日

基于神经网络的偏微分方程求解方法研究综述

基于神经网络的偏微分方程求解方法研究综述

专知会员服务

72+阅读 · 2022年12月7日

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

专知会员服务

33+阅读 · 2022年3月4日

牛津大学Patrick231页博士论文全面阐述《神经微分方程》Jeff Dean点赞

牛津大学Patrick231页博士论文全面阐述《神经微分方程》Jeff Dean点赞

专知会员服务

62+阅读 · 2022年2月10日

【AAAI 2022】神经分段常时滞微分方程

【AAAI 2022】神经分段常时滞微分方程

专知会员服务

35+阅读 · 2022年1月14日

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

专知会员服务

60+阅读 · 2020年11月21日

【2020新书】利用Simulink进行MATLAB仿真，对常微分方程和偏微分方程进行编程和仿真，495pdf

【2020新书】利用Simulink进行MATLAB仿真，对常微分方程和偏微分方程进行编程和仿真，495pdf

专知会员服务

72+阅读 · 2020年4月10日

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

专知会员服务

54+阅读 · 2020年3月5日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

26+阅读 · 2021年1月30日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

量子位

17+阅读 · 2019年12月2日

神经网络常微分方程 (Neural ODEs) 解析

神经网络常微分方程 (Neural ODEs) 解析

AI科技评论

42+阅读 · 2019年8月9日

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

专知

41+阅读 · 2019年1月22日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

相关论文

BEACONS: Bounded-Error, Algebraically-Composable Neural Solvers for Partial Differential Equations

Arxiv

0+阅读 · 2月16日

Unbiased Approximate Vector-Jacobian Products for Efficient Backpropagation

Arxiv

0+阅读 · 2月16日

Why Deep Jacobian Spectra Separate: Depth-Induced Scaling and Singular-Vector Alignment

Arxiv

0+阅读 · 2月16日

Stable Differentiable Modal Synthesis for Learning Nonlinear Dynamics

Arxiv

0+阅读 · 2月12日

Direct Learning of Calibration-Aware Uncertainty for Neural PDE Surrogates

Arxiv

0+阅读 · 2月11日

Differentiable Logic Synthesis: Spectral Coefficient Selection via Sinkhorn-Constrained Composition

Arxiv

0+阅读 · 2月9日

Automatic and Structure-Aware Sparsification of Hybrid Neural ODEs

Arxiv

0+阅读 · 2月7日

Neural Geometry for PDEs: Regularity, Stability, and Convergence Guarantees

Arxiv

0+阅读 · 2月2日

DeNOTS: Stable Deep Neural ODEs for Time Series

Arxiv

0+阅读 · 1月26日

Stable Differentiable Modal Synthesis for Learning Nonlinear Dynamics

Arxiv

0+阅读 · 1月15日

相关基金

新型快速高稳定性时域积分方程算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性双曲型随机偏微分方程及其相关研究

国家自然科学基金

0+阅读 · 2015年12月31日

分数随机微分方程的定性理论研究及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

若干偏微分方程控制系统的适定正则性及稳定性分析

国家自然科学基金

0+阅读 · 2015年12月31日

随机微分方程解的稳定性和矩有界性

国家自然科学基金

0+阅读 · 2015年12月31日

超线性增长条件下的混杂型随机时滞微分方程

国家自然科学基金

0+阅读 · 2014年12月31日

几类高阶非线性行波方程的精确解,分支和复杂动力学研究

国家自然科学基金

0+阅读 · 2014年12月31日

关于分数阶偏泛函微分方程基本理论的研究

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶偏微分方程与近场动力学等非局部模型的高保真快速算法与数值分析

国家自然科学基金

1+阅读 · 2014年12月31日

微分代数方程中的误差可控计算理论与算法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员