Multi-Grade Deep Learning for Partial Differential Equations with Applications to the Burgers Equation - 专知论文

会员服务 ·

0

深度学习 · 非凸 · 梯度 · 低频 · 高频 ·

Multi-Grade Deep Learning for Partial Differential Equations with Applications to the Burgers Equation

翻译：多级深度学习求解偏微分方程及其在Burgers方程中的应用

Yuesheng Xu,Taishan Zeng

Deep neural networks (DNNs) show great promise for solving partial differential equations (PDEs), but their deep architectures introduce complex, large-scale, non-convex optimization challenges. Nonlinear PDEs, like the viscous Burgers' equation, compound these difficulties due to steep gradients and shock-like solutions. To address this, we propose a two-stage multi-grade deep learning (TS-MGDL) method. In the first stage, shallow networks are trained progressively grade by grade to fit the target function from low- to high-frequency components; previously learned grades are frozen, and each new residual block is trained solely to minimize the remaining approximation error. The second stage unfreezes and retrains selected layers using the first-stage network as initialization, achieving an interpretable, stable hierarchical refinement while mitigating optimization complexity. Furthermore, we theoretically prove that each grade and stage in TS-MGDL monotonically reduces the loss function under an appropriate optimization strategy. Numerical experiments on 1D, 2D, and 3D viscous Burgers' equations demonstrate that TS-MGDL significantly outperforms single-grade learning (SGL), reducing predictive errors by up to a factor of 60.

翻译：深度神经网络（DNNs）在求解偏微分方程（PDEs）方面展现出巨大潜力，但其深层架构带来了复杂、大规模且非凸的优化挑战。非线性PDEs（如黏性Burgers方程）因存在陡峭梯度和类激波解而进一步加剧了这些困难。为此，我们提出了一种两阶段多级深度学习方法（TS-MGDL）。在第一阶段，浅层网络逐级递增地进行训练，以从低频到高频分量逐步拟合目标函数；先前学习的级别被冻结，每个新的残差块仅用于最小化剩余逼近误差。第二阶段以第一阶段网络为初始化，解冻并重新训练选定层，实现可解释、稳定的层次化精化，同时缓解优化复杂性。此外，我们从理论上证明，在适当的优化策略下，TS-MGDL中每个级别和阶段均能单调地减小损失函数。在一维、二维及三维黏性Burgers方程上的数值实验表明，TS-MGDL显著优于单级学习（SGL），预测误差最多降低60倍。

0

相关内容

深度学习

机器学习的一个分支，它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【CMU博士论文】迈向机器学习解微分方程的理论与实证基础

【CMU博士论文】迈向机器学习解微分方程的理论与实证基础

专知会员服务

18+阅读 · 2025年5月28日

图神经网络与常微分方程及其应用：结合微分方程与图神经网络的全面综述

图神经网络与常微分方程及其应用：结合微分方程与图神经网络的全面综述

专知会员服务

18+阅读 · 2025年4月3日

【EMORY博士论文】几何数据的可解释和交互式表示学习，187页pdf

【EMORY博士论文】几何数据的可解释和交互式表示学习，187页pdf

专知会员服务

36+阅读 · 2023年3月3日

基于神经网络的偏微分方程求解方法研究综述

基于神经网络的偏微分方程求解方法研究综述

专知会员服务

72+阅读 · 2022年12月7日

深度学习如何解决数学方程？四川大学最新《深度神经网络偏微分方程》综述，19页pdf阐述如何用DNN有效地解决PDE

深度学习如何解决数学方程？四川大学最新《深度神经网络偏微分方程》综述，19页pdf阐述如何用DNN有效地解决PDE

专知会员服务

64+阅读 · 2022年11月13日

【芝加博士论文】图表示学习，图上的深度生成模型，组等变分子神经网络和多分辨率机器学习

【芝加博士论文】图表示学习，图上的深度生成模型，组等变分子神经网络和多分辨率机器学习

专知会员服务

33+阅读 · 2022年11月5日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

【牛津大学博士论文】深度学习数据驱动发现偏微分方程，160页pdf

【牛津大学博士论文】深度学习数据驱动发现偏微分方程，160页pdf

专知会员服务

63+阅读 · 2022年11月1日

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

专知会员服务

60+阅读 · 2020年11月21日

《应用随机微分方程》(Applied Stochastic Differential Equations)324页pdf新书分享

《应用随机微分方程》(Applied Stochastic Differential Equations)324页pdf新书分享

专知会员服务

44+阅读 · 2019年10月28日

【2022新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

【2022新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

专知

29+阅读 · 2022年4月12日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

量子位

17+阅读 · 2019年12月2日

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

专知

14+阅读 · 2019年11月25日

【论文笔记】具有可微分池化的分层图表示学习

【论文笔记】具有可微分池化的分层图表示学习

专知

47+阅读 · 2019年11月11日

《应用随机微分方程》，324页pdf新书免费分享

《应用随机微分方程》，324页pdf新书免费分享

专知

20+阅读 · 2019年5月6日

7个实用的深度学习技巧

7个实用的深度学习技巧

机器学习算法与Python学习

16+阅读 · 2019年3月6日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

基于GPU的几类分数阶微分方程的并行算法研究及其实现

国家自然科学基金

0+阅读 · 2015年12月31日

分数阶微分方程解的研究

国家自然科学基金

0+阅读 · 2015年12月31日

高阶微分方程的周期解及多重性

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

随机偏微分方程多辛几何算法及不确定性量化

国家自然科学基金

0+阅读 · 2015年12月31日

分数阶非线性偏微分方程的相关数学问题

国家自然科学基金

0+阅读 · 2014年12月31日

高阶分数阶偏微分方程的全离散局部间断有限元方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶微分方程多点边值问题的数值算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶偏微分方程与近场动力学等非局部模型的高保真快速算法与数值分析

国家自然科学基金

1+阅读 · 2014年12月31日

Enhancing Physics-Informed Neural Networks Through Feature Engineering

Enhancing Physics-Informed Neural Networks Through Feature Engineering

Arxiv

0+阅读 · 6月15日

RepNet: Tackling spectral bias in deep neural networks via parameter reparameterization

Arxiv

0+阅读 · 6月15日

Multi-Scale Separable Fourier Neural Networks for Solving High-Frequency PDEs

Arxiv

0+阅读 · 6月14日

Learning a Sampling-Free Variational DNN Plugin from Tiny Training Sets to Refine OOD Segmentation With Uncertainty Estimation

Arxiv

0+阅读 · 6月14日

A Survey of Deep Learning for Geometry Problem Solving

Arxiv

0+阅读 · 6月11日

Physics-Informed Neural Networks and Radial Basis Functions for PDEs with Dirac Delta Sources

Arxiv

0+阅读 · 6月10日

When Attention Beats Fourier: Multi-Scale Transformers for PDE Solving on Irregular Domains

Arxiv

0+阅读 · 6月4日

Expressive Power of Deep Homomorphism Networks over Relational Databases

Arxiv

0+阅读 · 5月18日

Score-Based Generative Modeling through Anisotropic Stochastic Partial Differential Equations

Arxiv

0+阅读 · 5月9日

Explainable Deep Learning: A Field Guide for the Uninitiated

Arxiv

51+阅读 · 2021年9月13日

VIP会员

文章信息

相关主题

最新内容

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

6+阅读 · 今天2:06

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

5+阅读 · 今天1:37

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

3+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

5+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

4+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

6+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

6+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

3+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

5+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

5+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

4+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

3+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

8+阅读 · 6月16日

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

6+阅读 · 6月16日

相关VIP内容

【CMU博士论文】迈向机器学习解微分方程的理论与实证基础

【CMU博士论文】迈向机器学习解微分方程的理论与实证基础

专知会员服务

18+阅读 · 2025年5月28日

图神经网络与常微分方程及其应用：结合微分方程与图神经网络的全面综述

图神经网络与常微分方程及其应用：结合微分方程与图神经网络的全面综述

专知会员服务

18+阅读 · 2025年4月3日

【EMORY博士论文】几何数据的可解释和交互式表示学习，187页pdf

【EMORY博士论文】几何数据的可解释和交互式表示学习，187页pdf

专知会员服务

36+阅读 · 2023年3月3日

基于神经网络的偏微分方程求解方法研究综述

基于神经网络的偏微分方程求解方法研究综述

专知会员服务

72+阅读 · 2022年12月7日

深度学习如何解决数学方程？四川大学最新《深度神经网络偏微分方程》综述，19页pdf阐述如何用DNN有效地解决PDE

深度学习如何解决数学方程？四川大学最新《深度神经网络偏微分方程》综述，19页pdf阐述如何用DNN有效地解决PDE

专知会员服务

64+阅读 · 2022年11月13日

【芝加博士论文】图表示学习，图上的深度生成模型，组等变分子神经网络和多分辨率机器学习

【芝加博士论文】图表示学习，图上的深度生成模型，组等变分子神经网络和多分辨率机器学习

专知会员服务

33+阅读 · 2022年11月5日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

【牛津大学博士论文】深度学习数据驱动发现偏微分方程，160页pdf

【牛津大学博士论文】深度学习数据驱动发现偏微分方程，160页pdf

专知会员服务

63+阅读 · 2022年11月1日

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

专知会员服务

60+阅读 · 2020年11月21日

《应用随机微分方程》(Applied Stochastic Differential Equations)324页pdf新书分享

《应用随机微分方程》(Applied Stochastic Differential Equations)324页pdf新书分享

专知会员服务

44+阅读 · 2019年10月28日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

相关资讯

【2022新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

【2022新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

专知

29+阅读 · 2022年4月12日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

量子位

17+阅读 · 2019年12月2日

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

专知

14+阅读 · 2019年11月25日

【论文笔记】具有可微分池化的分层图表示学习

【论文笔记】具有可微分池化的分层图表示学习

专知

47+阅读 · 2019年11月11日

《应用随机微分方程》，324页pdf新书免费分享

《应用随机微分方程》，324页pdf新书免费分享

专知

20+阅读 · 2019年5月6日

7个实用的深度学习技巧

7个实用的深度学习技巧

机器学习算法与Python学习

16+阅读 · 2019年3月6日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

相关论文

Enhancing Physics-Informed Neural Networks Through Feature Engineering

Enhancing Physics-Informed Neural Networks Through Feature Engineering

Arxiv

0+阅读 · 6月15日

RepNet: Tackling spectral bias in deep neural networks via parameter reparameterization

Arxiv

0+阅读 · 6月15日

Multi-Scale Separable Fourier Neural Networks for Solving High-Frequency PDEs

Arxiv

0+阅读 · 6月14日

Learning a Sampling-Free Variational DNN Plugin from Tiny Training Sets to Refine OOD Segmentation With Uncertainty Estimation

Arxiv

0+阅读 · 6月14日

A Survey of Deep Learning for Geometry Problem Solving

Arxiv

0+阅读 · 6月11日

Physics-Informed Neural Networks and Radial Basis Functions for PDEs with Dirac Delta Sources

Arxiv

0+阅读 · 6月10日

When Attention Beats Fourier: Multi-Scale Transformers for PDE Solving on Irregular Domains

Arxiv

0+阅读 · 6月4日

Expressive Power of Deep Homomorphism Networks over Relational Databases

Arxiv

0+阅读 · 5月18日

Score-Based Generative Modeling through Anisotropic Stochastic Partial Differential Equations

Arxiv

0+阅读 · 5月9日

Explainable Deep Learning: A Field Guide for the Uninitiated

Arxiv

51+阅读 · 2021年9月13日

相关基金

基于GPU的几类分数阶微分方程的并行算法研究及其实现

国家自然科学基金

0+阅读 · 2015年12月31日

分数阶微分方程解的研究

国家自然科学基金

0+阅读 · 2015年12月31日

高阶微分方程的周期解及多重性

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

随机偏微分方程多辛几何算法及不确定性量化

国家自然科学基金

0+阅读 · 2015年12月31日

分数阶非线性偏微分方程的相关数学问题

国家自然科学基金

0+阅读 · 2014年12月31日

高阶分数阶偏微分方程的全离散局部间断有限元方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶微分方程多点边值问题的数值算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶偏微分方程与近场动力学等非局部模型的高保真快速算法与数值分析

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员