双层障碍问题最优控制的单循环深度学习算法 (A Single-Loop Bilevel Deep Learning Method for Optimal Control of Obstacle Problems) - 专知论文

会员服务 ·

0

算法 · 最优 · 学习算法 · 结构 · 网格 ·

A Single-Loop Bilevel Deep Learning Method for Optimal Control of Obstacle Problems

翻译：双层障碍问题最优控制的单循环深度学习算法

Yongcun Song,Shangzhi Zeng,Jin Zhang,Lvgang Zhang

Optimal control of obstacle problems arises in a wide range of applications and is computationally challenging due to its nonsmoothness, nonlinearity, and bilevel structure. Classical numerical approaches rely on mesh-based discretization and typically require solving a sequence of costly subproblems. In this work, we propose a single-loop bilevel deep learning method, which is mesh-free, scalable to high-dimensional and complex domains, and avoids repeated solution of discretized subproblems. The method employs constraint-embedding neural networks to approximate the state and control and preserves the bilevel structure. To train the neural networks efficiently, we propose a Single-Loop Stochastic First-Order Bilevel Algorithm (S2-FOBA), which eliminates nested optimization and does not rely on restrictive lower-level uniqueness assumptions. We analyze the convergence behavior of S2-FOBA under mild assumptions. Numerical experiments on benchmark examples, including distributed and obstacle control problems with regular and irregular obstacles on complex domains, demonstrate that the proposed method achieves satisfactory accuracy while reducing computational cost compared to classical numerical methods.

翻译：障碍问题的最优控制广泛应用于多个领域，但由于其非光滑性、非线性及双层结构，计算上具有挑战性。经典数值方法依赖于基于网格的离散化，通常需要求解一系列计算代价高昂的子问题。本文提出一种单循环双层深度学习方法，该方法无需网格划分，可扩展至高维复杂区域，且避免了重复求解离散化子问题。该方法采用约束嵌入神经网络来逼近状态和控制变量，并保持了双层结构。为高效训练神经网络，我们提出一种单循环随机一阶双层算法（S2-FOBA），该算法消除了嵌套优化过程，且不依赖于限制性的下层唯一性假设。我们在温和假设下分析了S2-FOBA的收敛行为。在基准算例上的数值实验（包括复杂区域上含规则与非规则障碍的分布式控制及障碍控制问题）表明，与经典数值方法相比，所提方法在保证满意精度的同时显著降低了计算成本。

0

相关内容

在数学和计算机科学之中，算法（Algorithm）为一个计算的具体步骤，常用于计算、数据处理和自动推理。精确而言，算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。来自维基百科：算法

【新书】优化算法:用于设计、规划和控制问题的人工智能技术，669页pdf

【新书】优化算法:用于设计、规划和控制问题的人工智能技术，669页pdf

专知会员服务

95+阅读 · 2024年8月28日

【普林斯顿博士论文】高维强化学习与最优控制问题，121页pdf

【普林斯顿博士论文】高维强化学习与最优控制问题，121页pdf

专知会员服务

50+阅读 · 2023年7月25日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

台大最新《深度学习优化问题》硬核课，台大林智仁教授讲解，附课件下载

台大最新《深度学习优化问题》硬核课，台大林智仁教授讲解，附课件下载

专知会员服务

65+阅读 · 2021年5月17日

【论文】深度学习的最优化:理论和算法（Optimization for deep learning: theory and algorithms）

【论文】深度学习的最优化:理论和算法（Optimization for deep learning: theory and algorithms）

专知会员服务

148+阅读 · 2019年12月28日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

专知会员服务

24+阅读 · 2019年11月11日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

2018年深度学习优化算法最新综述

2018年深度学习优化算法最新综述

计算机视觉战队

10+阅读 · 2018年12月11日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

偏微分方程最优控制问题的高精度低阶非协调有限元方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

最优控制问题H1-Galerkin混合有限元方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

运用协同分布估计算法优化交通调度问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模分布式一致性最优化问题的结构型一阶求解算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

有限范围随机最优控制系统的数值方法与均场倒向随机系统的最优控制问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

弱线性双层规划问题的理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

随机双曲型偏微分方程的控制和观测

国家自然科学基金

0+阅读 · 2014年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

A Single-Loop First-Order Algorithm for Linearly Constrained Bilevel Optimization

Arxiv

0+阅读 · 2月4日

Data-Driven Qubit Characterization and Optimal Control using Deep Learning

Arxiv

0+阅读 · 1月26日

Learning to Optimize by Differentiable Programming

Arxiv

0+阅读 · 1月23日

Non-Stationary Functional Bilevel Optimization

Arxiv

0+阅读 · 1月21日

Provably Fast and Space-Efficient Parallel Biconnectivity

Arxiv

0+阅读 · 1月19日

Deep Learning for Continuous-Time Stochastic Control with Jumps

Arxiv

0+阅读 · 1月15日

Layerwise goal-oriented adaptivity for neural ODEs: an optimal control perspective

Arxiv

0+阅读 · 1月12日

Deep Reinforcement Learning for Bipedal Locomotion: A Brief Survey

Arxiv

0+阅读 · 1月7日

BiLO: Bilevel Local Operator Learning for PDE Inverse Problems

Arxiv

0+阅读 · 1月7日

Two-hidden-layer ReLU neural networks and finite elements

Arxiv

0+阅读 · 1月4日

VIP会员

文章信息

相关主题

相关VIP内容

【新书】优化算法:用于设计、规划和控制问题的人工智能技术，669页pdf

【新书】优化算法:用于设计、规划和控制问题的人工智能技术，669页pdf

专知会员服务

95+阅读 · 2024年8月28日

【普林斯顿博士论文】高维强化学习与最优控制问题，121页pdf

【普林斯顿博士论文】高维强化学习与最优控制问题，121页pdf

专知会员服务

50+阅读 · 2023年7月25日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

台大最新《深度学习优化问题》硬核课，台大林智仁教授讲解，附课件下载

台大最新《深度学习优化问题》硬核课，台大林智仁教授讲解，附课件下载

专知会员服务

65+阅读 · 2021年5月17日

【论文】深度学习的最优化:理论和算法（Optimization for deep learning: theory and algorithms）

【论文】深度学习的最优化:理论和算法（Optimization for deep learning: theory and algorithms）

专知会员服务

148+阅读 · 2019年12月28日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

专知会员服务

24+阅读 · 2019年11月11日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

2018年深度学习优化算法最新综述

2018年深度学习优化算法最新综述

计算机视觉战队

10+阅读 · 2018年12月11日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

相关论文

A Single-Loop First-Order Algorithm for Linearly Constrained Bilevel Optimization

Arxiv

0+阅读 · 2月4日

Data-Driven Qubit Characterization and Optimal Control using Deep Learning

Arxiv

0+阅读 · 1月26日

Learning to Optimize by Differentiable Programming

Arxiv

0+阅读 · 1月23日

Non-Stationary Functional Bilevel Optimization

Arxiv

0+阅读 · 1月21日

Provably Fast and Space-Efficient Parallel Biconnectivity

Arxiv

0+阅读 · 1月19日

Deep Learning for Continuous-Time Stochastic Control with Jumps

Arxiv

0+阅读 · 1月15日

Layerwise goal-oriented adaptivity for neural ODEs: an optimal control perspective

Arxiv

0+阅读 · 1月12日

Deep Reinforcement Learning for Bipedal Locomotion: A Brief Survey

Arxiv

0+阅读 · 1月7日

BiLO: Bilevel Local Operator Learning for PDE Inverse Problems

Arxiv

0+阅读 · 1月7日

Two-hidden-layer ReLU neural networks and finite elements

Arxiv

0+阅读 · 1月4日

相关基金

偏微分方程最优控制问题的高精度低阶非协调有限元方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

最优控制问题H1-Galerkin混合有限元方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

运用协同分布估计算法优化交通调度问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模分布式一致性最优化问题的结构型一阶求解算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

有限范围随机最优控制系统的数值方法与均场倒向随机系统的最优控制问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

弱线性双层规划问题的理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

随机双曲型偏微分方程的控制和观测

国家自然科学基金

0+阅读 · 2014年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员