Fast and Large-Scale Unbalanced Optimal Transport via its Semi-Dual and Adaptive Gradient Methods - 专知论文

会员服务 ·

0

梯度 · 自适应 · 最优 · 传输 · 最优传输 ·

Fast and Large-Scale Unbalanced Optimal Transport via its Semi-Dual and Adaptive Gradient Methods

翻译：快速大规模非平衡最优传输：基于半对偶与自适应梯度方法的研究

Ferdinand Genans

Unbalanced Optimal Transport (UOT) has emerged as a robust relaxation of standard Optimal Transport, particularly effective for handling outliers and mass variations. However, scalable algorithms for UOT, specifically those based on Gradient Descent (SGD), remain largely underexplored. In this work, we address this gap by analyzing the semi-dual formulation of Entropic UOT and demonstrating its suitability for adaptive gradient methods. While the semi-dual is a standard tool for large-scale balanced OT, its geometry in the unbalanced setting appears ill-conditioned under standard analysis. Specifically, worst-case bounds on the marginal penalties using $χ^2$ divergence suggest a condition number scaling with $n/\varepsilon$, implying poor scalability. In contrast, we show that the local condition number actually scales as $\mathcal{O}(1/\varepsilon)$, effectively removing the ill-conditioned dependence on $n$. Exploiting this property, we prove that SGD methods adapt to this local curvature, achieving a convergence rate of $\mathcal{O}(n/\varepsilon T)$ in the stochastic and online regimes, making it suitable for large-scale and semi-discrete applications. Finally, for the full batch discrete setting, we derive a nearly tight upper bound on local smoothness depending solely on the gradient. Using it to adapt step sizes, we propose a modified Adaptive Nesterov Accelerated Gradient (ANAG) method on the semi-dual functional and prove that it achieves a local complexity of $\mathcal{O}(n^2\sqrt{1/\varepsilon}\ln(1/δ))$.

翻译：非平衡最优传输（UOT）已成为标准最优传输的一种鲁棒松弛形式，在处理异常值和质量变化方面尤为有效。然而，针对UOT的可扩展算法，特别是基于随机梯度下降（SGD）的方法，目前仍缺乏深入探索。本研究通过分析熵正则化UOT的半对偶形式，证明了其适用于自适应梯度方法，从而填补了这一空白。虽然半对偶是大规模平衡OT的标准工具，但在非平衡设定下，其几何性质在标准分析中表现出病态特性。具体而言，使用χ²散度的边际惩罚最坏情况边界表明条件数与n/ε成比例，这意味着可扩展性较差。与之相反，我们证明局部条件数实际按O(1/ε)缩放，有效消除了对n的病态依赖。利用这一特性，我们证明了SGD方法能够适应这种局部曲率，在随机和在线机制下达到O(n/εT)的收敛速率，使其适用于大规模和半离散应用场景。最后，针对全批量离散设定，我们推导出仅依赖于梯度的局部平滑度的近乎紧致上界。通过利用该上界自适应调整步长，我们在半对偶泛函上提出改进的自适应涅斯捷罗夫加速梯度（ANAG）方法，并证明其达到O(n²√(1/ε)ln(1/δ))的局部计算复杂度。

0

相关内容

梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

专知会员服务

27+阅读 · 2024年8月27日

【CMU博士论文】最优传输的统计推断

【CMU博士论文】最优传输的统计推断

专知会员服务

28+阅读 · 2024年5月29日

【博士论文】最优传输的进展：低秩结构及其在机器学习中的应用，364页pdf

【博士论文】最优传输的进展：低秩结构及其在机器学习中的应用，364页pdf

专知会员服务

49+阅读 · 2023年10月26日

ICML2023教程《学习、控制与动力系统中的最优传输》, 附406页Slides

ICML2023教程《学习、控制与动力系统中的最优传输》, 附406页Slides

专知会员服务

33+阅读 · 2023年9月24日

「机器学习最优传输」最新进展, 巴黎萨克雷大学编著

「机器学习最优传输」最新进展, 巴黎萨克雷大学编著

专知会员服务

29+阅读 · 2023年6月29日

【博士论文】机器学习中的熵最优传输:在分布回归、重心估计和概率匹配中的应用，209页pdf

【博士论文】机器学习中的熵最优传输:在分布回归、重心估计和概率匹配中的应用，209页pdf

专知会员服务

37+阅读 · 2022年5月23日

2022最新教程《深度学习最优传输导论》，麦吉尔大学Kilian Fatras博士

2022最新教程《深度学习最优传输导论》，麦吉尔大学Kilian Fatras博士

专知会员服务

35+阅读 · 2022年4月30日

【香港中文大学(深圳)查宏远教授】最优传输与应用，Optimal Transport and Application

【香港中文大学(深圳)查宏远教授】最优传输与应用，Optimal Transport and Application

专知会员服务

18+阅读 · 2022年3月17日

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

专知会员服务

33+阅读 · 2022年3月4日

【SIAM2021】机器学习最优传输，63页ppt教程

专知会员服务

47+阅读 · 2021年7月26日

【经典书】计算最优传输，209页pdf，Computational Optimal Transport

【经典书】计算最优传输，209页pdf，Computational Optimal Transport

专知

16+阅读 · 2021年1月10日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

新智元

20+阅读 · 2019年7月11日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

2018年深度学习优化算法最新综述

2018年深度学习优化算法最新综述

计算机视觉战队

10+阅读 · 2018年12月11日

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

产业智能官

13+阅读 · 2018年8月18日

当前最好的非深度迁移学习方法：流形空间下的分布对齐

当前最好的非深度迁移学习方法：流形空间下的分布对齐

PaperWeekly

11+阅读 · 2018年7月31日

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

量子位

10+阅读 · 2017年12月10日

非稳态对流传热过程的优化理论和方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

微纳结构和新颖超材料中的非对称光学传输

国家自然科学基金

0+阅读 · 2015年12月31日

求解非凸随机二阶锥优化问题的无导数方法研究与应用

国家自然科学基金

0+阅读 · 2015年12月31日

带变动指标集的非光滑半无限优化问题的最优性条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

梯度光滑法计算流体力学的算法理论研究和程序开发

国家自然科学基金

2+阅读 · 2015年12月31日

基于模型的无波前传感器自适应光学关键理论和方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

非线性约束全局优化的新方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

非Lipschitz优化问题的理论算法研究及其在稀疏解还原问题中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

Discrete Optimal Transport and Voice Conversion

Arxiv

0+阅读 · 2月25日

High-Dimensional Limit of Stochastic Gradient Flow via Dynamical Mean-Field Theory

Arxiv

0+阅读 · 2月16日

Pareto-optimal Trade-offs Between Communication and Computation with Flexible Gradient Tracking

Arxiv

0+阅读 · 2月15日

Quantile optimization in semidiscrete optimal transport

Arxiv

0+阅读 · 2月12日

Natural Hypergradient Descent: Algorithm Design, Convergence Analysis, and Parallel Implementation

Arxiv

0+阅读 · 2月11日

FlashSinkhorn: IO-Aware Entropic Optimal Transport

Arxiv

0+阅读 · 2月10日

Theory of Optimal Learning Rate Schedules and Scaling Laws for a Random Feature Model

Arxiv

0+阅读 · 2月4日

Do We Need Asynchronous SGD? On the Near-Optimality of Synchronous Methods

Arxiv

0+阅读 · 2月3日

Optimal Transport under Group Fairness Constraints

Arxiv

0+阅读 · 1月30日

Understanding Transformer Optimization via Gradient Heterogeneity

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

1+阅读 · 今天14:04

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

1+阅读 · 今天13:54

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

5+阅读 · 今天13:49

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

3+阅读 · 今天13:38

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

4+阅读 · 今天13:37

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

4+阅读 · 今天13:11

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

10+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

5+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

5+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

7+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

5+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

8+阅读 · 5月29日

“史诗怒火行动”中美军损失的作战飞机

“史诗怒火行动”中美军损失的作战飞机

专知会员服务

6+阅读 · 5月29日

ICML 2026 | 理解上下文持续学习中的泛化与遗忘

ICML 2026 | 理解上下文持续学习中的泛化与遗忘

专知会员服务

5+阅读 · 5月28日

相关VIP内容

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

专知会员服务

27+阅读 · 2024年8月27日

【CMU博士论文】最优传输的统计推断

【CMU博士论文】最优传输的统计推断

专知会员服务

28+阅读 · 2024年5月29日

【博士论文】最优传输的进展：低秩结构及其在机器学习中的应用，364页pdf

【博士论文】最优传输的进展：低秩结构及其在机器学习中的应用，364页pdf

专知会员服务

49+阅读 · 2023年10月26日

ICML2023教程《学习、控制与动力系统中的最优传输》, 附406页Slides

ICML2023教程《学习、控制与动力系统中的最优传输》, 附406页Slides

专知会员服务

33+阅读 · 2023年9月24日

「机器学习最优传输」最新进展, 巴黎萨克雷大学编著

「机器学习最优传输」最新进展, 巴黎萨克雷大学编著

专知会员服务

29+阅读 · 2023年6月29日

【博士论文】机器学习中的熵最优传输:在分布回归、重心估计和概率匹配中的应用，209页pdf

【博士论文】机器学习中的熵最优传输:在分布回归、重心估计和概率匹配中的应用，209页pdf

专知会员服务

37+阅读 · 2022年5月23日

2022最新教程《深度学习最优传输导论》，麦吉尔大学Kilian Fatras博士

2022最新教程《深度学习最优传输导论》，麦吉尔大学Kilian Fatras博士

专知会员服务

35+阅读 · 2022年4月30日

【香港中文大学(深圳)查宏远教授】最优传输与应用，Optimal Transport and Application

【香港中文大学(深圳)查宏远教授】最优传输与应用，Optimal Transport and Application

专知会员服务

18+阅读 · 2022年3月17日

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

专知会员服务

33+阅读 · 2022年3月4日

【SIAM2021】机器学习最优传输，63页ppt教程

专知会员服务

47+阅读 · 2021年7月26日

热门VIP内容

开通专知VIP会员享更多权益服务

美以伊战争：首次人工智能战争——军事自主性困境

《美海军利用扩展现实增强知识流动研究》300页报告

以色列-美国-伊朗战争中的无人机：关键要点

《Palantir任务保障性软件安全标准（MA-S2）》

相关资讯

【经典书】计算最优传输，209页pdf，Computational Optimal Transport

【经典书】计算最优传输，209页pdf，Computational Optimal Transport

专知

16+阅读 · 2021年1月10日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

新智元

20+阅读 · 2019年7月11日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

2018年深度学习优化算法最新综述

2018年深度学习优化算法最新综述

计算机视觉战队

10+阅读 · 2018年12月11日

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

产业智能官

13+阅读 · 2018年8月18日

当前最好的非深度迁移学习方法：流形空间下的分布对齐

当前最好的非深度迁移学习方法：流形空间下的分布对齐

PaperWeekly

11+阅读 · 2018年7月31日

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

量子位

10+阅读 · 2017年12月10日

相关论文

Discrete Optimal Transport and Voice Conversion

Arxiv

0+阅读 · 2月25日

High-Dimensional Limit of Stochastic Gradient Flow via Dynamical Mean-Field Theory

Arxiv

0+阅读 · 2月16日

Pareto-optimal Trade-offs Between Communication and Computation with Flexible Gradient Tracking

Arxiv

0+阅读 · 2月15日

Quantile optimization in semidiscrete optimal transport

Arxiv

0+阅读 · 2月12日

Natural Hypergradient Descent: Algorithm Design, Convergence Analysis, and Parallel Implementation

Arxiv

0+阅读 · 2月11日

FlashSinkhorn: IO-Aware Entropic Optimal Transport

Arxiv

0+阅读 · 2月10日

Theory of Optimal Learning Rate Schedules and Scaling Laws for a Random Feature Model

Arxiv

0+阅读 · 2月4日

Do We Need Asynchronous SGD? On the Near-Optimality of Synchronous Methods

Arxiv

0+阅读 · 2月3日

Optimal Transport under Group Fairness Constraints

Arxiv

0+阅读 · 1月30日

Understanding Transformer Optimization via Gradient Heterogeneity

Arxiv

0+阅读 · 1月30日

相关基金

非稳态对流传热过程的优化理论和方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

微纳结构和新颖超材料中的非对称光学传输

国家自然科学基金

0+阅读 · 2015年12月31日

求解非凸随机二阶锥优化问题的无导数方法研究与应用

国家自然科学基金

0+阅读 · 2015年12月31日

带变动指标集的非光滑半无限优化问题的最优性条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

梯度光滑法计算流体力学的算法理论研究和程序开发

国家自然科学基金

2+阅读 · 2015年12月31日

基于模型的无波前传感器自适应光学关键理论和方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

非线性约束全局优化的新方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

非Lipschitz优化问题的理论算法研究及其在稀疏解还原问题中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员