Convergence Rate of the Last Iterate of Stochastic Proximal Algorithms - 专知论文

会员服务 ·

0

收敛速率 · 算法 · 分析 · 非光滑 · 优化问题 ·

Convergence Rate of the Last Iterate of Stochastic Proximal Algorithms

翻译：随机近端算法末次迭代的收敛速率分析

Kevin Kurian Thomas Vaidyan,Michael P. Friedlander,Ahmet Alacaoglu

We analyze two classical algorithms for solving additively composite convex optimization problems where the objective is the sum of a smooth term and a nonsmooth regularizer: proximal stochastic gradient method for a single regularizer; and the randomized incremental proximal method, which uses the proximal operator of a randomly selected function when the regularizer is given as the sum of many nonsmooth functions. We focus on relaxing the bounded variance assumption that is common, yet stringent, for getting last iterate convergence rates. We prove the $\widetilde{O}(1/\sqrt{T})$ rate of convergence for the last iterate of both algorithms under componentwise convexity and smoothness, which is optimal up to log terms. Our results apply directly to graph-guided regularizers that arise in multi-task and federated learning, where the regularizer decomposes as a sum over edges of a collaboration graph.

翻译：本文针对加性复合凸优化问题分析了两类经典算法，其中目标函数由光滑项与非光滑正则项之和构成：针对单一正则项的随机近端梯度法；以及当正则项表示为多个非光滑函数之和时采用的随机增量近端方法，该方法通过随机选择函数的近端算子进行迭代。我们重点研究了在放宽有界方差假设条件下获取末次迭代收敛速率的理论，该假设在现有研究中普遍存在但约束性较强。在分量凸性与光滑性条件下，我们证明了两类算法末次迭代均具有$\widetilde{O}(1/\sqrt{T})$的收敛速率，该速率除对数项外已达理论最优。我们的研究成果可直接应用于多任务学习与联邦学习中出现的图引导正则项，此类正则项可分解为协作图边上的求和形式。

0

相关内容

收敛速率

【牛津大学博士论文】深度学习算法的渐近分析，186页pdf

【牛津大学博士论文】深度学习算法的渐近分析，186页pdf

专知会员服务

29+阅读 · 2024年6月27日

【简明书册】(随机)梯度方法的收敛定理手册，68页pdf

【简明书册】(随机)梯度方法的收敛定理手册，68页pdf

专知会员服务

39+阅读 · 2023年1月31日

【博士论文】基于冲量的加速优化算法

【博士论文】基于冲量的加速优化算法

专知会员服务

28+阅读 · 2021年11月29日

【干货书】机器学习的一阶和随机优化方法，591页pdf阐述机器学习算法基础概念和近期进展

【干货书】机器学习的一阶和随机优化方法，591页pdf阐述机器学习算法基础概念和近期进展

专知会员服务

82+阅读 · 2021年5月13日

通过条件梯度进行结构化机器学习训练，50页ppt与视频

通过条件梯度进行结构化机器学习训练，50页ppt与视频

专知会员服务

13+阅读 · 2021年2月25日

【博士论文】机器学习中部分非凸和随机优化算法研究

专知会员服务

75+阅读 · 2020年12月7日

策略梯度方法的算子视图，An operator view of policy gradient methods

策略梯度方法的算子视图，An operator view of policy gradient methods

专知会员服务

11+阅读 · 2020年6月23日

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

专知会员服务

33+阅读 · 2020年4月26日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

【干货书】凸随机优化，320页pdf

【干货书】凸随机优化，320页pdf

专知

12+阅读 · 2022年9月16日

机器学习必读新书-《凸优化算法原理详解》，334页pdf

机器学习必读新书-《凸优化算法原理详解》，334页pdf

专知

10+阅读 · 2022年1月4日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

博客 | 机器学习中的数学基础（凸优化）

博客 | 机器学习中的数学基础（凸优化）

AI研习社

14+阅读 · 2018年12月16日

2018年深度学习优化算法最新综述

2018年深度学习优化算法最新综述

计算机视觉战队

10+阅读 · 2018年12月11日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

绝对干货 | 随机梯度下降算法综述

绝对干货 | 随机梯度下降算法综述

菜鸟的机器学习

15+阅读 · 2017年10月30日

精品公开课 | 随机梯度下降算法综述

精品公开课 | 随机梯度下降算法综述

七月在线实验室

13+阅读 · 2017年7月11日

非线性加权观测融合滤波算法及其渐近最优性研究

国家自然科学基金

0+阅读 · 2015年12月31日

求解非凸随机二阶锥优化问题的无导数方法研究与应用

国家自然科学基金

0+阅读 · 2015年12月31日

分数随机微分方程的定性理论研究及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

非光滑非凸优化问题的交替线性化算法及其应用

国家自然科学基金

6+阅读 · 2015年12月31日

无限闭凸集族凸可行性问题中投影算法的线性收敛

国家自然科学基金

0+阅读 · 2015年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

求解非线性方程的加速迭代算法

国家自然科学基金

0+阅读 · 2014年12月31日

相依重尾随机变量和的渐近性及其在更新风险模型中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

一些几何发展方程中的渐近分析研究

国家自然科学基金

0+阅读 · 2014年12月31日

随机排队网络的强逼近及其相关渐近分析

国家自然科学基金

0+阅读 · 2014年12月31日

Stochastic Resetting Accelerates Policy Convergence in Reinforcement Learning

Arxiv

0+阅读 · 3月17日

Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization

Arxiv

0+阅读 · 3月7日

Optimal Local Convergence Rates of Stochastic First-Order Methods under Local $α$-PL

Arxiv

0+阅读 · 2月23日

Convergence rates of random-order best-response dynamics in public good games on networks

Arxiv

0+阅读 · 2月17日

Functional Central Limit Theorem for Stochastic Gradient Descent

Arxiv

0+阅读 · 2月17日

High-accuracy log-concave sampling with stochastic queries

Arxiv

0+阅读 · 2月15日

Quantifying Normality: Convergence Rate to Gaussian Limit for Stochastic Approximation and Unadjusted OU Algorithm

Arxiv

0+阅读 · 2月14日

Single-loop Algorithms for Stochastic Non-convex Optimization with Weakly-Convex Constraints

Arxiv

0+阅读 · 2月6日

A Single-Loop First-Order Algorithm for Linearly Constrained Bilevel Optimization

Arxiv

0+阅读 · 2月4日

An Approximate Ascent Approach To Prove Convergence of PPO

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

最新内容

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

专知会员服务

0+阅读 · 今天10:06

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

专知会员服务

1+阅读 · 今天9:11

深入Maven智能系统：Palantir基于Claude打造的军事大脑

深入Maven智能系统：Palantir基于Claude打造的军事大脑

专知会员服务

5+阅读 · 今天8:18

“Maven计划”的发展演变之“Maven智能系统”应用

“Maven计划”的发展演变之“Maven智能系统”应用

专知会员服务

4+阅读 · 今天8:03

伊朗的无人机蜂群策略如何挑战美国防御系统：人工智能驱动的无人机战争与现代冲突的转型

伊朗的无人机蜂群策略如何挑战美国防御系统：人工智能驱动的无人机战争与现代冲突的转型

专知会员服务

5+阅读 · 今天7:39

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

专知会员服务

2+阅读 · 今天6:58

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

专知会员服务

3+阅读 · 今天6:54

《无人机革命：来自俄乌战场的启示》（报告）

《无人机革命：来自俄乌战场的启示》（报告）

专知会员服务

5+阅读 · 今天6:48

《实现联合作战能力所需的技术》58页报告

《实现联合作战能力所需的技术》58页报告

专知会员服务

2+阅读 · 今天6:30

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

专知会员服务

5+阅读 · 今天6:22

以色列运用人工智能优化空袭警报系统

以色列运用人工智能优化空袭警报系统

专知会员服务

3+阅读 · 今天6:20

以色列在多条战线部署AI智能体

以色列在多条战线部署AI智能体

专知会员服务

4+阅读 · 今天6:12

《将形式化方法工具应用于电子战代码库（经验报告）》

《将形式化方法工具应用于电子战代码库（经验报告）》

专知会员服务

4+阅读 · 今天6:09

2025年大语言模型进展报告

2025年大语言模型进展报告

专知会员服务

19+阅读 · 4月25日

多智能体协作机制

多智能体协作机制

专知会员服务

15+阅读 · 4月25日

相关VIP内容

【牛津大学博士论文】深度学习算法的渐近分析，186页pdf

【牛津大学博士论文】深度学习算法的渐近分析，186页pdf

专知会员服务

29+阅读 · 2024年6月27日

【简明书册】(随机)梯度方法的收敛定理手册，68页pdf

【简明书册】(随机)梯度方法的收敛定理手册，68页pdf

专知会员服务

39+阅读 · 2023年1月31日

【博士论文】基于冲量的加速优化算法

【博士论文】基于冲量的加速优化算法

专知会员服务

28+阅读 · 2021年11月29日

【干货书】机器学习的一阶和随机优化方法，591页pdf阐述机器学习算法基础概念和近期进展

【干货书】机器学习的一阶和随机优化方法，591页pdf阐述机器学习算法基础概念和近期进展

专知会员服务

82+阅读 · 2021年5月13日

通过条件梯度进行结构化机器学习训练，50页ppt与视频

通过条件梯度进行结构化机器学习训练，50页ppt与视频

专知会员服务

13+阅读 · 2021年2月25日

【博士论文】机器学习中部分非凸和随机优化算法研究

专知会员服务

75+阅读 · 2020年12月7日

策略梯度方法的算子视图，An operator view of policy gradient methods

策略梯度方法的算子视图，An operator view of policy gradient methods

专知会员服务

11+阅读 · 2020年6月23日

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

专知会员服务

33+阅读 · 2020年4月26日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

“Maven计划”的发展演变之“Maven智能系统”应用

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

深入Maven智能系统：Palantir基于Claude打造的军事大脑

相关资讯

【干货书】凸随机优化，320页pdf

【干货书】凸随机优化，320页pdf

专知

12+阅读 · 2022年9月16日

机器学习必读新书-《凸优化算法原理详解》，334页pdf

机器学习必读新书-《凸优化算法原理详解》，334页pdf

专知

10+阅读 · 2022年1月4日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

博客 | 机器学习中的数学基础（凸优化）

博客 | 机器学习中的数学基础（凸优化）

AI研习社

14+阅读 · 2018年12月16日

2018年深度学习优化算法最新综述

2018年深度学习优化算法最新综述

计算机视觉战队

10+阅读 · 2018年12月11日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

绝对干货 | 随机梯度下降算法综述

绝对干货 | 随机梯度下降算法综述

菜鸟的机器学习

15+阅读 · 2017年10月30日

精品公开课 | 随机梯度下降算法综述

精品公开课 | 随机梯度下降算法综述

七月在线实验室

13+阅读 · 2017年7月11日

相关论文

Stochastic Resetting Accelerates Policy Convergence in Reinforcement Learning

Arxiv

0+阅读 · 3月17日

Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization

Arxiv

0+阅读 · 3月7日

Optimal Local Convergence Rates of Stochastic First-Order Methods under Local $α$-PL

Arxiv

0+阅读 · 2月23日

Convergence rates of random-order best-response dynamics in public good games on networks

Arxiv

0+阅读 · 2月17日

Functional Central Limit Theorem for Stochastic Gradient Descent

Arxiv

0+阅读 · 2月17日

High-accuracy log-concave sampling with stochastic queries

Arxiv

0+阅读 · 2月15日

Quantifying Normality: Convergence Rate to Gaussian Limit for Stochastic Approximation and Unadjusted OU Algorithm

Arxiv

0+阅读 · 2月14日

Single-loop Algorithms for Stochastic Non-convex Optimization with Weakly-Convex Constraints

Arxiv

0+阅读 · 2月6日

A Single-Loop First-Order Algorithm for Linearly Constrained Bilevel Optimization

Arxiv

0+阅读 · 2月4日

An Approximate Ascent Approach To Prove Convergence of PPO

Arxiv

0+阅读 · 2月3日

相关基金

非线性加权观测融合滤波算法及其渐近最优性研究

国家自然科学基金

0+阅读 · 2015年12月31日

求解非凸随机二阶锥优化问题的无导数方法研究与应用

国家自然科学基金

0+阅读 · 2015年12月31日

分数随机微分方程的定性理论研究及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

非光滑非凸优化问题的交替线性化算法及其应用

国家自然科学基金

6+阅读 · 2015年12月31日

无限闭凸集族凸可行性问题中投影算法的线性收敛

国家自然科学基金

0+阅读 · 2015年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

求解非线性方程的加速迭代算法

国家自然科学基金

0+阅读 · 2014年12月31日

相依重尾随机变量和的渐近性及其在更新风险模型中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

一些几何发展方程中的渐近分析研究

国家自然科学基金

0+阅读 · 2014年12月31日

随机排队网络的强逼近及其相关渐近分析

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员