This paper proposes a new algorithm -- the Momentum-assisted Single-timescale Stochastic Approximation (MSTSA) -- for tackling unconstrained bilevel optimization problems. We focus on bilevel problems where the lower level subproblem is strongly-convex. Unlike prior works which rely on two timescale or double loop techniques that track the optimal solution to the lower level subproblem, we design a stochastic momentum assisted gradient estimator for the upper level subproblem's updates. The latter allows us to gradually control the error in stochastic gradient updates due to inaccurate solution to the lower level subproblem. We show that if the upper objective function is smooth but possibly non-convex (resp. strongly-convex), MSTSA requires $\mathcal{O}(\epsilon^{-2})$ (resp. $\mathcal{O}(\epsilon^{-1})$) iterations (each using constant samples) to find an $\epsilon$-stationary (resp. $\epsilon$-optimal) solution. This achieves the best-known guarantees for stochastic bilevel problems. We validate our theoretical results by showing the efficiency of the MSTSA algorithm on hyperparameter optimization and data hyper-cleaning problems.


翻译:本文建议一种新的算法 -- -- 由运动辅助的单一时间尺度软体缩放缩放缩放缩放缩放缩放缩放缩放, 用于解决不受限制的双级优化问题。 我们关注低层次子问题为强固化的双级问题。 与以前依靠两种时间尺度或双圈技术来跟踪低层次子问题的最佳解决方案的工程不同, 我们设计了一个用于上层次子问题更新的随机振荡动动动势辅助梯度估计仪。 后者允许我们逐渐控制由于低层次子问题溶解不准确而导致的振动梯度更新错误。 我们显示, 如果上级目标功能平滑, 但可能非凝固( 强固) 的双级问题。 MSTSA 需要$\ mathcal{O} (\ epsilon% 2} 美元( resprescraital cal) policalalal- supligialalalalalal- probilation maisal- probilizational- prestialal- promaisal maisal- prestialismissional romabilal romaismissutionalism)

0
下载
关闭预览

相关内容

专知会员服务
52+阅读 · 2020年12月14日
因果图,Causal Graphs,52页ppt
专知会员服务
254+阅读 · 2020年4月19日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
32+阅读 · 2019年10月17日
【新书】Python编程基础,669页pdf
专知会员服务
198+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
已删除
将门创投
3+阅读 · 2019年4月19日
Arxiv
5+阅读 · 2017年12月14日
VIP会员
最新内容
无人机自主控制与人工智能:系统性综述
专知会员服务
2+阅读 · 53分钟前
巡飞弹与反无人机系统——现代战场的两大支柱
专知会员服务
1+阅读 · 今天6:54
《打造“黄金舰队”》57页报告
专知会员服务
1+阅读 · 今天6:52
《北约数字教官网络发展路径》128页报告
专知会员服务
1+阅读 · 今天6:33
ECCV 2026 | MIMFlow:MIM与归一化流统一图像生成
专知会员服务
6+阅读 · 6月25日
网状网络及其在军事领域的运用
专知会员服务
7+阅读 · 6月25日
无美国参与的欧洲战争方式(万字长文)
专知会员服务
8+阅读 · 6月25日
《国防领域敏感性分析白皮书》
专知会员服务
9+阅读 · 6月25日
综述 | 从问答到任务完成:Agent系统与Harness设计
Agentic RL:框架、实践与长程智能体训练
专知会员服务
10+阅读 · 6月24日
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
已删除
将门创投
3+阅读 · 2019年4月19日
Top
微信扫码咨询专知VIP会员