This paper proposes a new algorithm -- the Momentum-assisted Single-timescale Stochastic Approximation (MSTSA) -- for tackling unconstrained bilevel optimization problems. We focus on bilevel problems where the lower level subproblem is strongly-convex. Unlike prior works which rely on two timescale or double loop techniques that track the optimal solution to the lower level subproblem, we design a stochastic momentum assisted gradient estimator for the upper level subproblem's updates. The latter allows us to gradually control the error in stochastic gradient updates due to inaccurate solution to the lower level subproblem. We show that if the upper objective function is smooth but possibly non-convex (resp. strongly-convex), MSTSA requires $\mathcal{O}(\epsilon^{-2})$ (resp. $\mathcal{O}(\epsilon^{-1})$) iterations (each using constant samples) to find an $\epsilon$-stationary (resp. $\epsilon$-optimal) solution. This achieves the best-known guarantees for stochastic bilevel problems. We validate our theoretical results by showing the efficiency of the MSTSA algorithm on hyperparameter optimization and data hyper-cleaning problems.


翻译:本文建议一种新的算法 -- -- 由运动辅助的单一时间尺度软体缩放缩放缩放缩放缩放缩放缩放缩放, 用于解决不受限制的双级优化问题。 我们关注低层次子问题为强固化的双级问题。 与以前依靠两种时间尺度或双圈技术来跟踪低层次子问题的最佳解决方案的工程不同, 我们设计了一个用于上层次子问题更新的随机振荡动动动势辅助梯度估计仪。 后者允许我们逐渐控制由于低层次子问题溶解不准确而导致的振动梯度更新错误。 我们显示, 如果上级目标功能平滑, 但可能非凝固( 强固) 的双级问题。 MSTSA 需要$\ mathcal{O} (\ epsilon% 2} 美元( resprescraital cal) policalalal- supligialalalalalal- probilation maisal- probilizational- prestialal- promaisal maisal- prestialismissional romabilal romaismissutionalism)

0
下载
关闭预览

相关内容

专知会员服务
52+阅读 · 2020年12月14日
因果图,Causal Graphs,52页ppt
专知会员服务
253+阅读 · 2020年4月19日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
32+阅读 · 2019年10月17日
【新书】Python编程基础,669页pdf
专知会员服务
197+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
已删除
将门创投
3+阅读 · 2019年4月19日
Arxiv
5+阅读 · 2017年12月14日
VIP会员
最新内容
《基于Transformer的异常舰船导航识别与跟踪》80页
专知会员服务
0+阅读 · 16分钟前
《低数据领域军事目标检测模型研究》
专知会员服务
0+阅读 · 24分钟前
【CMU博士论文】物理世界的视觉感知与深度理解
伊朗战争停火期间美军关键弹药状况分析
专知会员服务
8+阅读 · 4月22日
电子战革命:塑造战场的十年突破(2015–2025)
人工智能即服务与未来战争(印度视角)
专知会员服务
4+阅读 · 4月22日
《美国战争部2027财年军事人员预算》
专知会员服务
3+阅读 · 4月22日
伊朗战争中的电子战
专知会员服务
5+阅读 · 4月22日
大语言模型平台在国防情报应用中的对比
专知会员服务
9+阅读 · 4月22日
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
已删除
将门创投
3+阅读 · 2019年4月19日
Top
微信扫码咨询专知VIP会员