In this paper, we consider nonlinear optimization problems with a stochastic objective and deterministic equality constraints. We propose a Trust-Region Stochastic Sequential Quadratic Programming (TR-SSQP) method and establish its high-probability iteration complexity bounds for identifying first- and second-order $ε$-stationary points. In our algorithm, we assume that exact objective values, gradients, and Hessians are not directly accessible but can be estimated via zeroth-, first-, and second-order probabilistic oracles. Compared to existing complexity studies of SSQP methods that rely on a zeroth-order oracle with sub-exponential tail noise (i.e., light-tailed) and focus mostly on first-order stationarity, our analysis accommodates biased (also referred to as irreducible in the literature) and heavy-tailed noise in the zeroth-order oracle, and significantly extends the analysis to second-order stationarity. We show that under heavy-tailed noise conditions, our SSQP method achieves the same high-probability first-order iteration complexity bounds as in the light-tailed noise setting, while further exhibiting promising second-order iteration complexity bounds. Specifically, the method identifies a first-order $ε$-stationary point in $\mathcal{O}(ε^{-2})$ iterations and a second-order $ε$-stationary point in $\mathcal{O}(ε^{-3})$ iterations with high probability, provided that $ε$ is lower bounded by a constant determined by the bias magnitude (i.e., the irreducible noise) in the estimation. We validate our theoretical findings and evaluate practical performance of our method on CUTEst benchmark test set.


翻译:本文考虑具有随机目标函数和确定性等式约束的非线性优化问题。我们提出一种信赖域随机序列二次规划方法,并建立了该方法识别一阶和二阶ε-驻点的高概率迭代复杂度界。在算法中,我们假设无法直接获取精确的目标值、梯度和海森矩阵,但可通过零阶、一阶和二阶概率预言机进行估计。与现有依赖于具有次指数尾部噪声(即轻尾)且主要关注一阶驻点性的SSQP方法复杂度研究相比,我们的分析可容纳零阶预言机中的有偏(文献中也称为不可约噪声)和重尾噪声,并将分析显著扩展至二阶驻点性。我们证明在重尾噪声条件下,所提出的SSQP方法实现了与轻尾噪声设定相同的高概率一阶迭代复杂度界,同时进一步展现出具有前景的二阶迭代复杂度界。具体而言,该方法能以高概率在O(ε⁻²)次迭代内识别一阶ε-驻点,在O(ε⁻³)次迭代内识别二阶ε-驻点,条件为ε被估计中偏差幅度(即不可约噪声)决定的常数所下界约束。我们在CUTEst基准测试集上验证了理论结果并评估了方法的实际性能。

0
下载
关闭预览

相关内容

【新书】随机图与复杂网络,508页pdf
专知会员服务
66+阅读 · 2024年6月9日
专知会员服务
44+阅读 · 2020年9月25日
【干货书】凸随机优化,320页pdf
专知
12+阅读 · 2022年9月16日
一文读懂线性回归、岭回归和Lasso回归
CSDN
34+阅读 · 2019年10月13日
概率图模型体系:HMM、MEMM、CRF
机器学习研究会
30+阅读 · 2018年2月10日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员