Inverse Optimal Control (IOC) aims to recover the cost function that explains observed trajectories as solutions of an optimal control problem. Classical IOC formulations rely on bilevel optimization, which repeatedly solves a nested optimal control problem and quickly becomes computationally prohibitive for realistic systems. Recent projection-based approaches offer a promising alternative but suffer from numerical instability when solved with gradient-based methods due to violations of standard constraint qualifications. In this paper, we show that these difficulties stem from the geometric structure of the IOC feasible set. We demonstrate that the set of trajectories satisfying the optimality conditions naturally forms a manifold and reformulate IOC as an optimization problem on this manifold. Based on this insight, we propose a Riemannian Inverse Optimal Control (RIOC) method that projects observed trajectories onto the manifold of optimal solutions while preserving feasibility by construction. Experiments on real human arm trajectories show that the proposed method achieves comparable or better reconstruction accuracy than classical bilevel IOC while reducing computation time by about a factor of four. These results highlight the potential of geometric optimization methods to improve the scalability and reliability of IOC for robotics and human motion analysis.


翻译:逆最优控制(IOC)旨在恢复能够解释观测轨迹作为最优控制问题解的成本函数。经典IOC公式依赖于双层优化,该方法反复求解嵌套的最优控制问题,对于实际系统而言很快就会变得计算上不可行。近年来基于投影的方法提供了一种有前景的替代方案,但在使用基于梯度的方法求解时,由于违反标准约束规范,会遭受数值不稳定性。在本文中,我们表明这些困难源于IOC可行集的几何结构。我们证明满足最优性条件的轨迹集自然构成一个流形,并将IOC重新表述为该流形上的优化问题。基于这一见解,我们提出了一种黎曼逆最优控制(RIOC)方法,该方法将观测轨迹投影到最优解流形上,同时通过构造保持可行性。在真实人类手臂轨迹上的实验表明,所提出的方法在重建精度上与经典双层IOC相当或更优,同时计算时间减少了约四倍。这些结果凸显了几何优化方法在提升IOC用于机器人学和人体运动分析的可扩展性和可靠性方面的潜力。

0
下载
关闭预览

相关内容

基于强化学习的最优控制指令模仿生成方法
专知会员服务
35+阅读 · 2023年12月2日
逆向强化学习研究综述*
专知会员服务
59+阅读 · 2023年10月13日
「逆向强化学习」最新研究综述
专知会员服务
50+阅读 · 2022年12月19日
逆优化: 理论与应用
专知会员服务
38+阅读 · 2021年9月13日
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
41+阅读 · 2020年3月9日
机器学习中的最优化算法总结
人工智能前沿讲习班
22+阅读 · 2019年3月22日
2018年深度学习优化算法最新综述
计算机视觉战队
10+阅读 · 2018年12月11日
简述多种降维算法
算法与数学之美
11+阅读 · 2018年9月23日
图像降噪算法介绍及实现汇总
极市平台
26+阅读 · 2018年1月3日
绝对干货 | 随机梯度下降算法综述
菜鸟的机器学习
15+阅读 · 2017年10月30日
精品公开课 | 随机梯度下降算法综述
七月在线实验室
13+阅读 · 2017年7月11日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
基于强化学习的最优控制指令模仿生成方法
专知会员服务
35+阅读 · 2023年12月2日
逆向强化学习研究综述*
专知会员服务
59+阅读 · 2023年10月13日
「逆向强化学习」最新研究综述
专知会员服务
50+阅读 · 2022年12月19日
逆优化: 理论与应用
专知会员服务
38+阅读 · 2021年9月13日
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
41+阅读 · 2020年3月9日
相关资讯
机器学习中的最优化算法总结
人工智能前沿讲习班
22+阅读 · 2019年3月22日
2018年深度学习优化算法最新综述
计算机视觉战队
10+阅读 · 2018年12月11日
简述多种降维算法
算法与数学之美
11+阅读 · 2018年9月23日
图像降噪算法介绍及实现汇总
极市平台
26+阅读 · 2018年1月3日
绝对干货 | 随机梯度下降算法综述
菜鸟的机器学习
15+阅读 · 2017年10月30日
精品公开课 | 随机梯度下降算法综述
七月在线实验室
13+阅读 · 2017年7月11日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员