From Kinematics to Dynamics: Learning to Refine Hybrid Plans for Physically Feasible Execution - 专知论文

会员服务 ·

0

混合 · 可行 · 序列 · 约束 · 包含 ·

From Kinematics to Dynamics: Learning to Refine Hybrid Plans for Physically Feasible Execution

翻译：从运动学到动力学：学习优化混合规划以实现物理可行执行

Lidor Erez,Shahaf S. Shperberg,Ayal Taitler

In many robotic tasks, agents must traverse a sequence of spatial regions to complete a mission. Such problems are inherently mixed discrete-continuous: a high-level action sequence and a physically feasible continuous trajectory. The resulting trajectory and action sequence must also satisfy problem constraints such as deadlines, time windows, and velocity or acceleration limits. While hybrid temporal planners attempt to address this challenge, they typically model motion using linear (first-order) dynamics, which cannot guarantee that the resulting plan respects the robot's true physical constraints. Consequently, even when the high-level action sequence is fixed, producing a dynamically feasible trajectory becomes a bi-level optimization problem. We address this problem via reinforcement learning in continuous space. We define a Markov Decision Process that explicitly incorporates analytical second-order constraints and use it to refine first-order plans generated by a hybrid planner. Our results show that this approach can reliably recover physical feasibility and effectively bridge the gap between a planner's initial first-order trajectory and the dynamics required for real execution.

翻译：在许多机器人任务中，智能体必须遍历一系列空间区域以完成使命。这类问题本质上是混合的离散-连续问题：包含高层动作序列与物理可行的连续轨迹。生成的轨迹与动作序列还需满足问题约束，如截止时间、时间窗口、速度或加速度限制。尽管混合时间规划器试图解决这一挑战，但它们通常采用线性（一阶）动力学对运动建模，无法保证所生成的规划符合机器人的真实物理约束。因此，即使确定了高层动作序列，生成动态可行的轨迹仍成为一个双层优化问题。我们通过连续空间中的强化学习来解决该问题。我们定义了一个显式包含解析二阶约束的马尔可夫决策过程，并用于优化混合规划器生成的初始一阶规划。实验结果表明，该方法能够可靠地恢复物理可行性，有效弥合规划器初始一阶轨迹与实际执行所需动力学之间的差距。

0

相关内容

《基于生成方法的轨迹建模及其在调度、规划与多智能体系统中的应用》200页

《基于生成方法的轨迹建模及其在调度、规划与多智能体系统中的应用》200页

专知会员服务

28+阅读 · 1月7日

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

专知会员服务

16+阅读 · 2025年4月19日

【CMU博士论文】交错离散搜索与连续优化用于运动规划中的动力学运动规划

【CMU博士论文】交错离散搜索与连续优化用于运动规划中的动力学运动规划

专知会员服务

28+阅读 · 2024年11月3日

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

专知会员服务

39+阅读 · 2024年3月24日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知会员服务

147+阅读 · 2022年11月14日

【多机器人任务分配】《通过学习的子团队性能对异构多机器人路由问题进行分层规划》美国陆军、MIT等2022最新论文

【多机器人任务分配】《通过学习的子团队性能对异构多机器人路由问题进行分层规划》美国陆军、MIT等2022最新论文

专知会员服务

80+阅读 · 2022年11月2日

【CMU 博士论文】《提高多目标概率规划的透明度和可理解性》2022最新论文

【CMU 博士论文】《提高多目标概率规划的透明度和可理解性》2022最新论文

专知会员服务

48+阅读 · 2022年9月5日

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

专知会员服务

167+阅读 · 2022年4月10日

【谷歌大脑新论文】利用可微摄动优化器进行学习，Learning with Differentiable Perturbed Optimizers

【谷歌大脑新论文】利用可微摄动优化器进行学习，Learning with Differentiable Perturbed Optimizers

专知会员服务

29+阅读 · 2020年2月22日

【IJCAI 2019】基于时间的规划:理论与实践（Timeline-based Planning: Theory and Practice），Nicola Gigante，Angelo Montanari

【IJCAI 2019】基于时间的规划:理论与实践（Timeline-based Planning: Theory and Practice），Nicola Gigante，Angelo Montanari

专知会员服务

10+阅读 · 2019年8月10日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

专知

12+阅读 · 2022年4月10日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

干货｜浅谈强化学习的方法及学习路线

干货｜浅谈强化学习的方法及学习路线

机器学习算法与Python学习

16+阅读 · 2018年3月28日

融合认知和动力学特性的轮毂电机电动汽车轨迹规划方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

混杂动力系统的回复性及相关问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于形态改变的多体空间系统动力学建模、运动规划与最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

云环境中支持混合并行模式的科学工作流的执行优化

国家自然科学基金

0+阅读 · 2014年12月31日

电动汽车与可再生能源的时空耦合特性及能量调度和容量配置的协同进化方法

国家自然科学基金

1+阅读 · 2014年12月31日

Moving Out: Physically-grounded Human-AI Collaboration

Arxiv

0+阅读 · 6月15日

Learning to Share: Selective Memory for Efficient Parallel Agentic Systems

Arxiv

0+阅读 · 6月14日

Closing the Motion Execution Gap: From Semantic Motion Task Constraints to Kinematic Control

Arxiv

0+阅读 · 6月10日

Uncertainty-Aware Motion Planning for Autonomous Driving in Mixed Traffic Environment

Arxiv

0+阅读 · 6月8日

Integrated Hierarchical Decision-Making in Inverse Kinematic Planning and Control

Arxiv

0+阅读 · 6月6日

ScheduleStream: Temporal Planning with Samplers for GPU-Accelerated Multi-Arm Task and Motion Planning & Scheduling

Arxiv

0+阅读 · 5月28日

What Drives Success in Physical Planning with Joint-Embedding Predictive World Models?

Arxiv

0+阅读 · 5月18日

Learning Bilevel Policies over Symbolic World Models for Long-Horizon Planning

Arxiv

0+阅读 · 5月15日

Melding LLM and temporal logic for reliable human-swarm collaboration in complex scenarios

Arxiv

0+阅读 · 5月8日

Feasibility-aware Hybrid Control for Motion Planning under Signal Temporal Logics

Arxiv

0+阅读 · 5月5日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

《基于生成方法的轨迹建模及其在调度、规划与多智能体系统中的应用》200页

《基于生成方法的轨迹建模及其在调度、规划与多智能体系统中的应用》200页

专知会员服务

28+阅读 · 1月7日

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

专知会员服务

16+阅读 · 2025年4月19日

【CMU博士论文】交错离散搜索与连续优化用于运动规划中的动力学运动规划

【CMU博士论文】交错离散搜索与连续优化用于运动规划中的动力学运动规划

专知会员服务

28+阅读 · 2024年11月3日

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

专知会员服务

39+阅读 · 2024年3月24日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知会员服务

147+阅读 · 2022年11月14日

【多机器人任务分配】《通过学习的子团队性能对异构多机器人路由问题进行分层规划》美国陆军、MIT等2022最新论文

【多机器人任务分配】《通过学习的子团队性能对异构多机器人路由问题进行分层规划》美国陆军、MIT等2022最新论文

专知会员服务

80+阅读 · 2022年11月2日

【CMU 博士论文】《提高多目标概率规划的透明度和可理解性》2022最新论文

【CMU 博士论文】《提高多目标概率规划的透明度和可理解性》2022最新论文

专知会员服务

48+阅读 · 2022年9月5日

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

专知会员服务

167+阅读 · 2022年4月10日

【谷歌大脑新论文】利用可微摄动优化器进行学习，Learning with Differentiable Perturbed Optimizers

【谷歌大脑新论文】利用可微摄动优化器进行学习，Learning with Differentiable Perturbed Optimizers

专知会员服务

29+阅读 · 2020年2月22日

【IJCAI 2019】基于时间的规划:理论与实践（Timeline-based Planning: Theory and Practice），Nicola Gigante，Angelo Montanari

【IJCAI 2019】基于时间的规划:理论与实践（Timeline-based Planning: Theory and Practice），Nicola Gigante，Angelo Montanari

专知会员服务

10+阅读 · 2019年8月10日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

专知

12+阅读 · 2022年4月10日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

干货｜浅谈强化学习的方法及学习路线

干货｜浅谈强化学习的方法及学习路线

机器学习算法与Python学习

16+阅读 · 2018年3月28日

相关论文

Moving Out: Physically-grounded Human-AI Collaboration

Arxiv

0+阅读 · 6月15日

Learning to Share: Selective Memory for Efficient Parallel Agentic Systems

Arxiv

0+阅读 · 6月14日

Closing the Motion Execution Gap: From Semantic Motion Task Constraints to Kinematic Control

Arxiv

0+阅读 · 6月10日

Uncertainty-Aware Motion Planning for Autonomous Driving in Mixed Traffic Environment

Arxiv

0+阅读 · 6月8日

Integrated Hierarchical Decision-Making in Inverse Kinematic Planning and Control

Arxiv

0+阅读 · 6月6日

ScheduleStream: Temporal Planning with Samplers for GPU-Accelerated Multi-Arm Task and Motion Planning & Scheduling

Arxiv

0+阅读 · 5月28日

What Drives Success in Physical Planning with Joint-Embedding Predictive World Models?

Arxiv

0+阅读 · 5月18日

Learning Bilevel Policies over Symbolic World Models for Long-Horizon Planning

Arxiv

0+阅读 · 5月15日

Melding LLM and temporal logic for reliable human-swarm collaboration in complex scenarios

Arxiv

0+阅读 · 5月8日

Feasibility-aware Hybrid Control for Motion Planning under Signal Temporal Logics

Arxiv

0+阅读 · 5月5日

相关基金

融合认知和动力学特性的轮毂电机电动汽车轨迹规划方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

混杂动力系统的回复性及相关问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于形态改变的多体空间系统动力学建模、运动规划与最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

云环境中支持混合并行模式的科学工作流的执行优化

国家自然科学基金

0+阅读 · 2014年12月31日

电动汽车与可再生能源的时空耦合特性及能量调度和容量配置的协同进化方法

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员