Bridging Discrete Planning and Continuous Execution for Redundant Robot - 专知论文

会员服务 ·

0

Bridging Discrete Planning and Continuous Execution for Redundant Robot

翻译：面向冗余机器人的离散规划与连续执行桥接框架

Teng Yan,Yue Yu,Yihan Liu,Bingzhuo Zhong

from arxiv, 8 pages, 3 figures. Submitted to IFAC World Congress 2026

Voxel-grid reinforcement learning is widely adopted for path planning in redundant manipulators due to its simplicity and reproducibility. However, direct execution through point-wise numerical inverse kinematics on 7-DoF arms often yields step-size jitter, abrupt joint transitions, and instability near singular configurations. This work proposes a bridging framework between discrete planning and continuous execution without modifying the discrete planner itself. On the planning side, step-normalized 26-neighbor Cartesian actions and a geometric tie-breaking mechanism are introduced to suppress unnecessary turns and eliminate step-size oscillations. On the execution side, a task-priority damped least-squares (TP-DLS) inverse kinematics layer is implemented. This layer treats end-effector position as a primary task, while posture and joint centering are handled as subordinate tasks projected into the null space, combined with trust-region clipping and joint velocity constraints. On a 7-DoF manipulator in random sparse, medium, and dense environments, this bridge raises planning success in dense scenes from about 0.58 to 1.00, shortens representative path length from roughly 1.53 m to 1.10 m, and while keeping end-effector error below 1 mm, reduces peak joint accelerations by over an order of magnitude, substantially improving the continuous execution quality of voxel-based RL paths on redundant manipulators.

翻译：体素网格强化学习因其简洁性与可重复性，被广泛用于冗余机械臂的路径规划。然而，通过七自由度手臂的逐点数值逆运动学直接执行，常导致步长抖动、关节突变及靠近奇异位形时的失稳。本文提出一种桥接框架，在不修改离散规划器本体的前提下，实现离散规划与连续执行的有效衔接。在规划侧，引入步长归一化的26邻域笛卡尔动作与几何破链机制，以抑制非必要转向、消除步长振荡；在执行侧，构建任务优先级阻尼最小二乘逆运动学层：将末端位姿视为主任务，姿态与关节居中作为投影至零空间的从属任务，并融合信赖域剪裁与关节速度约束。在随机稀疏、中等及稠密环境下的七自由度机械臂实验中，该桥接框架将稠密场景的规划成功率从约0.58提升至1.00，典型路径长度由约1.53米缩短至1.10米，且在保持末端误差低于1毫米的同时，将峰值关节加速度降低一个数量级以上，显著提升了体素强化学习路径在冗余机械臂上的连续执行质量。

0

相关内容

《面向大规模决策的分布式优化架构》247页

《面向大规模决策的分布式优化架构》247页

专知会员服务

26+阅读 · 5月12日

《一种用于GNSS拒止环境中执行情报、监视与侦察任务集的无人机设计任务工程框架》

《一种用于GNSS拒止环境中执行情报、监视与侦察任务集的无人机设计任务工程框架》

专知会员服务

22+阅读 · 3月3日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

28+阅读 · 2025年11月17日

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

专知会员服务

56+阅读 · 2025年6月10日

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

专知会员服务

22+阅读 · 2025年5月30日

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

专知会员服务

16+阅读 · 2025年4月19日

面向空间机器人辅助操作的任务规划方法研究

面向空间机器人辅助操作的任务规划方法研究

专知会员服务

22+阅读 · 2025年2月10日

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

专知会员服务

39+阅读 · 2024年3月24日

有人/ 无人集群任务规划系统集成框架

有人/ 无人集群任务规划系统集成框架

专知会员服务

182+阅读 · 2023年6月14日

【MLA 2019】机器学习中分布式鲁棒优化的一阶算法框架( Towards a First-Order Algorithmic Framework for Distributionally Robust Optimization in Machine Learning),香港中文大学苏文藻

【MLA 2019】机器学习中分布式鲁棒优化的一阶算法框架( Towards a First-Order Algorithmic Framework for Distributionally Robust Optimization in Machine Learning),香港中文大学苏文藻

专知会员服务

28+阅读 · 2019年11月6日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

《“边缘计算+”技术白皮书》，82页pdf

《“边缘计算+”技术白皮书》，82页pdf

专知

11+阅读 · 2022年8月28日

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

专知

13+阅读 · 2022年5月2日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

初学者系列：Attentional Factorization Machines（AFM）详解

初学者系列：Attentional Factorization Machines（AFM）详解

专知

82+阅读 · 2019年9月16日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

19+阅读 · 2019年7月5日

这个项目火了！各种深度学习架构，模型和技巧的集合

这个项目火了！各种深度学习架构，模型和技巧的集合

大数据技术

14+阅读 · 2019年6月13日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

基于多策略融合粒子群算法的点焊机器人路径多目标优化

国家自然科学基金

1+阅读 · 2017年12月31日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于冗余结构的自适应容错并联机器人设计理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络化遥操作多机器人系统时滞相关控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非共面放射治疗中的多机器人协作无碰撞轨迹规划与优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

多旋翼空中操作机器人的一体化设计及动态运动规划

国家自然科学基金

1+阅读 · 2015年12月31日

长寿命空间机械臂在轨故障诊断、容错和预测策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

Language Models Refine Mechanical Linkage Designs Through Symbolic Reflection and Modular Optimisation

Arxiv

0+阅读 · 4月30日

Bi-Level Optimization for Contact and Motion Planning in Rope-Assisted Legged Robots

Arxiv

0+阅读 · 4月29日

Bridging Discrete Planning and Continuous Execution for Redundant Robot

Arxiv

0+阅读 · 4月29日

Learning-Based Dynamics Modeling and Robust Control for Tendon-Driven Continuum Robots

Arxiv

0+阅读 · 4月28日

VADF: Vision-Adaptive Diffusion Policy Framework for Efficient Robotic Manipulation

Arxiv

0+阅读 · 4月17日

A Co-Design Framework for High-Performance Jumping of a Five-Bar Monoped with Actuator Optimization

Arxiv

0+阅读 · 4月7日

Closed-Loop Verbal Reinforcement Learning for Task-Level Robotic Planning

Arxiv

0+阅读 · 3月23日

Task-Specified Compliance Bounds for Humanoids via Lipschitz-Constrained Policies

Arxiv

0+阅读 · 3月20日

RoboPARA: Dual-Arm Robot Planning with Parallel Allocation and Recomposition Across Tasks

Arxiv

0+阅读 · 3月2日

Bridging Perception and Planning: Towards End-to-End Planning for Signal Temporal Logic Tasks

Arxiv

0+阅读 · 3月1日

VIP会员

文章信息

相关主题

最新内容

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

7+阅读 · 今天5:53

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

3+阅读 · 今天5:45

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

2+阅读 · 今天5:23

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

1+阅读 · 今天5:11

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

6+阅读 · 今天5:04

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

4+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

8+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

8+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

9+阅读 · 7月26日

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

专知会员服务

8+阅读 · 7月26日

《反无人机交战场景下的战斗归零研究》

《反无人机交战场景下的战斗归零研究》

专知会员服务

7+阅读 · 7月26日

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

专知会员服务

4+阅读 · 7月26日

博士论文 | 用代码结构感知方法推进代码大模型

博士论文 | 用代码结构感知方法推进代码大模型

专知会员服务

5+阅读 · 7月25日

综述 | 遥感多模态大模型：领域专用还是通用模型？

综述 | 遥感多模态大模型：领域专用还是通用模型？

专知会员服务

5+阅读 · 7月25日

《面向指挥控制训练与实时北约兼容数据分发的战术模拟器》

《面向指挥控制训练与实时北约兼容数据分发的战术模拟器》

专知会员服务

5+阅读 · 7月25日

相关VIP内容

《面向大规模决策的分布式优化架构》247页

《面向大规模决策的分布式优化架构》247页

专知会员服务

26+阅读 · 5月12日

《一种用于GNSS拒止环境中执行情报、监视与侦察任务集的无人机设计任务工程框架》

《一种用于GNSS拒止环境中执行情报、监视与侦察任务集的无人机设计任务工程框架》

专知会员服务

22+阅读 · 3月3日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

28+阅读 · 2025年11月17日

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

《基于人工智能的动态任务分配策略在多智能体系统中的有效控制》

专知会员服务

56+阅读 · 2025年6月10日

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

专知会员服务

22+阅读 · 2025年5月30日

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

专知会员服务

16+阅读 · 2025年4月19日

面向空间机器人辅助操作的任务规划方法研究

面向空间机器人辅助操作的任务规划方法研究

专知会员服务

22+阅读 · 2025年2月10日

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

《多智能体系统的迭代规划：在能源感知无人机-无人地面车辆合作任务地点分配中的应用》

专知会员服务

39+阅读 · 2024年3月24日

有人/ 无人集群任务规划系统集成框架

有人/ 无人集群任务规划系统集成框架

专知会员服务

182+阅读 · 2023年6月14日

【MLA 2019】机器学习中分布式鲁棒优化的一阶算法框架( Towards a First-Order Algorithmic Framework for Distributionally Robust Optimization in Machine Learning),香港中文大学苏文藻

【MLA 2019】机器学习中分布式鲁棒优化的一阶算法框架( Towards a First-Order Algorithmic Framework for Distributionally Robust Optimization in Machine Learning),香港中文大学苏文藻

专知会员服务

28+阅读 · 2019年11月6日

热门VIP内容

开通专知VIP会员享更多权益服务

美空军新型反无人机部队初探

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

相关资讯

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

《“边缘计算+”技术白皮书》，82页pdf

《“边缘计算+”技术白皮书》，82页pdf

专知

11+阅读 · 2022年8月28日

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

专知

13+阅读 · 2022年5月2日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

初学者系列：Attentional Factorization Machines（AFM）详解

初学者系列：Attentional Factorization Machines（AFM）详解

专知

82+阅读 · 2019年9月16日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

19+阅读 · 2019年7月5日

这个项目火了！各种深度学习架构，模型和技巧的集合

这个项目火了！各种深度学习架构，模型和技巧的集合

大数据技术

14+阅读 · 2019年6月13日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

相关论文

Language Models Refine Mechanical Linkage Designs Through Symbolic Reflection and Modular Optimisation

Arxiv

0+阅读 · 4月30日

Bi-Level Optimization for Contact and Motion Planning in Rope-Assisted Legged Robots

Arxiv

0+阅读 · 4月29日

Bridging Discrete Planning and Continuous Execution for Redundant Robot

Arxiv

0+阅读 · 4月29日

Learning-Based Dynamics Modeling and Robust Control for Tendon-Driven Continuum Robots

Arxiv

0+阅读 · 4月28日

VADF: Vision-Adaptive Diffusion Policy Framework for Efficient Robotic Manipulation

Arxiv

0+阅读 · 4月17日

A Co-Design Framework for High-Performance Jumping of a Five-Bar Monoped with Actuator Optimization

Arxiv

0+阅读 · 4月7日

Closed-Loop Verbal Reinforcement Learning for Task-Level Robotic Planning

Arxiv

0+阅读 · 3月23日

Task-Specified Compliance Bounds for Humanoids via Lipschitz-Constrained Policies

Arxiv

0+阅读 · 3月20日

RoboPARA: Dual-Arm Robot Planning with Parallel Allocation and Recomposition Across Tasks

Arxiv

0+阅读 · 3月2日

Bridging Perception and Planning: Towards End-to-End Planning for Signal Temporal Logic Tasks

Arxiv

0+阅读 · 3月1日

相关基金

基于多策略融合粒子群算法的点焊机器人路径多目标优化

国家自然科学基金

1+阅读 · 2017年12月31日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于冗余结构的自适应容错并联机器人设计理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络化遥操作多机器人系统时滞相关控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非共面放射治疗中的多机器人协作无碰撞轨迹规划与优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

多旋翼空中操作机器人的一体化设计及动态运动规划

国家自然科学基金

1+阅读 · 2015年12月31日

长寿命空间机械臂在轨故障诊断、容错和预测策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员