SHaRe-RL: Structured, Interactive Reinforcement Learning for Contact-Rich Industrial Assembly Tasks - 专知论文

会员服务 ·

0

结构 · 结构化 · 交互 · 强化学习 · 知识 ·

SHaRe-RL: Structured, Interactive Reinforcement Learning for Contact-Rich Industrial Assembly Tasks

翻译：SHaRe-RL：面向高接触性工业装配任务的结构化交互式强化学习框架

Jannick Stranghöner,Philipp Hartmann,Marco Braun,Sebastian Wrede,Klaus Neumann

from arxiv, 8 pages, 8 figures, accepted to IEEE International Conference on Robotics and Automation (ICRA) 2026

High-mix low-volume (HMLV) industrial assembly, common in small and medium-sized enterprises (SMEs), requires the same precision, safety, and reliability as high-volume automation while remaining flexible to product variation and environmental uncertainty. Current robotic systems struggle to meet these demands. Manual programming is brittle and costly to adapt, while learning-based methods suffer from poor sample efficiency and unsafe exploration in contact-rich tasks. To address this, we present SHaRe-RL, a reinforcement learning framework that leverages multiple sources of prior knowledge. By (i) structuring skills into manipulation primitives, (ii) incorporating human demonstrations and online corrections, and (iii) bounding interaction forces with per-axis compliance, SHaRe-RL enables efficient and safe online learning for long-horizon, contact-rich industrial assembly tasks. Experiments on the insertion of industrial Harting connector modules with 0.2-0.4 mm clearance demonstrate that SHaRe-RL achieves reliable performance within practical time budgets. Our results show that process expertise, without requiring robotics or RL knowledge, can meaningfully contribute to learning, enabling safer, more robust, and more economically viable deployment of RL for industrial assembly.

翻译：高混合低批量（HMLV）工业装配在中小型企业中十分常见，它既需要达到大批量自动化所要求的高精度、安全性与可靠性，又必须保持对产品差异和环境不确定性的灵活适应能力。现有机器人系统难以同时满足这些要求。手动编程方法适应性差且调整成本高昂，而基于学习的方法则在样本效率低下以及高接触性任务中的不安全探索方面存在不足。为此，我们提出了SHaRe-RL，一个能够利用多种先验知识的强化学习框架。通过（i）将技能结构化为操作基元，（ii）整合人类示范与在线修正，以及（iii）利用轴向顺应性约束交互力，SHaRe-RL能够为长时程、高接触性的工业装配任务实现高效安全的在线学习。在间隙为0.2-0.4毫米的工业Harting连接器模块插入任务上的实验表明，SHaRe-RL能够在实际时间预算内实现可靠的性能。我们的研究结果表明，无需机器人学或强化学习专业知识，仅凭工艺经验便能对学习过程做出实质性贡献，从而推动强化学习在工业装配中实现更安全、更鲁棒且更具经济可行性的部署。

0

相关内容

【NTU博士论文】机器人装配中的强化学习，136页pdf

【NTU博士论文】机器人装配中的强化学习，136页pdf

专知会员服务

32+阅读 · 2024年8月6日

《基于技能的机器人系统学习：将规划和知识表示与强化学习相结合》博士论文

《基于技能的机器人系统学习：将规划和知识表示与强化学习相结合》博士论文

专知会员服务

36+阅读 · 2024年7月7日

《协作机器人的学习行为树》最新146页博士论文

《协作机器人的学习行为树》最新146页博士论文

专知会员服务

50+阅读 · 2024年2月7日

【慕尼黑大学博士论文】可解释自动化机器学习，200页pdf

【慕尼黑大学博士论文】可解释自动化机器学习，200页pdf

专知会员服务

41+阅读 · 2023年12月17日

《人机交互中机器学习的透明通信》论文

《人机交互中机器学习的透明通信》论文

专知会员服务

35+阅读 · 2023年3月12日

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

专知会员服务

106+阅读 · 2022年11月2日

《人类与自动机器学习系统交互的角色和模式：综述与展望》98页长综述论文（2022），悉尼科技大学

《人类与自动机器学习系统交互的角色和模式：综述与展望》98页长综述论文（2022），悉尼科技大学

专知会员服务

65+阅读 · 2022年10月28日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知会员服务

44+阅读 · 2022年10月15日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知会员服务

121+阅读 · 2022年2月16日

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

专知会员服务

104+阅读 · 2019年10月22日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

【开放书】MLOps导论：构建企业机器学习生产系统，185页pdf

【开放书】MLOps导论：构建企业机器学习生产系统，185页pdf

专知

51+阅读 · 2021年4月8日

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

PaperWeekly

24+阅读 · 2019年11月6日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

产业智能官

35+阅读 · 2019年4月30日

基于强化学习的量化交易框架

基于强化学习的量化交易框架

机器学习研究会

30+阅读 · 2018年2月22日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

具有多处理机任务约束的混合作业车间调度建模与嵌入式仿真

国家自然科学基金

1+阅读 · 2015年12月31日

分布式工业自动化系统可重构混合计算模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

预压装配式再生混凝土框架抗震性能及多性能目标协同优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于无线传感网的工业人机交互网络移动接入与动态路由机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能机器人柔性装配系统自主控制的主动视觉感知技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

大功率柔顺驱动器的设计方法及能量优化和交互安全机理研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

工业过程动态数据的多模型在线重构研究

国家自然科学基金

1+阅读 · 2015年12月31日

Learning while Deploying: Fleet-Scale Reinforcement Learning for Generalist Robot Policies

Arxiv

0+阅读 · 5月1日

OmniVLA-RL: A Vision-Language-Action Model with Spatial Understanding and Online RL

Arxiv

0+阅读 · 4月24日

MOMO: A framework for seamless physical, verbal, and graphical robot skill learning and adaptation

Arxiv

0+阅读 · 4月23日

MOMO: A framework for seamless physical, verbal, and graphical robot skill learning and adaptation

Arxiv

0+阅读 · 4月22日

Learning-Based Strategy for Composite Robot Assembly Skill Adaptation

Arxiv

0+阅读 · 4月8日

Hybrid Framework for Robotic Manipulation: Integrating Reinforcement Learning and Large Language Models

Arxiv

0+阅读 · 3月31日

ATG-MoE: Autoregressive trajectory generation with mixture-of-experts for assembly skill learning

Arxiv

0+阅读 · 3月19日

LinkML: An Open Data Modeling Framework

Arxiv

0+阅读 · 3月2日

Flow-Factory: A Unified Framework for Reinforcement Learning in Flow-Matching Models

Arxiv

0+阅读 · 3月2日

Anticipate, Adapt, Act: A Hybrid Framework for Task Planning

Arxiv

0+阅读 · 2月23日

VIP会员

文章信息

相关主题

最新内容

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

3+阅读 · 今天14:49

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

1+阅读 · 今天14:25

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

2+阅读 · 今天13:57

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

2+阅读 · 今天13:27

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

11+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

10+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

8+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

6+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

8+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

9+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

8+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

10+阅读 · 7月20日

相关VIP内容

【NTU博士论文】机器人装配中的强化学习，136页pdf

【NTU博士论文】机器人装配中的强化学习，136页pdf

专知会员服务

32+阅读 · 2024年8月6日

《基于技能的机器人系统学习：将规划和知识表示与强化学习相结合》博士论文

《基于技能的机器人系统学习：将规划和知识表示与强化学习相结合》博士论文

专知会员服务

36+阅读 · 2024年7月7日

《协作机器人的学习行为树》最新146页博士论文

《协作机器人的学习行为树》最新146页博士论文

专知会员服务

50+阅读 · 2024年2月7日

【慕尼黑大学博士论文】可解释自动化机器学习，200页pdf

【慕尼黑大学博士论文】可解释自动化机器学习，200页pdf

专知会员服务

41+阅读 · 2023年12月17日

《人机交互中机器学习的透明通信》论文

《人机交互中机器学习的透明通信》论文

专知会员服务

35+阅读 · 2023年3月12日

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

专知会员服务

106+阅读 · 2022年11月2日

《人类与自动机器学习系统交互的角色和模式：综述与展望》98页长综述论文（2022），悉尼科技大学

《人类与自动机器学习系统交互的角色和模式：综述与展望》98页长综述论文（2022），悉尼科技大学

专知会员服务

65+阅读 · 2022年10月28日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知会员服务

44+阅读 · 2022年10月15日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知会员服务

121+阅读 · 2022年2月16日

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

专知会员服务

104+阅读 · 2019年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

对抗环境下超视距目标打击的情报支援

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

【开放书】MLOps导论：构建企业机器学习生产系统，185页pdf

【开放书】MLOps导论：构建企业机器学习生产系统，185页pdf

专知

51+阅读 · 2021年4月8日

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

PaperWeekly

24+阅读 · 2019年11月6日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

产业智能官

35+阅读 · 2019年4月30日

基于强化学习的量化交易框架

基于强化学习的量化交易框架

机器学习研究会

30+阅读 · 2018年2月22日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

相关论文

Learning while Deploying: Fleet-Scale Reinforcement Learning for Generalist Robot Policies

Arxiv

0+阅读 · 5月1日

OmniVLA-RL: A Vision-Language-Action Model with Spatial Understanding and Online RL

Arxiv

0+阅读 · 4月24日

MOMO: A framework for seamless physical, verbal, and graphical robot skill learning and adaptation

Arxiv

0+阅读 · 4月23日

MOMO: A framework for seamless physical, verbal, and graphical robot skill learning and adaptation

Arxiv

0+阅读 · 4月22日

Learning-Based Strategy for Composite Robot Assembly Skill Adaptation

Arxiv

0+阅读 · 4月8日

Hybrid Framework for Robotic Manipulation: Integrating Reinforcement Learning and Large Language Models

Arxiv

0+阅读 · 3月31日

ATG-MoE: Autoregressive trajectory generation with mixture-of-experts for assembly skill learning

Arxiv

0+阅读 · 3月19日

LinkML: An Open Data Modeling Framework

Arxiv

0+阅读 · 3月2日

Flow-Factory: A Unified Framework for Reinforcement Learning in Flow-Matching Models

Arxiv

0+阅读 · 3月2日

Anticipate, Adapt, Act: A Hybrid Framework for Task Planning

Arxiv

0+阅读 · 2月23日

相关基金

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

具有多处理机任务约束的混合作业车间调度建模与嵌入式仿真

国家自然科学基金

1+阅读 · 2015年12月31日

分布式工业自动化系统可重构混合计算模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

预压装配式再生混凝土框架抗震性能及多性能目标协同优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于无线传感网的工业人机交互网络移动接入与动态路由机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能机器人柔性装配系统自主控制的主动视觉感知技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

大功率柔顺驱动器的设计方法及能量优化和交互安全机理研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

工业过程动态数据的多模型在线重构研究

国家自然科学基金

1+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员