Robots that Collaborate: Sequential Asymmetric Imitation for Learning Coupled Robot Policies - 专知论文

会员服务 ·

0

机器人 · 耦合 · 协作 · 操作 · 序列 ·

Robots that Collaborate: Sequential Asymmetric Imitation for Learning Coupled Robot Policies

翻译：机器人协作：面向学习耦合机器人策略的序列非对称模仿

Yincong Chen,Ranpeng Qiu,Zihao Li,Yanan Zhou,Guoqiang Ren,Weiming Zhi

Collaborative mobile manipulation requires robots to coordinate with a partially observed partner while physically interacting through shared objects. This is difficult because failures often arise not from poor local skills, but from mistimed waiting, yielding, pulling, releasing, or repositioning. We study this problem with two bimanual mobile manipulators coupled through rigid and deformable objects. We propose Sequential Asymmetric Imitation (SAI), a single-teleoperator curriculum for learning coupled multi-robot behaviors without synchronized dual-operator demonstrations or explicit inter-robot communication. SAI trains Robot A from unilateral demonstrations with a compliant human partner, trains Robot B against the deployed Robot A policy, and then refines Robot A using sparse interventions near coordination failures. This staged process exposes the policies to increasingly realistic partner behaviors, including delay, phase mismatch,insufficient yielding, and interaction conflict. Across real-world dual-robot manipulation tasks, SAI improves task success, phase synchronization, and partner-contingent yielding over independent imitation and curriculum-ablation baselines. These results suggest that physically coupled collaboration can be learned through the structure of the imitation curriculum, rather than through synchronized multi-operator demonstrations or explicit coordination mechanisms.Project page:http://cyc0429.github.io/sai-project-page/

翻译：协同移动操作需要机器人与部分可观测的伙伴协调，同时通过共享物体进行物理交互。这一任务具有挑战性，因为失败往往并非源于局部技能的不足，而是由于不恰当的等待、让步、牵引、释放或重新定位行为。我们研究了两台双臂移动机器人通过刚性及柔性物体耦合的问题，并提出序列非对称模仿（Sequential Asymmetric Imitation, SAI）——一种无需同步双人演示或显式机器人间通信的单人遥操作课程，用于学习耦合多机器人行为。SAI首先通过顺从人类伙伴的单侧演示训练机器人A，随后将机器人A的策略部署后训练机器人B，最后通过稀疏干预（在协作失败点附近）优化机器人A。这一分阶段训练过程使策略逐渐暴露于更真实的伙伴行为，包括延迟、相位失配、让步不足及交互冲突。在真实世界双臂机器人操作任务中，相比独立模仿与课程消融基线方法，SAI提升了任务成功率、相位同步性及针对伙伴的让步能力。这些结果表明，物理耦合协作可通过模仿课程的结构而非同步多操作者演示或显式协调机制来学习。项目页面：http://cyc0429.github.io/sai-project-page/

0

相关内容

机器人

机器人（英语：Robot）包括一切模拟人类行为或思想与模拟其他生物的机械（如机器狗，机器猫等）。狭义上对机器人的定义还有很多分类法及争议，有些电脑程序甚至也被称为机器人。在当代工业中，机器人指能自动运行任务的人造机器设备，用以取代或协助人类工作，一般会是机电设备，由计算机程序或是电子电路控制。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

《实现协作自主：从人机团队到多智能体系统》190页

《实现协作自主：从人机团队到多智能体系统》190页

专知会员服务

26+阅读 · 5月13日

《人机协作中的自适应任务规划与动态角色分配》最新30页报告

《人机协作中的自适应任务规划与动态角色分配》最新30页报告

专知会员服务

29+阅读 · 2025年11月21日

《实现协同自主：从人机协作到多智能体系统》最新190页

《实现协同自主：从人机协作到多智能体系统》最新190页

专知会员服务

77+阅读 · 2025年8月1日

《基于图计算的多机器人协同研究》最新139页

《基于图计算的多机器人协同研究》最新139页

专知会员服务

38+阅读 · 2025年5月28日

《拥挤与受限环境下机器人集群协同控制》150页

《拥挤与受限环境下机器人集群协同控制》150页

专知会员服务

24+阅读 · 2025年5月4日

《具身物理交互在机器人-机器人及机器人-人协作中的应用》122页

《具身物理交互在机器人-机器人及机器人-人协作中的应用》122页

专知会员服务

45+阅读 · 2025年3月25日

【斯坦福博士论文】协作多机器人学习算法

【斯坦福博士论文】协作多机器人学习算法

专知会员服务

17+阅读 · 2025年1月6日

2024年全球协作机器人产业发展白皮书

2024年全球协作机器人产业发展白皮书

专知会员服务

27+阅读 · 2024年12月24日

【ETHZ博士论文】与多机器人系统的直观与高效互动

【ETHZ博士论文】与多机器人系统的直观与高效互动

专知会员服务

19+阅读 · 2024年11月29日

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

专知会员服务

68+阅读 · 2022年3月21日

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

10+阅读 · 2023年4月12日

国外有人/无人机协同作战研究现状与发展趋势

国外有人/无人机协同作战研究现状与发展趋势

专知

82+阅读 · 2023年4月11日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

30+阅读 · 2022年11月23日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

19+阅读 · 2019年7月5日

国外有人/无人平台协同作战概述

国外有人/无人平台协同作战概述

无人机

124+阅读 · 2019年5月28日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【机器人】机器人PID控制

【机器人】机器人PID控制

产业智能官

10+阅读 · 2018年11月25日

CCCF专栏文章：人机共融智能

CCCF专栏文章：人机共融智能

中国计算机学会

15+阅读 · 2017年12月21日

进攻机动作战中的机器人集群

进攻机动作战中的机器人集群

无人机

32+阅读 · 2017年12月4日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

人类步行机理认知下的双足机器人步态与智能协同进化理论基础

国家自然科学基金

0+阅读 · 2015年12月31日

人机协调稳定约束的单腿外骨骼机器人自适应式动平衡助行控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

防肌肉疲劳双臂机器人人机协同基础研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

14+阅读 · 2015年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

Human-Guided Co-Manipulation of Carbon Fiber Plies

Arxiv

0+阅读 · 6月10日

Learning to Assist: Collaborative VLAs for Implicit Human-Robot Collaboration

Arxiv

0+阅读 · 6月10日

NestRL: A Nested Training Regime for Mutual Adaptation in Human-AI Teaming

Arxiv

0+阅读 · 6月1日

Towards Shared Embodied Intelligence in Humanoid Robots through Optimization Development and Testing of the Human Aware ergoCub Robot

Arxiv

0+阅读 · 5月26日

A Task-Driven Human-AI Collaboration: When to Automate, When to Collaborate, When to Challenge

Arxiv

0+阅读 · 5月22日

Designing for Robot Wranglers: A Synthesis of Literature and Practice

Arxiv

0+阅读 · 5月15日

HECTOR: Human-centric Hierarchical Coordination and Supervision of Robotic Fleets under Continual Temporal Tasks

Arxiv

0+阅读 · 5月14日

Unify Robot Actions in Camera Frame

Arxiv

0+阅读 · 5月13日

CoLA-Flow Policy: Temporally Coherent Imitation Learning via Continuous Latent Action Flow Matching for Robotic Manipulation

Arxiv

0+阅读 · 5月11日

Melding LLM and temporal logic for reliable human-swarm collaboration in complex scenarios

Arxiv

0+阅读 · 5月8日

VIP会员

文章信息

相关主题

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 今天4:35

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

3+阅读 · 今天4:24

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 今天4:18

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 今天4:15

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 今天4:08

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

《实现协作自主：从人机团队到多智能体系统》190页

《实现协作自主：从人机团队到多智能体系统》190页

专知会员服务

26+阅读 · 5月13日

《人机协作中的自适应任务规划与动态角色分配》最新30页报告

《人机协作中的自适应任务规划与动态角色分配》最新30页报告

专知会员服务

29+阅读 · 2025年11月21日

《实现协同自主：从人机协作到多智能体系统》最新190页

《实现协同自主：从人机协作到多智能体系统》最新190页

专知会员服务

77+阅读 · 2025年8月1日

《基于图计算的多机器人协同研究》最新139页

《基于图计算的多机器人协同研究》最新139页

专知会员服务

38+阅读 · 2025年5月28日

《拥挤与受限环境下机器人集群协同控制》150页

《拥挤与受限环境下机器人集群协同控制》150页

专知会员服务

24+阅读 · 2025年5月4日

《具身物理交互在机器人-机器人及机器人-人协作中的应用》122页

《具身物理交互在机器人-机器人及机器人-人协作中的应用》122页

专知会员服务

45+阅读 · 2025年3月25日

【斯坦福博士论文】协作多机器人学习算法

【斯坦福博士论文】协作多机器人学习算法

专知会员服务

17+阅读 · 2025年1月6日

2024年全球协作机器人产业发展白皮书

2024年全球协作机器人产业发展白皮书

专知会员服务

27+阅读 · 2024年12月24日

【ETHZ博士论文】与多机器人系统的直观与高效互动

【ETHZ博士论文】与多机器人系统的直观与高效互动

专知会员服务

19+阅读 · 2024年11月29日

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

专知会员服务

68+阅读 · 2022年3月21日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

10+阅读 · 2023年4月12日

国外有人/无人机协同作战研究现状与发展趋势

国外有人/无人机协同作战研究现状与发展趋势

专知

82+阅读 · 2023年4月11日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

30+阅读 · 2022年11月23日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

19+阅读 · 2019年7月5日

国外有人/无人平台协同作战概述

国外有人/无人平台协同作战概述

无人机

124+阅读 · 2019年5月28日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【机器人】机器人PID控制

【机器人】机器人PID控制

产业智能官

10+阅读 · 2018年11月25日

CCCF专栏文章：人机共融智能

CCCF专栏文章：人机共融智能

中国计算机学会

15+阅读 · 2017年12月21日

进攻机动作战中的机器人集群

进攻机动作战中的机器人集群

无人机

32+阅读 · 2017年12月4日

相关论文

Human-Guided Co-Manipulation of Carbon Fiber Plies

Arxiv

0+阅读 · 6月10日

Learning to Assist: Collaborative VLAs for Implicit Human-Robot Collaboration

Arxiv

0+阅读 · 6月10日

NestRL: A Nested Training Regime for Mutual Adaptation in Human-AI Teaming

Arxiv

0+阅读 · 6月1日

Towards Shared Embodied Intelligence in Humanoid Robots through Optimization Development and Testing of the Human Aware ergoCub Robot

Arxiv

0+阅读 · 5月26日

A Task-Driven Human-AI Collaboration: When to Automate, When to Collaborate, When to Challenge

Arxiv

0+阅读 · 5月22日

Designing for Robot Wranglers: A Synthesis of Literature and Practice

Arxiv

0+阅读 · 5月15日

HECTOR: Human-centric Hierarchical Coordination and Supervision of Robotic Fleets under Continual Temporal Tasks

Arxiv

0+阅读 · 5月14日

Unify Robot Actions in Camera Frame

Arxiv

0+阅读 · 5月13日

CoLA-Flow Policy: Temporally Coherent Imitation Learning via Continuous Latent Action Flow Matching for Robotic Manipulation

Arxiv

0+阅读 · 5月11日

Melding LLM and temporal logic for reliable human-swarm collaboration in complex scenarios

Arxiv

0+阅读 · 5月8日

相关基金

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

人类步行机理认知下的双足机器人步态与智能协同进化理论基础

国家自然科学基金

0+阅读 · 2015年12月31日

人机协调稳定约束的单腿外骨骼机器人自适应式动平衡助行控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

防肌肉疲劳双臂机器人人机协同基础研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

14+阅读 · 2015年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员