Cooperative-Competitive Team Play of Real-World Craft Robots - 专知论文

会员服务 ·

0

协作 · 博弈 · 机器人 · 高效训练 · 智能体 ·

Cooperative-Competitive Team Play of Real-World Craft Robots

翻译：协作-竞争型团队博弈：真实世界工艺机器人的实现

Rui Zhao,Xihui Li,Yizheng Zhang,Yuzhen Liu,Zhong Zhang,Yufeng Zhang,Cheng Zhou,Zhengyou Zhang,Lei Han

from arxiv, Accepted by 2026 IEEE International Conference on Robotics and Automation (ICRA 2026), Vienna, Austria

Multi-agent deep Reinforcement Learning (RL) has made significant progress in developing intelligent game-playing agents in recent years. However, the efficient training of collective robots using multi-agent RL and the transfer of learned policies to real-world applications remain open research questions. In this work, we first develop a comprehensive robotic system, including simulation, distributed learning framework, and physical robot components. We then propose and evaluate reinforcement learning techniques designed for efficient training of cooperative and competitive policies on this platform. To address the challenges of multi-agent sim-to-real transfer, we introduce Out of Distribution State Initialization (OODSI) to mitigate the impact of the sim-to-real gap. In the experiments, OODSI improves the Sim2Real performance by 20%. We demonstrate the effectiveness of our approach through experiments with a multi-robot car competitive game and a cooperative task in real-world settings.

翻译：近年来，多智能体深度强化学习在开发智能博弈智能体方面取得了显著进展。然而，如何利用多智能体强化学习高效训练机器人群体，并将习得策略迁移至现实世界应用，仍是亟待解决的研究课题。本研究首先构建了一套完整的机器人系统，包括仿真环境、分布式学习框架与实体机器人组件。随后，我们提出并评估了专为该平台设计的强化学习技术，旨在实现协作与竞争策略的高效训练。为应对多智能体仿真到现实迁移的挑战，我们引入了分布外状态初始化方法，以缓解仿真与现实差距带来的影响。实验表明，该方法将仿真到现实的性能提升了20%。我们通过多机器人车辆竞争博弈和现实场景协作任务的实验，验证了所提方法的有效性。

0

相关内容

《基于图神经网络、深度强化学习与概率主题建模的战略对手建模》

《基于图神经网络、深度强化学习与概率主题建模的战略对手建模》

专知会员服务

30+阅读 · 2025年11月16日

《基于分层多智能体强化学习的逼真空战协同策略》

《基于分层多智能体强化学习的逼真空战协同策略》

专知会员服务

44+阅读 · 2025年10月30日

《迈向真正的机器人队友：推断与运用认知状态以实现新型人类-自主系统协作能力》最新博士论文

《迈向真正的机器人队友：推断与运用认知状态以实现新型人类-自主系统协作能力》最新博士论文

专知会员服务

25+阅读 · 2025年9月27日

《AI作战：将人机协作集成至实时、虚拟与建构环境（LVC）的建模与仿真》

《AI作战：将人机协作集成至实时、虚拟与建构环境（LVC）的建模与仿真》

专知会员服务

41+阅读 · 2025年9月23日

《实现协同自主：从人机协作到多智能体系统》最新190页

《实现协同自主：从人机协作到多智能体系统》最新190页

专知会员服务

74+阅读 · 2025年8月1日

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

专知会员服务

60+阅读 · 2025年4月6日

《具身物理交互在机器人-机器人及机器人-人协作中的应用》122页

《具身物理交互在机器人-机器人及机器人-人协作中的应用》122页

专知会员服务

44+阅读 · 2025年3月25日

面向机器人系统的虚实迁移强化学习综述

面向机器人系统的虚实迁移强化学习综述

专知会员服务

44+阅读 · 2024年2月8日

《基于强化学习在真实世界复杂环境中开展人机协作》最新44页论文

《基于强化学习在真实世界复杂环境中开展人机协作》最新44页论文

专知会员服务

92+阅读 · 2024年1月7日

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

专知会员服务

67+阅读 · 2022年3月21日

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

30+阅读 · 2022年11月23日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知

13+阅读 · 2019年10月12日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

18+阅读 · 2019年7月5日

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

中国自动化学会

11+阅读 · 2019年6月18日

国外有人/无人平台协同作战概述

国外有人/无人平台协同作战概述

无人机

122+阅读 · 2019年5月28日

机器人军团的智能指挥

机器人军团的智能指挥

科技导报

12+阅读 · 2019年4月4日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

14+阅读 · 2015年12月31日

面向电子制造的多机器人高速协调的关键理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

49+阅读 · 2009年12月31日

HandelBot: Real-World Piano Playing via Fast Adaptation of Dexterous Robot Policies

Arxiv

0+阅读 · 3月12日

MetaWorld-X: Hierarchical World Modeling via VLM-Orchestrated Experts for Humanoid Loco-Manipulation

Arxiv

0+阅读 · 3月9日

ManipulationNet: An Infrastructure for Benchmarking Real-World Robot Manipulation with Physical Skill Challenges and Embodied Multimodal Reasoning

Arxiv

0+阅读 · 3月4日

Mixed-Initiative Dialog for Human-Robot Collaborative Manipulation

Arxiv

0+阅读 · 2月27日

SPARR: Simulation-based Policies with Asymmetric Real-world Residuals for Assembly

Arxiv

0+阅读 · 2月26日

Human-to-Robot Interaction: Learning from Video Demonstration for Robot Imitation

Arxiv

0+阅读 · 2月22日

Collaborative Multi-Robot Non-Prehensile Manipulation via Flow-Matching Co-Generation

Arxiv

0+阅读 · 2月17日

A Pragmatist Robot: Learning to Plan Tasks by Experiencing the Real World

Arxiv

0+阅读 · 2月14日

MeCo: Enhancing LLM-Empowered Multi-Robot Collaboration via Similar Task Memoization

Arxiv

0+阅读 · 2月13日

From Raw Data to Shared 3D Semantics: Task-Oriented Communication for Multi-Robot Collaboration

Arxiv

0+阅读 · 2月9日

VIP会员

文章信息

相关主题

最新内容

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

专知会员服务

10+阅读 · 今天6:39

《人工智能在全球军事与武器工业中的应用、方法论与影响》

《人工智能在全球军事与武器工业中的应用、方法论与影响》

专知会员服务

3+阅读 · 今天6:36

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

专知会员服务

7+阅读 · 今天6:28

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

4+阅读 · 今天0:51

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

4+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

7+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

6+阅读 · 4月29日

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

6+阅读 · 4月29日

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

10+阅读 · 4月29日

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

12+阅读 · 4月29日

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

8+阅读 · 4月29日

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

19+阅读 · 4月29日

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

专知会员服务

11+阅读 · 4月29日

【伯克利博士论文】深度解析 AI 智能体的失配问题

【伯克利博士论文】深度解析 AI 智能体的失配问题

专知会员服务

8+阅读 · 4月28日

智能体化世界建模：基础、能力、规律及展望

智能体化世界建模：基础、能力、规律及展望

专知会员服务

11+阅读 · 4月28日

相关VIP内容

《基于图神经网络、深度强化学习与概率主题建模的战略对手建模》

《基于图神经网络、深度强化学习与概率主题建模的战略对手建模》

专知会员服务

30+阅读 · 2025年11月16日

《基于分层多智能体强化学习的逼真空战协同策略》

《基于分层多智能体强化学习的逼真空战协同策略》

专知会员服务

44+阅读 · 2025年10月30日

《迈向真正的机器人队友：推断与运用认知状态以实现新型人类-自主系统协作能力》最新博士论文

《迈向真正的机器人队友：推断与运用认知状态以实现新型人类-自主系统协作能力》最新博士论文

专知会员服务

25+阅读 · 2025年9月27日

《AI作战：将人机协作集成至实时、虚拟与建构环境（LVC）的建模与仿真》

《AI作战：将人机协作集成至实时、虚拟与建构环境（LVC）的建模与仿真》

专知会员服务

41+阅读 · 2025年9月23日

《实现协同自主：从人机协作到多智能体系统》最新190页

《实现协同自主：从人机协作到多智能体系统》最新190页

专知会员服务

74+阅读 · 2025年8月1日

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

专知会员服务

60+阅读 · 2025年4月6日

《具身物理交互在机器人-机器人及机器人-人协作中的应用》122页

《具身物理交互在机器人-机器人及机器人-人协作中的应用》122页

专知会员服务

44+阅读 · 2025年3月25日

面向机器人系统的虚实迁移强化学习综述

面向机器人系统的虚实迁移强化学习综述

专知会员服务

44+阅读 · 2024年2月8日

《基于强化学习在真实世界复杂环境中开展人机协作》最新44页论文

《基于强化学习在真实世界复杂环境中开展人机协作》最新44页论文

专知会员服务

92+阅读 · 2024年1月7日

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

专知会员服务

67+阅读 · 2022年3月21日

热门VIP内容

开通专知VIP会员享更多权益服务

《人工智能在全球军事与武器工业中的应用、方法论与影响》

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

相关资讯

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

30+阅读 · 2022年11月23日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知

13+阅读 · 2019年10月12日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

18+阅读 · 2019年7月5日

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

中国自动化学会

11+阅读 · 2019年6月18日

国外有人/无人平台协同作战概述

国外有人/无人平台协同作战概述

无人机

122+阅读 · 2019年5月28日

机器人军团的智能指挥

机器人军团的智能指挥

科技导报

12+阅读 · 2019年4月4日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

相关论文

HandelBot: Real-World Piano Playing via Fast Adaptation of Dexterous Robot Policies

Arxiv

0+阅读 · 3月12日

MetaWorld-X: Hierarchical World Modeling via VLM-Orchestrated Experts for Humanoid Loco-Manipulation

Arxiv

0+阅读 · 3月9日

ManipulationNet: An Infrastructure for Benchmarking Real-World Robot Manipulation with Physical Skill Challenges and Embodied Multimodal Reasoning

Arxiv

0+阅读 · 3月4日

Mixed-Initiative Dialog for Human-Robot Collaborative Manipulation

Arxiv

0+阅读 · 2月27日

SPARR: Simulation-based Policies with Asymmetric Real-world Residuals for Assembly

Arxiv

0+阅读 · 2月26日

Human-to-Robot Interaction: Learning from Video Demonstration for Robot Imitation

Arxiv

0+阅读 · 2月22日

Collaborative Multi-Robot Non-Prehensile Manipulation via Flow-Matching Co-Generation

Arxiv

0+阅读 · 2月17日

A Pragmatist Robot: Learning to Plan Tasks by Experiencing the Real World

Arxiv

0+阅读 · 2月14日

MeCo: Enhancing LLM-Empowered Multi-Robot Collaboration via Similar Task Memoization

Arxiv

0+阅读 · 2月13日

From Raw Data to Shared 3D Semantics: Task-Oriented Communication for Multi-Robot Collaboration

Arxiv

0+阅读 · 2月9日

相关基金

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

14+阅读 · 2015年12月31日

面向电子制造的多机器人高速协调的关键理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

49+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员