Multi-robot collaboration allows robots to efficiently take on a wide range of tasks, from moving a couch through a doorway to assembling structures on a construction site. However, achieving such coordination in mobile multi-robot settings remains challenging: centralized methods conditioned on the combined observations of a team scale poorly with team size, and decentralized methods that train one policy per robot often require explicit alignment procedures or information sharing at inference time to overcome partial observability. Our key insight is that the visuomotor priors of pretrained vision-language-action (VLA) models should enable reactive, decentralized collaboration from each robot's local observations alone, without these inference-time assumptions. We propose CHORUS, a framework that adapts a single VLA backbone to control diverse, multi-robot teams. At inference time, each robot runs an independent copy of CHORUS, conditioned only on its own observations and a robot-identifying prompt. In real-world experiments including mobile tape measurement, library book handovers, and laundry basket lifting, CHORUS achieves a 64% point improvement over decentralized, from-scratch models, improves reactivity to teammate behavior by 40% points, and outperforms centralized baselines. Together, these results show that a shared VLA backbone is capable of achieving decentralized multi-robot collaboration, without per-robot policies or inter-robot communication at inference.


翻译:多机器人协作使机器人能够高效完成从搬运沙发通过门道到在建筑工地组装结构等一系列任务。然而,在移动多机器人环境下实现这种协调仍然具有挑战性:基于团队联合观测的集中式方法会随团队规模扩大而扩展性下降,而为每个机器人单独训练策略的去中心化方法通常需要明确的校准流程或推理时的信息共享来克服局部可观测性。我们的关键洞察是:预训练的视觉-语言-动作(VLA)模型的视觉运动先验应能使每个机器人仅依赖其局部观测实现响应式的去中心化协作,无需这些推理时的假设。我们提出CHORUS框架,该框架适配单一VLA骨干网络以控制多样化的多机器人团队。在推理时,每个机器人独立运行CHORUS副本,仅基于自身观测和机器人标识提示进行决策。在包含移动卷尺测量、图书馆书籍交接和洗衣篮搬举的真实世界实验中,CHORUS相比从零训练的去中心化方法实现了64%的性能提升,对队友行为的响应能力提高40%,并优于集中式基线方法。这些结果共同表明:共享VLA骨干网络能够实现去中心化的多机器人协作,无需为每个机器人单独制定策略,也无需在推理时进行机器人间通信。

0
下载
关闭预览

相关内容

多智能体协作机制
专知会员服务
23+阅读 · 4月25日
《基于图计算的多机器人协同研究》最新139页
专知会员服务
38+阅读 · 2025年5月28日
中文版 | 集中式与分布式多智能体AI协调策略
专知会员服务
22+阅读 · 2025年5月8日
《基于图计算的多机器人协调与协作​​》139页
专知会员服务
42+阅读 · 2025年4月19日
【ETHZ博士论文】与多机器人系统的直观与高效互动
专知会员服务
19+阅读 · 2024年11月29日
常用的模型集成方法介绍:bagging、boosting 、stacking
【AGV】仓库内多AGV协作的全局路径规划算法的研究
产业智能官
28+阅读 · 2018年11月10日
DeepMind:用PopArt进行多任务深度强化学习
论智
30+阅读 · 2018年9月14日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
1+阅读 · 今天14:45
定向能反无人机系统最新发展动态
专知会员服务
5+阅读 · 今天13:50
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 今天13:33
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员