As robots become more integrated in society, their ability to coordinate with other robots and humans on multi-modal tasks (those with multiple valid solutions) is crucial. We propose to learn such behaviors from expert demonstrations via imitation learning (IL). However, when expert demonstrations are multi-modal, standard IL approaches can struggle to capture the diverse strategies, hindering effective coordination. Diffusion models are known to be effective at handling complex multi-modal trajectory distributions in single-agent systems. Diffusion models have also excelled in multi-agent scenarios where multi-modality is more common and crucial to learning coordinated behaviors. Typically, diffusion-based approaches require a centralized planner or explicit communication among agents, but this assumption can fail in real-world scenarios where robots must operate independently or with agents like humans that they cannot directly communicate with. Therefore, we propose MIMIC-D, a Centralized Training, Decentralized Execution (CTDE) paradigm for multi-modal multi-agent imitation learning using diffusion policies. Agents are trained jointly with full information, but execute policies using only local information to achieve implicit coordination. We demonstrate in both simulation and hardware experiments that our method recovers multi-modal coordination behavior among agents in a variety of tasks and environments, while improving upon state-of-the-art baselines.


翻译:随着机器人在社会中日益普及,它们与其他机器人及人类在多模态任务(即存在多种有效解决方案的任务)上的协同能力变得至关重要。我们提出通过模仿学习从专家示范中学习此类行为。然而,当专家示范具有多模态特性时,标准模仿学习方法难以捕捉多样化的策略,从而阻碍有效协同。扩散模型已知能有效处理单智能体系统中的复杂多模态轨迹分布。扩散模型同样在多智能体场景中表现出色,因为多模态性在此类场景中更为常见且对学习协同行为至关重要。通常,基于扩散的方法需要集中式规划器或智能体间的显式通信,但这一假设在现实场景中可能失效,因为机器人必须独立运行或与无法直接通信的智能体(如人类)协同。为此,我们提出MIMIC-D,一种采用扩散策略的集中训练、分散执行范式,用于多模态多智能体模仿学习。智能体在训练阶段基于完整信息进行联合训练,而在执行阶段仅利用局部信息运行策略,以实现隐式协同。我们在仿真与硬件实验中证明,该方法能在多种任务和环境中恢复智能体间的多模态协同行为,同时性能优于现有先进基线方法。

0
下载
关闭预览

相关内容

多智能体协作机制
专知会员服务
23+阅读 · 4月25日
【CMU博士论文】迈向数据高效的多模态学习
专知会员服务
24+阅读 · 1月17日
基于多智能体强化学习的协同目标分配
专知会员服务
139+阅读 · 2023年9月5日
多智能体协同决策方法研究
专知会员服务
134+阅读 · 2022年12月15日
多模态认知计算
专知会员服务
182+阅读 · 2022年9月16日
【Paul Liang】多模态深度学习,Multimodal Deep Learning
专知会员服务
186+阅读 · 2022年4月12日
【AI与医学】多模态机器学习精准医疗健康
专访俞栋:多模态是迈向通用人工智能的重要方向
AI科技评论
26+阅读 · 2019年9月9日
多模态多任务学习新论文
专知
46+阅读 · 2019年2月9日
人工智能顶刊TPAMI2019最新《多模态机器学习综述》
人工智能学家
29+阅读 · 2019年1月19日
这可能是「多模态机器学习」最通俗易懂的介绍
计算机视觉life
113+阅读 · 2018年12月20日
DeepMind:用PopArt进行多任务深度强化学习
论智
30+阅读 · 2018年9月14日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
19+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
Claw AI Lab:从自动写论文到交互式AI研究实验室
专知会员服务
1+阅读 · 5月24日
美以伊冲突中的无人机反防空作战
专知会员服务
7+阅读 · 5月23日
安杜里尔与Meta研发军用智能眼镜的内幕
专知会员服务
7+阅读 · 5月22日
超越步调威胁:整合人工智能以加速指挥决策
专知会员服务
12+阅读 · 5月22日
Nature三连发AI自主科学发现论文
专知会员服务
9+阅读 · 5月21日
安杜里尔与人工智能驱动防务的崛起
专知会员服务
14+阅读 · 5月21日
相关VIP内容
多智能体协作机制
专知会员服务
23+阅读 · 4月25日
【CMU博士论文】迈向数据高效的多模态学习
专知会员服务
24+阅读 · 1月17日
基于多智能体强化学习的协同目标分配
专知会员服务
139+阅读 · 2023年9月5日
多智能体协同决策方法研究
专知会员服务
134+阅读 · 2022年12月15日
多模态认知计算
专知会员服务
182+阅读 · 2022年9月16日
【Paul Liang】多模态深度学习,Multimodal Deep Learning
专知会员服务
186+阅读 · 2022年4月12日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
19+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员