As robots become more integrated in society, their ability to coordinate with other robots and humans on multi-modal tasks (those with multiple valid solutions) is crucial. We propose to learn such behaviors from expert demonstrations via imitation learning (IL). However, when expert demonstrations are multi-modal, standard IL approaches can struggle to capture the diverse strategies, hindering effective coordination. Diffusion models are known to be effective at handling complex multi-modal trajectory distributions in single-agent systems. Diffusion models have also excelled in multi-agent scenarios where multi-modality is more common and crucial to learning coordinated behaviors. Typically, diffusion-based approaches require a centralized planner or explicit communication among agents, but this assumption can fail in real-world scenarios where robots must operate independently or with agents like humans that they cannot directly communicate with. Therefore, we propose MIMIC-D, a Centralized Training, Decentralized Execution (CTDE) paradigm for multi-modal multi-agent imitation learning using diffusion policies. Agents are trained jointly with full information, but execute policies using only local information to achieve implicit coordination. We demonstrate in both simulation and hardware experiments that our method recovers multi-modal coordination behavior among agents in a variety of tasks and environments, while improving upon state-of-the-art baselines.


翻译:随着机器人在社会中日益普及,它们与其他机器人及人类在多模态任务(即存在多种有效解决方案的任务)上的协同能力变得至关重要。我们提出通过模仿学习从专家示范中学习此类行为。然而,当专家示范具有多模态特性时,标准模仿学习方法难以捕捉多样化的策略,从而阻碍有效协同。扩散模型已知能有效处理单智能体系统中的复杂多模态轨迹分布。扩散模型同样在多智能体场景中表现出色,因为多模态性在此类场景中更为常见且对学习协同行为至关重要。通常,基于扩散的方法需要集中式规划器或智能体间的显式通信,但这一假设在现实场景中可能失效,因为机器人必须独立运行或与无法直接通信的智能体(如人类)协同。为此,我们提出MIMIC-D,一种采用扩散策略的集中训练、分散执行范式,用于多模态多智能体模仿学习。智能体在训练阶段基于完整信息进行联合训练,而在执行阶段仅利用局部信息运行策略,以实现隐式协同。我们在仿真与硬件实验中证明,该方法能在多种任务和环境中恢复智能体间的多模态协同行为,同时性能优于现有先进基线方法。

0
下载
关闭预览

相关内容

【CMU博士论文】迈向数据高效的多模态学习
专知会员服务
23+阅读 · 1月17日
基于多智能体强化学习的协同目标分配
专知会员服务
138+阅读 · 2023年9月5日
多智能体协同决策方法研究
专知会员服务
134+阅读 · 2022年12月15日
多模态认知计算
专知会员服务
182+阅读 · 2022年9月16日
【Paul Liang】多模态深度学习,Multimodal Deep Learning
专知会员服务
185+阅读 · 2022年4月12日
【AI与医学】多模态机器学习精准医疗健康
专访俞栋:多模态是迈向通用人工智能的重要方向
AI科技评论
26+阅读 · 2019年9月9日
多模态多任务学习新论文
专知
46+阅读 · 2019年2月9日
人工智能顶刊TPAMI2019最新《多模态机器学习综述》
人工智能学家
29+阅读 · 2019年1月19日
这可能是「多模态机器学习」最通俗易懂的介绍
计算机视觉life
113+阅读 · 2018年12月20日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
19+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
《对信息环境分析实现人工智能预测冲突》96页
专知会员服务
3+阅读 · 今天9:59
《面向海军应用的无人机网络安全仿真环境》
专知会员服务
4+阅读 · 今天9:41
无人机与僵局:俄乌战争难以突破
专知会员服务
3+阅读 · 今天9:02
《控制对手感知:电子战愿景与赋能技术》
专知会员服务
5+阅读 · 今天8:51
自主、人工智能与可消耗集群时代的海军情报
专知会员服务
8+阅读 · 4月6日
“史诗狂怒行动”中的海军动态
专知会员服务
10+阅读 · 4月5日
相关VIP内容
【CMU博士论文】迈向数据高效的多模态学习
专知会员服务
23+阅读 · 1月17日
基于多智能体强化学习的协同目标分配
专知会员服务
138+阅读 · 2023年9月5日
多智能体协同决策方法研究
专知会员服务
134+阅读 · 2022年12月15日
多模态认知计算
专知会员服务
182+阅读 · 2022年9月16日
【Paul Liang】多模态深度学习,Multimodal Deep Learning
专知会员服务
185+阅读 · 2022年4月12日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
19+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员