This work presents MAC-Flow, a simple yet expressive framework for multi-agent coordination. We argue that requirements of effective coordination are twofold: (i) a rich representation of the diverse joint behaviors present in offline data and (ii) the ability to act efficiently in real time. However, prior approaches often sacrifice one for the other, i.e., denoising diffusion-based solutions capture complex coordination but are computationally slow, while Gaussian policy-based solutions are fast but brittle in handling multi-agent interaction. MAC-Flow addresses this trade-off by first learning a flow-based representation of joint behaviors, and then distilling it into decentralized one-step policies that preserve coordination while enabling fast execution. Across four different benchmarks, including $12$ environments and $34$ datasets, MAC-Flow alleviates the trade-off between performance and computational cost, specifically achieving about $\boldsymbol{\times14.5}$ faster inference compared to diffusion-based MARL methods, while maintaining good performance. At the same time, its inference speed is similar to that of prior Gaussian policy-based offline multi-agent reinforcement learning (MARL) methods.


翻译:本研究提出MAC-Flow——一个简洁而富有表现力的多智能体协同框架。我们认为有效协同需满足双重需求:(i) 对离线数据中多样化联合行为进行丰富表征;(ii) 具备实时高效决策能力。然而现有方法往往顾此失彼:基于去噪扩散的解决方案虽能捕捉复杂协同模式但计算缓慢,而基于高斯策略的方法虽响应迅速却在处理多智能体交互时表现脆弱。MAC-Flow通过双重设计解决这一权衡问题:首先学习基于流的联合行为表征,继而将其蒸馏为分散式单步策略,在保持协同能力的同时实现快速执行。在涵盖12种环境和34个数据集的四项基准测试中,MAC-Flow有效缓解了性能与计算成本间的矛盾,具体实现较基于扩散的MARL方法约$\boldsymbol{\times14.5}$的推理加速,同时保持良好性能。其推理速度与现有基于高斯策略的离线多智能体强化学习(MARL)方法相当。

0
下载
关闭预览

相关内容

多智能体强化学习中的稳健且高效的通信
专知会员服务
25+阅读 · 2025年11月17日
中文版 | 集中式与分布式多智能体AI协调策略
专知会员服务
19+阅读 · 2025年5月8日
多智能体协同研究进展综述: 博弈和控制交叉视角
专知会员服务
52+阅读 · 2025年2月1日
基于多智能体强化学习的协同目标分配
专知会员服务
136+阅读 · 2023年9月5日
多智能体协同决策方法研究
专知会员服务
133+阅读 · 2022年12月15日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
15+阅读 · 2020年9月9日
浅谈群体智能——新一代AI的重要方向
中国科学院自动化研究所
44+阅读 · 2019年10月16日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员