近年来,多智能体强化学习(MARL)在各个领域的多智能体序贯决策任务中获得广泛关注。然而现有可解释方法大多集中于集中式MARL,未能解决去中心化环境中固有的不确定性与非确定性难题。我们提出生成策略摘要的方法,用以捕捉去中心化MARL策略中的任务排序与智能体协作机制,同时提供基于“何时”“为何未执行”及“执行内容”三类用户查询的智能体行为解释。通过在四个MARL领域和两种去中心化MARL算法上进行评估,验证了所提方法具有良好泛化性与计算效率。用户研究表明,生成的策略摘要与解释显著提升了用户问答效能,并在理解度、满意度等指标上获得更优的主观评价。

成为VIP会员查看完整内容
28

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《可解释深度强化学习综述》
专知会员服务
40+阅读 · 2025年2月12日
《基于专家衍生决策策略的增强自主智能体》
专知会员服务
49+阅读 · 2024年6月5日
《分布式多智能体深度强化学习:竞争性博弈》最新论文
专知会员服务
130+阅读 · 2023年3月16日
《学习型系统的测试与评估》
专知会员服务
60+阅读 · 2023年3月12日
《人机交互中机器学习的透明通信》论文
专知会员服务
33+阅读 · 2023年3月12日
【MIT博士论文】数据高效强化学习,176页pdf
最新《图嵌入组合优化》综述论文,40页pdf
最新《动态网络嵌入》综述论文,25页pdf
专知
37+阅读 · 2020年6月17日
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
Arxiv
176+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
Arxiv
83+阅读 · 2023年3月26日
Arxiv
27+阅读 · 2023年3月17日
Arxiv
10+阅读 · 2020年11月26日
Arxiv
11+阅读 · 2018年7月31日
VIP会员
最新内容
《多域战场上反制小型无人机系统》150页
专知会员服务
14+阅读 · 今天7:47
战场人工智能:增强陆地作战能力的发现与要求
专知会员服务
3+阅读 · 今天7:37
以人工智能为中心的指挥控制
专知会员服务
3+阅读 · 今天7:14
《基于深度强化学习的反无人机技术研究》178页
专知会员服务
13+阅读 · 6月10日
“史诗怒火”行动与“AI中心战”模式的浮现
专知会员服务
14+阅读 · 6月10日
【CVPR2026教程】扩散模型的解析理解
专知会员服务
6+阅读 · 6月10日
相关VIP内容
相关基金
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
相关论文
Arxiv
176+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
Arxiv
83+阅读 · 2023年3月26日
Arxiv
27+阅读 · 2023年3月17日
Arxiv
10+阅读 · 2020年11月26日
Arxiv
11+阅读 · 2018年7月31日
微信扫码咨询专知VIP会员