我们介绍了一套多智能体系统决策算法(集中式、分布式和混合式),并提出了用于自主赛博安全的因子值(FV)蒙特卡洛树搜索(MCTS)混合成本最大加算法。我们提出的算法包括两个步骤。第一步,每个智能体使用 MCTS 寻找其最佳的单个行动,同时考虑成本。每个智能体向团队提交其最有前途的行动。第二步,使用混合成本最大加法算法进行联合行动选择。这种混合成本 Max-Plus 算法改进了已知的集中式和分布式无成本 Max-Plus 算法,将行动成本纳入了智能体的互动中。Max-Plus 算法使用协调图框架,利用智能体之间的依赖关系将全局报酬函数分解为局部项的总和。我们提出的 FV-MCTS-Hybrid-Cost-Max-Plus 算法是在线的、随时的、分布式的,并可根据智能体数量及其互动情况进行扩展。我们的贡献可与使用 MCTS 和 Max-Plus 利用智能体互动的局部性进行规划和行动的最新方法和算法相媲美。

成为VIP会员查看完整内容
43

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《谈判游戏》美海军NPS等最新报告
专知会员服务
32+阅读 · 2023年11月13日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
Arxiv
176+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
Arxiv
83+阅读 · 2023年3月26日
Arxiv
182+阅读 · 2023年3月24日
VIP会员
最新内容
超越网格:作战环境对炮兵的影响
专知会员服务
2+阅读 · 5月31日
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
6+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
7+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
19+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
11+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
专知会员服务
11+阅读 · 5月30日
相关VIP内容
《谈判游戏》美海军NPS等最新报告
专知会员服务
32+阅读 · 2023年11月13日
相关资讯
相关基金
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员