人工智能分布式部署的代理系统日益普及,对高效选择影响智能体学习行为的参数、复杂环境下的机制设计应用以及整合多样化智能体能力达成预期目标提出了新挑战。算法机制设计(这一融合计算机科学、数学与经济学的跨学科领域)致力于开发引导理性智能体实现期望行为的算法,其应用涵盖资源分配、成本分摊、定价与组合拍卖。然而,传统方法受限于计算约束与静态假设,在动态不确定环境中的有效性不足。本论文通过整合强化学习(RL)与贝叶斯优化(BO)开发动态多智能体环境中的自适应机制以突破上述局限。

本文提出多智能体强化学习(MARL)中机制设计的新框架,依托新型BO方法高效探索潜力方案。MARL捕捉随机环境中多智能体动态交互的复杂性,通过求解底层马尔可夫博弈学习联合策略。评估多MARL场景的计算复杂度问题通过以下方式解决:(一)扩展"后继特征"至纳什均衡策略的迁移学习;(二)采用基于BO的框架限制评估资源,使问题可解。所提机制设计框架的有效性通过多项实际应用基准研究验证,包括:出租车平台司机服务费设定、共享自然资源开发管理(实现社会福利最大化)、机器人编队勘探任务硬件采购决策优化,以及定义最优激励与招募策略(最大化委托方目标)。实证结果表明,本方法在现实问题中优于现有技术,彰显BO与MARL结合优化复杂多智能体系统的潜力,为机制设计未来研究奠定坚实基础。

成为VIP会员查看完整内容
30

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《多智能体强化学习中的机制设计优化研究》103页
专知会员服务
32+阅读 · 2025年5月31日
《战略智能体与有限反馈下的序贯决策》211页
专知会员服务
36+阅读 · 2025年5月7日
《基于图计算的多机器人协调与协作​​》139页
专知会员服务
41+阅读 · 2025年4月19日
《人机团队背景下的受限集体运动研究》110页
专知会员服务
20+阅读 · 2025年4月9日
《多智能体合作强化学习中的通信》139页
专知会员服务
45+阅读 · 2025年2月17日
《多智能体系统中的异质性》221页
专知会员服务
35+阅读 · 2025年2月14日
《改进单智能体和多智能体深度强化学习方法》219页
专知会员服务
62+阅读 · 2025年2月14日
《用于自主网络行动的竞争性强化学习》113页
专知会员服务
28+阅读 · 2025年1月12日
多智能体自主系统《群体自主系统的实时路径规划》248页
张潼新书《机器学习算法数学分析》,477页pdf
专知会员服务
207+阅读 · 2023年7月6日
【硬核书】数据科学,282页pdf
专知
26+阅读 · 2022年11月29日
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
【KDD2020】图神经网络:基础与应用,322页ppt
多模态深度学习综述,18页pdf
专知
51+阅读 · 2020年3月29日
国家自然科学基金
40+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Arxiv
176+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
Arxiv
83+阅读 · 2023年3月26日
Arxiv
182+阅读 · 2023年3月24日
Arxiv
27+阅读 · 2023年3月17日
VIP会员
最新内容
马赛克战:俄乌战场透析
专知会员服务
12+阅读 · 今天4:12
《利用人工智能增强军事决策》
专知会员服务
3+阅读 · 今天4:09
《自动机器学习在军事数据耕耘法中的应用》
专知会员服务
5+阅读 · 今天4:02
为何指挥所生存能力要求范式转变
专知会员服务
3+阅读 · 今天3:54
打造“新蛛网”模式与高科技动员
专知会员服务
3+阅读 · 今天3:33
“蛛网”行动一周年:远程无人机战争
专知会员服务
3+阅读 · 今天3:23
【剑桥博士论文】智能体-环境协同优化
专知会员服务
6+阅读 · 6月9日
为初级军官战术训练设计生成式人工智能平台
专知会员服务
8+阅读 · 6月9日
《美军条令:作战伤员后送保障》
专知会员服务
6+阅读 · 6月9日
相关VIP内容
《多智能体强化学习中的机制设计优化研究》103页
专知会员服务
32+阅读 · 2025年5月31日
《战略智能体与有限反馈下的序贯决策》211页
专知会员服务
36+阅读 · 2025年5月7日
《基于图计算的多机器人协调与协作​​》139页
专知会员服务
41+阅读 · 2025年4月19日
《人机团队背景下的受限集体运动研究》110页
专知会员服务
20+阅读 · 2025年4月9日
《多智能体合作强化学习中的通信》139页
专知会员服务
45+阅读 · 2025年2月17日
《多智能体系统中的异质性》221页
专知会员服务
35+阅读 · 2025年2月14日
《改进单智能体和多智能体深度强化学习方法》219页
专知会员服务
62+阅读 · 2025年2月14日
《用于自主网络行动的竞争性强化学习》113页
专知会员服务
28+阅读 · 2025年1月12日
多智能体自主系统《群体自主系统的实时路径规划》248页
张潼新书《机器学习算法数学分析》,477页pdf
专知会员服务
207+阅读 · 2023年7月6日
相关基金
国家自然科学基金
40+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员