人工智能分布式部署中智能体系统的广泛应用,对高效选择影响智能体学习行为的参数、在复杂环境中实施机制设计,以及整合多元智能体能力实现目标结果提出了新挑战。算法机制设计作为计算机科学、数学和经济学的交叉领域,致力于开发引导理性智能体达成预期行为的算法,其应用涵盖资源分配、成本分摊、定价与组合拍卖等场景。然而,传统方法受限于计算约束与静态假设,在充满不确定性与动态变化的环境中效果不佳。

本论文通过融合强化学习(RL)与贝叶斯优化(BO),针对动态多智能体场景开发自适应机制以突破上述局限。我们提出多智能体强化学习(MARL)中机制设计的新框架,依托创新的BO方法高效探索潜力方案。MARL可捕捉随机环境中多智能体动态交互的复杂性,通过求解底层马尔可夫博弈以学习联合策略。评估多MARL场景的计算复杂度问题通过以下方式解决:(I)扩展后继特征至纳什均衡策略的迁移学习;(II)采用BO框架限定评估预算,使问题可解。

所提机制设计框架的有效性在出租车平台司机服务费设定、共享自然资源开发管理(社会福利最大化)、探索任务机器人集群硬件采购决策优化,以及激励机制与招募策略设计(委托方目标最优化)等实际应用的基准研究中得到验证。该方法在现实问题上展现的优越性,凸显了BO与MARL融合优化复杂多智能体系统的潜力,为机制设计领域的未来研究奠定了坚实基础。

成为VIP会员查看完整内容
32

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《机器人强化学习技术进展》34页
专知会员服务
39+阅读 · 2025年7月16日
《多域人机交互研究》95页
专知会员服务
36+阅读 · 2025年6月2日
《时空变化领域中的学习与决策》134页
专知会员服务
17+阅读 · 2025年5月10日
《多智能体强化学习中机制设计的优化》103页
专知会员服务
30+阅读 · 2025年5月3日
《基于图计算的多机器人协调与协作​​》139页
专知会员服务
41+阅读 · 2025年4月19日
《多智能体合作强化学习中的通信》139页
专知会员服务
45+阅读 · 2025年2月17日
《改进单智能体和多智能体深度强化学习方法》219页
专知会员服务
62+阅读 · 2025年2月14日
多智能体自主系统《群体自主系统的实时路径规划》248页
【伯克利博士论文】可信赖机器学习,227页pdf
专知会员服务
89+阅读 · 2022年12月12日
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
最新《可解释人工智能》概述,50页ppt
专知
12+阅读 · 2021年3月17日
深度多模态表示学习综述论文,22页pdf
专知
33+阅读 · 2020年6月21日
多模态深度学习综述,18页pdf
专知
51+阅读 · 2020年3月29日
基于逆强化学习的示教学习方法综述
计算机研究与发展
16+阅读 · 2019年2月25日
国家自然科学基金
40+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Arxiv
176+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
Arxiv
83+阅读 · 2023年3月26日
Arxiv
182+阅读 · 2023年3月24日
Arxiv
27+阅读 · 2023年3月17日
VIP会员
最新内容
战略前沿人工智能的再思考(中文)
专知会员服务
3+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
3+阅读 · 5月29日
“史诗怒火行动”中美军损失的作战飞机
专知会员服务
2+阅读 · 5月29日
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
5+阅读 · 5月28日
Agent Harness综述:大模型智能体执行器工程全景
专知会员服务
13+阅读 · 5月28日
《基于理论的威慑效能评估》
专知会员服务
8+阅读 · 5月28日
相关VIP内容
《机器人强化学习技术进展》34页
专知会员服务
39+阅读 · 2025年7月16日
《多域人机交互研究》95页
专知会员服务
36+阅读 · 2025年6月2日
《时空变化领域中的学习与决策》134页
专知会员服务
17+阅读 · 2025年5月10日
《多智能体强化学习中机制设计的优化》103页
专知会员服务
30+阅读 · 2025年5月3日
《基于图计算的多机器人协调与协作​​》139页
专知会员服务
41+阅读 · 2025年4月19日
《多智能体合作强化学习中的通信》139页
专知会员服务
45+阅读 · 2025年2月17日
《改进单智能体和多智能体深度强化学习方法》219页
专知会员服务
62+阅读 · 2025年2月14日
多智能体自主系统《群体自主系统的实时路径规划》248页
【伯克利博士论文】可信赖机器学习,227页pdf
专知会员服务
89+阅读 · 2022年12月12日
相关资讯
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
最新《可解释人工智能》概述,50页ppt
专知
12+阅读 · 2021年3月17日
深度多模态表示学习综述论文,22页pdf
专知
33+阅读 · 2020年6月21日
多模态深度学习综述,18页pdf
专知
51+阅读 · 2020年3月29日
基于逆强化学习的示教学习方法综述
计算机研究与发展
16+阅读 · 2019年2月25日
相关基金
国家自然科学基金
40+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员