本文研究具有已知动力学和对抗性干扰动态系统的多智能体控制问题。我们的研究重点是没有集中的预计算策略的最优控制,而是对不同的智能体只配备一个稳定控制器的自适应控制策略。我们给出了一个从任何(标准)遗憾最小化控制方法到分布式算法的还原方法。该还原法保证了所产生的分布式算法相对于最佳预计算的联合策略具有较低的遗憾。我们的方法包括将在线凸优化推广到多智能体环境中,并应用最近从非随机控制中得出的单智能体工具。我们在一个过度行动的飞机模型上对我们的方法进行了经验评估。我们表明,分布式方法对故障和动态中的对抗性扰动是稳健的。

成为VIP会员查看完整内容
19

相关内容

ICLR 2022 放出了本届会议的论文接收结果:共有 54 篇 Oral(口头报告)论文和 176 篇 Spolight 论文,论文接收总数 1095 篇,最终投稿量 3391 篇,论文接收率 32.3%。
专知会员服务
21+阅读 · 2021年7月28日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
1+阅读 · 2022年8月4日
已删除
Arxiv
33+阅读 · 2020年3月23日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Arxiv
1+阅读 · 2022年8月4日
已删除
Arxiv
33+阅读 · 2020年3月23日
Arxiv
22+阅读 · 2018年8月30日
微信扫码咨询专知VIP会员