随机网络效用最大化一直是众多排队网络资源分配与控制问题的主流框架。其原始模型旨在优化社会福利,通常表现为参与实体局部效用之和的形式。然而,这种集中式效用最大化方法并不适用于许多现代多智能体系统,因为每个智能体可能会自私地优化其自身局部效用,而不考虑整体效用。本文将战略排队系统中的随机网络效用最大化问题构建为一个带有队列稳定性约束的重复博弈。具体而言,智能体需反复做出决策,在满足其局部约束和共享的全局约束的同时,维持队列稳定性。目标是设计一个构成该博弈广义纳什均衡的策略。

首先通过一个静态一次性博弈的构建,推导出战略排队网络效用最大化问题的流体模型特征。这一特征启发了一种原始-对偶算法,该算法通过确保最后一次迭代收敛于正则化静态一次性博弈的一个解,从而构成一个近似的广义纳什均衡。然而,与为经典网络效用最大化问题开发的原始-对偶方法类似,此方法在决策中未利用实时队列长度,导致实践中排队延迟不理想,且缺乏明确的性能保证。为此,我们提出了战略漂移加惩罚算法,并证明其构成一个𝜀-广义纳什均衡,且对任意𝜀 > 0,其期望队列长度均匀有界,阶为𝑂(1/𝜀^3)。在一个对广泛问题类别都成立的附加温和假设下,证明了算法实现的社会福利长期平均值,能够任意接近一个福利最大化的广义纳什均衡策略的水平。仿真结果验证了我们的理论,并展示了算法的优越性能。

成为VIP会员查看完整内容
7

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
面向智能博弈的决策Transformer方法综述
专知会员服务
200+阅读 · 2023年4月14日
【博士论文】集群系统中的网络流调度
专知会员服务
47+阅读 · 2021年12月7日
机器学习中的最优化算法总结
人工智能前沿讲习班
22+阅读 · 2019年3月22日
不对称多代理博弈中的博弈理论解读
AI前线
14+阅读 · 2018年3月8日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
人工智能在战场行动中的演进及伊朗案例
专知会员服务
6+阅读 · 4月18日
美AI公司Anthropic推出网络安全模型“Mythos”
专知会员服务
4+阅读 · 4月18日
【博士论文】面向城市环境的可解释计算机视觉
大语言模型的自改进机制:技术综述与未来展望
《第四代军事特种作战部队选拔与评估》
专知会员服务
3+阅读 · 4月18日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员