Zeroth-Order Stackelberg Control in Combinatorial Congestion Games - 专知论文

会员服务 ·

0

均衡 · 博弈 · 路径 · 网络参数 · 用户选择 ·

Zeroth-Order Stackelberg Control in Combinatorial Congestion Games

翻译：组合拥塞博弈中的零阶斯塔克尔伯格控制

Saeed Masiha,Sepehr Elahi,Negar Kiyavash,Patrick Thiran

We study Stackelberg (leader--follower) tuning of network parameters (tolls, capacities, incentives) in combinatorial congestion games, where selfish users choose discrete routes (or other combinatorial strategies) and settle at a congestion equilibrium. The leader minimizes a system-level objective (e.g., total travel time) evaluated at equilibrium, but this objective is typically nonsmooth because the set of used strategies can change abruptly. We propose ZO-Stackelberg, which couples a projection-free Frank--Wolfe equilibrium solver with a zeroth-order outer update, avoiding differentiation through equilibria. We prove convergence to generalized Goldstein stationary points of the true equilibrium objective, with explicit dependence on the equilibrium approximation error, and analyze subsampled oracles: if an exact minimizer is sampled with probability $κ_m$, then the Frank--Wolfe error decays as $\mathcal{O}(1/(κ_m T))$. We also propose stratified sampling as a practical way to avoid a vanishing $κ_m$ when the strategies that matter most for the Wardrop equilibrium concentrate in a few dominant combinatorial classes (e.g., short paths). Experiments on real-world networks demonstrate that our method achieves orders-of-magnitude speedups over a differentiation-based baseline while converging to follower equilibria.

翻译：本研究探讨组合拥塞博弈中网络参数（通行费、容量、激励）的斯塔克尔伯格（领导者-追随者）调节问题。在该博弈中，自私用户选择离散路径（或其他组合策略）并最终达到拥塞均衡。领导者旨在最小化均衡状态下的系统级目标（例如总行程时间），但该目标通常是非光滑的，因为被使用策略的集合可能发生突变。我们提出ZO-Stackelberg方法，该方法将无投影的Frank-Wolfe均衡求解器与零阶外部更新相结合，避免了通过均衡点进行微分。我们证明了该方法能收敛到真实均衡目标的广义Goldstein稳定点，并明确了均衡近似误差的显式依赖关系，同时分析了子采样预言机：若以概率$κ_m$采样到精确最小化器，则Frank-Wolfe误差以$\mathcal{O}(1/(κ_m T))$速率衰减。针对Wardrop均衡中关键策略集中于少数主导组合类别（例如短路径）的情况，我们提出分层采样作为避免$κ_m$趋近于零的实用方法。在现实网络上的实验表明，相较于基于微分的方法基准，我们的方法在收敛到追随者均衡的同时实现了数量级的加速。

0

相关内容

随机网络效用最大化在战略排队系统中的博弈论方法

随机网络效用最大化在战略排队系统中的博弈论方法

专知会员服务

9+阅读 · 4月13日

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

专知会员服务

141+阅读 · 2024年3月16日

【普林斯顿博士论文】从博弈论视角看控制中的鲁棒性，266页pdf

【普林斯顿博士论文】从博弈论视角看控制中的鲁棒性，266页pdf

专知会员服务

40+阅读 · 2024年2月27日

《利用深度强化学习实现自主水下航行器的自适应编队运动规划和控制》2023最新33页

《利用深度强化学习实现自主水下航行器的自适应编队运动规划和控制》2023最新33页

专知会员服务

45+阅读 · 2023年12月26日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知会员服务

106+阅读 · 2022年9月22日

【博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

【博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

专知会员服务

102+阅读 · 2022年9月21日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

86+阅读 · 2022年5月6日

DARPA SI3-CMD项目支持，《网络多智能体影响博弈中的可扩展均衡计算》麻省理工、马里兰大学，Scalable Equilibrium Computation in Multi-agent Influence Games on Networks

DARPA SI3-CMD项目支持，《网络多智能体影响博弈中的可扩展均衡计算》麻省理工、马里兰大学，Scalable Equilibrium Computation in Multi-agent Influence Games on Networks

专知会员服务

24+阅读 · 2022年4月10日

印度理工学院《有限观测下目标防御差异博弈的动态网络分析》，23页pdf

印度理工学院《有限观测下目标防御差异博弈的动态网络分析》，23页pdf

专知会员服务

23+阅读 · 2022年4月5日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

CALDERA 一款对手自动模拟工具

CALDERA 一款对手自动模拟工具

黑白之道

20+阅读 · 2019年9月17日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

Seq2seq强化，Pointer Network简介

Seq2seq强化，Pointer Network简介

机器学习算法与Python学习

15+阅读 · 2018年12月8日

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

专知

32+阅读 · 2018年8月14日

基于python的开源量化交易，量化投资架构

基于python的开源量化交易，量化投资架构

运维帮

15+阅读 · 2018年7月5日

概率论之概念解析：边缘化（Marginalisation）

概率论之概念解析：边缘化（Marginalisation）

专知

14+阅读 · 2018年1月31日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

GAFT：一个使用 Python 实现的遗传算法框架

GAFT：一个使用 Python 实现的遗传算法框架

Python开发者

10+阅读 · 2017年8月1日

牵制控制框架下符号网络的群体行为研究

国家自然科学基金

2+阅读 · 2017年12月31日

不确定分数阶非线性系统Mittag-Leffler自适应控制

国家自然科学基金

1+阅读 · 2016年12月31日

基于单向链路时延的SCPS-TP双端双向拥塞控制模型与算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机接入中的分布式功率控制和数据包编码传输

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

状态依赖时滞耦合拥塞控制系统的振荡与同步

国家自然科学基金

0+阅读 · 2015年12月31日

有限范围随机最优控制系统的数值方法与均场倒向随机系统的最优控制问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据中心以太网拥塞控制

国家自然科学基金

1+阅读 · 2015年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

Policy Iteration for Two-Player General-Sum Stochastic Stackelberg Games

Arxiv

0+阅读 · 3月16日

Strategic Interactions in Multi-Level Stackelberg Games with Non-Follower Agents and Heterogeneous Leaders

Arxiv

0+阅读 · 3月4日

Learning to Play Multi-Follower Bayesian Stackelberg Games

Arxiv

0+阅读 · 3月1日

Learning to Control Unknown Strongly Monotone Games

Arxiv

0+阅读 · 2月24日

Nearly-Optimal Bandit Learning in Stackelberg Games with Side Information

Arxiv

0+阅读 · 2月19日

Control in Hedonic Games

Arxiv

0+阅读 · 2月18日

Computing Equilibria in Games with Stochastic Action Sets

Arxiv

0+阅读 · 2月18日

Learning in Structured Stackelberg Games

Arxiv

0+阅读 · 2月12日

Selfish routing games with priority lanes

Arxiv

0+阅读 · 2月6日

Actor-Dual-Critic Dynamics for Zero-sum and Identical-Interest Stochastic Games

Arxiv

0+阅读 · 1月31日

VIP会员

文章信息

相关主题

最新内容

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

专知会员服务

10+阅读 · 今天6:39

《人工智能在全球军事与武器工业中的应用、方法论与影响》

《人工智能在全球军事与武器工业中的应用、方法论与影响》

专知会员服务

3+阅读 · 今天6:36

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

专知会员服务

8+阅读 · 今天6:28

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

5+阅读 · 4月30日

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

4+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

7+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

6+阅读 · 4月29日

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

6+阅读 · 4月29日

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

10+阅读 · 4月29日

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

12+阅读 · 4月29日

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

8+阅读 · 4月29日

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

20+阅读 · 4月29日

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

专知会员服务

12+阅读 · 4月29日

【伯克利博士论文】深度解析 AI 智能体的失配问题

【伯克利博士论文】深度解析 AI 智能体的失配问题

专知会员服务

8+阅读 · 4月28日

智能体化世界建模：基础、能力、规律及展望

智能体化世界建模：基础、能力、规律及展望

专知会员服务

11+阅读 · 4月28日

相关VIP内容

随机网络效用最大化在战略排队系统中的博弈论方法

随机网络效用最大化在战略排队系统中的博弈论方法

专知会员服务

9+阅读 · 4月13日

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

专知会员服务

141+阅读 · 2024年3月16日

【普林斯顿博士论文】从博弈论视角看控制中的鲁棒性，266页pdf

【普林斯顿博士论文】从博弈论视角看控制中的鲁棒性，266页pdf

专知会员服务

40+阅读 · 2024年2月27日

《利用深度强化学习实现自主水下航行器的自适应编队运动规划和控制》2023最新33页

《利用深度强化学习实现自主水下航行器的自适应编队运动规划和控制》2023最新33页

专知会员服务

45+阅读 · 2023年12月26日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知会员服务

106+阅读 · 2022年9月22日

【博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

【博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

专知会员服务

102+阅读 · 2022年9月21日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

86+阅读 · 2022年5月6日

DARPA SI3-CMD项目支持，《网络多智能体影响博弈中的可扩展均衡计算》麻省理工、马里兰大学，Scalable Equilibrium Computation in Multi-agent Influence Games on Networks

DARPA SI3-CMD项目支持，《网络多智能体影响博弈中的可扩展均衡计算》麻省理工、马里兰大学，Scalable Equilibrium Computation in Multi-agent Influence Games on Networks

专知会员服务

24+阅读 · 2022年4月10日

印度理工学院《有限观测下目标防御差异博弈的动态网络分析》，23页pdf

印度理工学院《有限观测下目标防御差异博弈的动态网络分析》，23页pdf

专知会员服务

23+阅读 · 2022年4月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《人工智能在全球军事与武器工业中的应用、方法论与影响》

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

相关资讯

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

CALDERA 一款对手自动模拟工具

CALDERA 一款对手自动模拟工具

黑白之道

20+阅读 · 2019年9月17日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

Seq2seq强化，Pointer Network简介

Seq2seq强化，Pointer Network简介

机器学习算法与Python学习

15+阅读 · 2018年12月8日

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

专知

32+阅读 · 2018年8月14日

基于python的开源量化交易，量化投资架构

基于python的开源量化交易，量化投资架构

运维帮

15+阅读 · 2018年7月5日

概率论之概念解析：边缘化（Marginalisation）

概率论之概念解析：边缘化（Marginalisation）

专知

14+阅读 · 2018年1月31日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

GAFT：一个使用 Python 实现的遗传算法框架

GAFT：一个使用 Python 实现的遗传算法框架

Python开发者

10+阅读 · 2017年8月1日

相关论文

Policy Iteration for Two-Player General-Sum Stochastic Stackelberg Games

Arxiv

0+阅读 · 3月16日

Strategic Interactions in Multi-Level Stackelberg Games with Non-Follower Agents and Heterogeneous Leaders

Arxiv

0+阅读 · 3月4日

Learning to Play Multi-Follower Bayesian Stackelberg Games

Arxiv

0+阅读 · 3月1日

Learning to Control Unknown Strongly Monotone Games

Arxiv

0+阅读 · 2月24日

Nearly-Optimal Bandit Learning in Stackelberg Games with Side Information

Arxiv

0+阅读 · 2月19日

Control in Hedonic Games

Arxiv

0+阅读 · 2月18日

Computing Equilibria in Games with Stochastic Action Sets

Arxiv

0+阅读 · 2月18日

Learning in Structured Stackelberg Games

Arxiv

0+阅读 · 2月12日

Selfish routing games with priority lanes

Arxiv

0+阅读 · 2月6日

Actor-Dual-Critic Dynamics for Zero-sum and Identical-Interest Stochastic Games

Arxiv

0+阅读 · 1月31日

相关基金

牵制控制框架下符号网络的群体行为研究

国家自然科学基金

2+阅读 · 2017年12月31日

不确定分数阶非线性系统Mittag-Leffler自适应控制

国家自然科学基金

1+阅读 · 2016年12月31日

基于单向链路时延的SCPS-TP双端双向拥塞控制模型与算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机接入中的分布式功率控制和数据包编码传输

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

状态依赖时滞耦合拥塞控制系统的振荡与同步

国家自然科学基金

0+阅读 · 2015年12月31日

有限范围随机最优控制系统的数值方法与均场倒向随机系统的最优控制问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据中心以太网拥塞控制

国家自然科学基金

1+阅读 · 2015年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员