Robust Restless Multi-Armed Bandit for Data Center Flexibility Services Through Virtual Machine Scheduling - 专知论文

会员服务 ·

0

调度 · 重调度 · 多臂赌博机 · 赌博机 · 负载 ·

Robust Restless Multi-Armed Bandit for Data Center Flexibility Services Through Virtual Machine Scheduling

翻译：稳健的无休止多臂赌博机方法：通过虚拟机调度实现数据中心灵活供电服务

Yifu Ding,Zixi Chen,Thomas Magnanti

Energy demands from data centers have surged and stressed the grid in recent years. Electric grids require balancing supply and demand every second, motivating demand response (reduction) from large loads, including data centers. This can be achieved by rescheduling jobs on physical machines. Its real-time implementation is uncertain due to fluctuating resource utilization, and rescheduling incurs quality-of-service (QoS) losses that providers are unwilling to disclose. We propose a restless multi-arm bandit (RMAB) framework in which the grid operator requests load reductions without access to detailed job-rescheduling procedures. Using the open-source virtual machine (VM) datasets, we model job arrivals and rescheduling at each data center as a restless arm in a Markov decision process (MDP), and derive Whittle-index-based policies based on the learned transition function via Thompson sampling. To overcome the weakness of an increasingly long learning process due to an enlarged state space, we used a mixed strategy that included a global upper confidence bound (UCB) encoded with trust indices to enhance robustness and accelerate learning. Results show that the proposed mixed-strategy algorithm remains robust across varying state-space sizes and consistently outperforms the pure Thompson-Whittle (TW) algorithm, especially when contextual information is noisy. It also demonstrates superior performance compared to the state-of-the-art EXP4 framework. We provided an open-sourced code for reproducibility.

翻译：近年来，数据中心能源需求激增，给电网带来压力。电网需每秒平衡供需，这促使大型负载（包括数据中心）参与需求响应（削减负载）。通过物理机上的作业重调度可实现这一目标。然而，由于资源利用率波动，其实时实施存在不确定性，且重调度会导致服务质量（QoS）损失，而服务提供商不愿披露此类信息。我们提出一种无休止多臂赌博机（RMAB）框架，其中电网运营商在不了解具体作业重调度流程的情况下请求负载削减。利用开源虚拟机（VM）数据集，我们将每个数据中心的作业到达与重调度过程建模为马尔可夫决策过程（MDP）中的无休止臂，并通过汤普森采样基于学习到的转移函数推导基于惠特尔指数的策略。为克服状态空间扩大导致学习过程冗长的缺陷，我们采用一种混合策略，该策略包含全局置信上界（UCB）并编码信任指数以增强鲁棒性并加速学习。结果表明，所提出的混合策略算法在不同状态空间规模下均保持鲁棒性，且始终优于纯汤普森-惠特尔（TW）算法，尤其在上下文信息存在噪声时表现更佳。该算法相比当前最优的EXP4框架也展现出更优性能。我们提供了开源代码以保证结果的可复现性。

0

相关内容

【NeurIPS2025】MaNGO：基于元学习的可适应图网络模拟器

【NeurIPS2025】MaNGO：基于元学习的可适应图网络模拟器

专知会员服务

12+阅读 · 2025年10月8日

算力调度：算力时代的国家电网

算力调度：算力时代的国家电网

专知会员服务

44+阅读 · 2023年11月7日

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

专知会员服务

40+阅读 · 2023年9月27日

【斯坦福博士论文】面向人工智能驱动网络:数据平面机器学习的硬件和软件，140页pdf

【斯坦福博士论文】面向人工智能驱动网络:数据平面机器学习的硬件和软件，140页pdf

专知会员服务

33+阅读 · 2023年7月16日

【博士论文】面向分布式深度学习的数据中心网络拓扑优化和流量调度

【博士论文】面向分布式深度学习的数据中心网络拓扑优化和流量调度

专知会员服务

29+阅读 · 2022年12月30日

数字电网最新报告：数字赋能，电网添翼，33页ppt

数字电网最新报告：数字赋能，电网添翼，33页ppt

专知会员服务

37+阅读 · 2022年12月15日

纽约大学等《网络、博弈和学习的融合：网络上多智能体决策的博弈论框架》，60页pdf

纽约大学等《网络、博弈和学习的融合：网络上多智能体决策的博弈论框架》，60页pdf

专知会员服务

135+阅读 · 2022年4月3日

【博士论文】集群系统中的网络流调度

【博士论文】集群系统中的网络流调度

专知会员服务

47+阅读 · 2021年12月7日

【博士论文】大规模数据中心带宽分配与流量调度技术研究

【博士论文】大规模数据中心带宽分配与流量调度技术研究

专知会员服务

33+阅读 · 2020年12月15日

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

专知会员服务

14+阅读 · 2019年11月8日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

专知

34+阅读 · 2022年11月12日

PyTorch 单机多卡操作总结：分布式DataParallel，混合精度，Horovod)

PyTorch 单机多卡操作总结：分布式DataParallel，混合精度，Horovod)

极市平台

19+阅读 · 2020年10月18日

【Flink】基于 Flink 的流式数据实时去重

【Flink】基于 Flink 的流式数据实时去重

AINLP

14+阅读 · 2020年9月29日

【数据中台】数据中台技术架构方案

【数据中台】数据中台技术架构方案

产业智能官

15+阅读 · 2020年5月26日

【数据中台】什么是数据中台？

【数据中台】什么是数据中台？

产业智能官

18+阅读 · 2019年7月30日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

专知

78+阅读 · 2019年5月31日

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

36大数据

13+阅读 · 2019年3月20日

计及多重-复合不确定性的电力系统稳定约束优化调度研究

国家自然科学基金

1+阅读 · 2016年12月31日

家庭智能用电任务调度优化及其对电网负荷影响分析模型

国家自然科学基金

1+阅读 · 2015年12月31日

智能电网环境下地理分布式互联网数据中心的能量成本降低方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心网络中延时敏感的传输控制协议

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心资源利用率敏感的编译方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向绿色数据中心的高效能分布式储能技术

国家自然科学基金

1+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于演化博弈的智能电网供需动态耦合优化及政策分析

国家自然科学基金

7+阅读 · 2014年12月31日

考虑多控制模式融合的互动式负荷调度方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

QoS-Aware Token Scheduling and Private Data Valuation for Multi-Modal Agentic Networks

Arxiv

0+阅读 · 6月16日

Stannic: Systolic STochAstic ONliNe SchedulIng AcCelerator

Arxiv

0+阅读 · 6月15日

A Hardware-Based Multi-Stage Dynamic Power Management Architecture for Autonomous Low-Light Operation

Arxiv

0+阅读 · 6月13日

Robust Restless Multi-Armed Bandit for Data Center Flexibility Services Through Virtual Machine Scheduling

Arxiv

0+阅读 · 6月4日

SPARS: A Reinforcement Learning-Enabled Simulator for Power Management in HPC Job Scheduling

Arxiv

0+阅读 · 5月26日

GridPilot: Real-Time Grid-Responsive Control for AI Supercomputers

Arxiv

0+阅读 · 5月25日

Carbon-Aware Compute--Power Scheduling for AI Data Centers with Microgrid Prosumer Operations

Arxiv

0+阅读 · 5月12日

In-Network Artificial Computing Enhanced Light Model-Switching for Emergency Communications Networks

Arxiv

0+阅读 · 5月11日

Carbon-Aware Compute--Power Scheduling for AI Data Centers with Microgrid Prosumer Operations

Arxiv

0+阅读 · 5月5日

A Physics-Aware Framework for Short-Term GPU Power Forecasting of AI Data Centers

Arxiv

0+阅读 · 4月14日

VIP会员

文章信息

相关主题

多臂赌博机

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

【NeurIPS2025】MaNGO：基于元学习的可适应图网络模拟器

【NeurIPS2025】MaNGO：基于元学习的可适应图网络模拟器

专知会员服务

12+阅读 · 2025年10月8日

算力调度：算力时代的国家电网

算力调度：算力时代的国家电网

专知会员服务

44+阅读 · 2023年11月7日

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

专知会员服务

40+阅读 · 2023年9月27日

【斯坦福博士论文】面向人工智能驱动网络:数据平面机器学习的硬件和软件，140页pdf

【斯坦福博士论文】面向人工智能驱动网络:数据平面机器学习的硬件和软件，140页pdf

专知会员服务

33+阅读 · 2023年7月16日

【博士论文】面向分布式深度学习的数据中心网络拓扑优化和流量调度

【博士论文】面向分布式深度学习的数据中心网络拓扑优化和流量调度

专知会员服务

29+阅读 · 2022年12月30日

数字电网最新报告：数字赋能，电网添翼，33页ppt

数字电网最新报告：数字赋能，电网添翼，33页ppt

专知会员服务

37+阅读 · 2022年12月15日

纽约大学等《网络、博弈和学习的融合：网络上多智能体决策的博弈论框架》，60页pdf

纽约大学等《网络、博弈和学习的融合：网络上多智能体决策的博弈论框架》，60页pdf

专知会员服务

135+阅读 · 2022年4月3日

【博士论文】集群系统中的网络流调度

【博士论文】集群系统中的网络流调度

专知会员服务

47+阅读 · 2021年12月7日

【博士论文】大规模数据中心带宽分配与流量调度技术研究

【博士论文】大规模数据中心带宽分配与流量调度技术研究

专知会员服务

33+阅读 · 2020年12月15日

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

专知会员服务

14+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

专知

34+阅读 · 2022年11月12日

PyTorch 单机多卡操作总结：分布式DataParallel，混合精度，Horovod)

PyTorch 单机多卡操作总结：分布式DataParallel，混合精度，Horovod)

极市平台

19+阅读 · 2020年10月18日

【Flink】基于 Flink 的流式数据实时去重

【Flink】基于 Flink 的流式数据实时去重

AINLP

14+阅读 · 2020年9月29日

【数据中台】数据中台技术架构方案

【数据中台】数据中台技术架构方案

产业智能官

15+阅读 · 2020年5月26日

【数据中台】什么是数据中台？

【数据中台】什么是数据中台？

产业智能官

18+阅读 · 2019年7月30日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

专知

78+阅读 · 2019年5月31日

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

36大数据

13+阅读 · 2019年3月20日

相关论文

QoS-Aware Token Scheduling and Private Data Valuation for Multi-Modal Agentic Networks

Arxiv

0+阅读 · 6月16日

Stannic: Systolic STochAstic ONliNe SchedulIng AcCelerator

Arxiv

0+阅读 · 6月15日

A Hardware-Based Multi-Stage Dynamic Power Management Architecture for Autonomous Low-Light Operation

Arxiv

0+阅读 · 6月13日

Robust Restless Multi-Armed Bandit for Data Center Flexibility Services Through Virtual Machine Scheduling

Arxiv

0+阅读 · 6月4日

SPARS: A Reinforcement Learning-Enabled Simulator for Power Management in HPC Job Scheduling

Arxiv

0+阅读 · 5月26日

GridPilot: Real-Time Grid-Responsive Control for AI Supercomputers

Arxiv

0+阅读 · 5月25日

Carbon-Aware Compute--Power Scheduling for AI Data Centers with Microgrid Prosumer Operations

Arxiv

0+阅读 · 5月12日

In-Network Artificial Computing Enhanced Light Model-Switching for Emergency Communications Networks

Arxiv

0+阅读 · 5月11日

Carbon-Aware Compute--Power Scheduling for AI Data Centers with Microgrid Prosumer Operations

Arxiv

0+阅读 · 5月5日

A Physics-Aware Framework for Short-Term GPU Power Forecasting of AI Data Centers

Arxiv

0+阅读 · 4月14日

相关基金

计及多重-复合不确定性的电力系统稳定约束优化调度研究

国家自然科学基金

1+阅读 · 2016年12月31日

家庭智能用电任务调度优化及其对电网负荷影响分析模型

国家自然科学基金

1+阅读 · 2015年12月31日

智能电网环境下地理分布式互联网数据中心的能量成本降低方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心网络中延时敏感的传输控制协议

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心资源利用率敏感的编译方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向绿色数据中心的高效能分布式储能技术

国家自然科学基金

1+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于演化博弈的智能电网供需动态耦合优化及政策分析

国家自然科学基金

7+阅读 · 2014年12月31日

考虑多控制模式融合的互动式负荷调度方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员