Robust Restless Multi-Armed Bandit for Data Center Flexibility Services Through Virtual Machine Scheduling - 专知论文

会员服务 ·

0

调度 · 鲁棒 · 非平稳 · 多臂赌博机 · 赌博机 ·

Robust Restless Multi-Armed Bandit for Data Center Flexibility Services Through Virtual Machine Scheduling

翻译：鲁棒性非平稳多臂赌博机框架：通过虚拟机调度实现数据中心灵活供电服务

Zixi Chen,Yifu Ding,Thomas Magnanti

Energy demands from data centers have surged and stressed the grid in recent years. Electric grids require balancing supply and demand every second, motivating demand response (reduction) from large loads, including data centers. This can be achieved by rescheduling jobs on a physical machine. Its real-time implementation is uncertain due to fluctuating resource utilization, and rescheduling incurs quality-of-service (QoS) losses that providers are unwilling to disclose. We propose a restless multi-armed bandit (RMAB) framework, in which the grid operator requests load reductions without access to detailed job-rescheduling procedures. Using open-source virtual machine (VM) datasets, we model job arrivals and rescheduling at each data center as a restless arm in a Markov decision process (MDP) and derive Whittle-index-based policies using the learned transition function via Thompson sampling. To overcome the weakness of an increasingly long learning process due to an enlarged state space, we use a mixed strategy that includes a global upper confidence bound (UCB) and encodes trust indices to enhance robustness and accelerate learning. Results show that the proposed mixed-strategy algorithm remains robust across varying state-space sizes and consistently outperforms the pure Thompson-Whittle (TW) algorithm, especially when contextual information is noisy. It also demonstrates superior performance compared to the state-of-the-art EXP4 framework. We provided open-source code to ensure reproducibility.

翻译：近年来，数据中心能源需求激增，对电网造成压力。电网需每秒维持供需平衡，促使大数据负荷（包括数据中心）参与需求响应（削减负荷）。该目标可通过重新调度物理机上的作业实现。然而，资源利用率的波动性导致实时调度存在不确定性，且重新调度引发的服务质量损失（QoS）是运营商不愿披露的。本文提出一个非平稳多臂赌博机（RMAB）框架，允许电网运营商在不掌握详细作业重调度流程的情况下请求负荷削减。利用开源虚拟机（VM）数据集，我们将每个数据中心的作业到达与重调度过程建模为马尔可夫决策过程（MDP）中的非平稳臂，并通过汤普森采样学习状态转移函数，推导基于Whittle索引的策略。针对状态空间扩张导致学习过程漫长的缺陷，我们采用混合策略：引入全局置信上界（UCB）并编码信任指数，以增强鲁棒性并加速学习。结果表明，所提出的混合策略算法在不同状态空间规模下均保持鲁棒性，且持续优于纯汤普森-Whittle（TW）算法（尤其在上下文信息含噪时）。相较于前沿的EXP4框架，该算法亦展现出更优性能。我们已提供开源代码以确保结果可复现。

0

相关内容

《大规模供应链中断实时管理中智能决策支持系统的弹性集成》最新295页

《大规模供应链中断实时管理中智能决策支持系统的弹性集成》最新295页

专知会员服务

18+阅读 · 2025年5月9日

算力调度：算力时代的国家电网

算力调度：算力时代的国家电网

专知会员服务

44+阅读 · 2023年11月7日

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

专知会员服务

40+阅读 · 2023年9月27日

【斯坦福博士论文】面向人工智能驱动网络:数据平面机器学习的硬件和软件，140页pdf

【斯坦福博士论文】面向人工智能驱动网络:数据平面机器学习的硬件和软件，140页pdf

专知会员服务

32+阅读 · 2023年7月16日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知会员服务

102+阅读 · 2023年4月10日

数字电网最新报告：数字赋能，电网添翼，33页ppt

数字电网最新报告：数字赋能，电网添翼，33页ppt

专知会员服务

37+阅读 · 2022年12月15日

数字孪生电网的特性、架构及应用综述

数字孪生电网的特性、架构及应用综述

专知会员服务

55+阅读 · 2022年11月24日

纽约大学等《网络、博弈和学习的融合：网络上多智能体决策的博弈论框架》，60页pdf

纽约大学等《网络、博弈和学习的融合：网络上多智能体决策的博弈论框架》，60页pdf

专知会员服务

135+阅读 · 2022年4月3日

【博士论文】大规模数据中心带宽分配与流量调度技术研究

【博士论文】大规模数据中心带宽分配与流量调度技术研究

专知会员服务

33+阅读 · 2020年12月15日

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

专知会员服务

14+阅读 · 2019年11月8日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

专知

34+阅读 · 2022年11月12日

PyTorch 单机多卡操作总结：分布式DataParallel，混合精度，Horovod)

PyTorch 单机多卡操作总结：分布式DataParallel，混合精度，Horovod)

极市平台

19+阅读 · 2020年10月18日

【数据中台】数据中台技术架构方案

【数据中台】数据中台技术架构方案

产业智能官

15+阅读 · 2020年5月26日

【数据中台】什么是数据中台？

【数据中台】什么是数据中台？

产业智能官

18+阅读 · 2019年7月30日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

专知

78+阅读 · 2019年5月31日

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

产业智能官

35+阅读 · 2019年4月30日

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

36大数据

13+阅读 · 2019年3月20日

计及多重-复合不确定性的电力系统稳定约束优化调度研究

国家自然科学基金

1+阅读 · 2016年12月31日

家庭智能用电任务调度优化及其对电网负荷影响分析模型

国家自然科学基金

1+阅读 · 2015年12月31日

智能电网环境下地理分布式互联网数据中心的能量成本降低方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心网络中延时敏感的传输控制协议

国家自然科学基金

0+阅读 · 2015年12月31日

面向绿色数据中心的高效能分布式储能技术

国家自然科学基金

1+阅读 · 2015年12月31日

面向主动配电网的分布式能源多目标鲁棒经济优化调度

国家自然科学基金

1+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

低保守性自适应鲁棒优化及其在含大规模风电电网调度中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

新能源电力系统多时间尺度动力学特性及其暂态稳定机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

Stannic: Systolic STochAstic ONliNe SchedulIng AcCelerator

Arxiv

0+阅读 · 6月15日

A Hardware-Based Multi-Stage Dynamic Power Management Architecture for Autonomous Low-Light Operation

Arxiv

0+阅读 · 6月13日

Rain: RDMA-assisted In-Network Scheduling for Microsecond-scale Workloads

Arxiv

0+阅读 · 6月2日

Green Distributed AI Training: Orchestrating Compute Across Renewable-Powered Micro Datacenters

Arxiv

0+阅读 · 5月27日

GridPilot: Real-Time Grid-Responsive Control for AI Supercomputers

Arxiv

0+阅读 · 5月25日

Heterogeneous Multi-Agent Modeling for Measurement and Network Analysis of the Data Service Market

Arxiv

0+阅读 · 5月22日

Robust Restless Multi-Armed Bandit for Data Center Flexibility Services Through Virtual Machine Scheduling

Arxiv

0+阅读 · 5月18日

Carbon-Aware Compute--Power Scheduling for AI Data Centers with Microgrid Prosumer Operations

Arxiv

0+阅读 · 5月12日

In-Network Artificial Computing Enhanced Light Model-Switching for Emergency Communications Networks

Arxiv

0+阅读 · 5月11日

A Physics-Aware Framework for Short-Term GPU Power Forecasting of AI Data Centers

Arxiv

0+阅读 · 4月14日

VIP会员

文章信息

相关主题

多臂赌博机

最新内容

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

7+阅读 · 今天2:06

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

5+阅读 · 今天1:37

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

3+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

5+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

4+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

6+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

6+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

5+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

4+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

8+阅读 · 6月16日

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

6+阅读 · 6月16日

相关VIP内容

《大规模供应链中断实时管理中智能决策支持系统的弹性集成》最新295页

《大规模供应链中断实时管理中智能决策支持系统的弹性集成》最新295页

专知会员服务

18+阅读 · 2025年5月9日

算力调度：算力时代的国家电网

算力调度：算力时代的国家电网

专知会员服务

44+阅读 · 2023年11月7日

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

专知会员服务

40+阅读 · 2023年9月27日

【斯坦福博士论文】面向人工智能驱动网络:数据平面机器学习的硬件和软件，140页pdf

【斯坦福博士论文】面向人工智能驱动网络:数据平面机器学习的硬件和软件，140页pdf

专知会员服务

32+阅读 · 2023年7月16日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知会员服务

102+阅读 · 2023年4月10日

数字电网最新报告：数字赋能，电网添翼，33页ppt

数字电网最新报告：数字赋能，电网添翼，33页ppt

专知会员服务

37+阅读 · 2022年12月15日

数字孪生电网的特性、架构及应用综述

数字孪生电网的特性、架构及应用综述

专知会员服务

55+阅读 · 2022年11月24日

纽约大学等《网络、博弈和学习的融合：网络上多智能体决策的博弈论框架》，60页pdf

纽约大学等《网络、博弈和学习的融合：网络上多智能体决策的博弈论框架》，60页pdf

专知会员服务

135+阅读 · 2022年4月3日

【博士论文】大规模数据中心带宽分配与流量调度技术研究

【博士论文】大规模数据中心带宽分配与流量调度技术研究

专知会员服务

33+阅读 · 2020年12月15日

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

专知会员服务

14+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

相关资讯

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

专知

34+阅读 · 2022年11月12日

PyTorch 单机多卡操作总结：分布式DataParallel，混合精度，Horovod)

PyTorch 单机多卡操作总结：分布式DataParallel，混合精度，Horovod)

极市平台

19+阅读 · 2020年10月18日

【数据中台】数据中台技术架构方案

【数据中台】数据中台技术架构方案

产业智能官

15+阅读 · 2020年5月26日

【数据中台】什么是数据中台？

【数据中台】什么是数据中台？

产业智能官

18+阅读 · 2019年7月30日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

专知

78+阅读 · 2019年5月31日

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

产业智能官

35+阅读 · 2019年4月30日

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

36大数据

13+阅读 · 2019年3月20日

相关论文

Stannic: Systolic STochAstic ONliNe SchedulIng AcCelerator

Arxiv

0+阅读 · 6月15日

A Hardware-Based Multi-Stage Dynamic Power Management Architecture for Autonomous Low-Light Operation

Arxiv

0+阅读 · 6月13日

Rain: RDMA-assisted In-Network Scheduling for Microsecond-scale Workloads

Arxiv

0+阅读 · 6月2日

Green Distributed AI Training: Orchestrating Compute Across Renewable-Powered Micro Datacenters

Arxiv

0+阅读 · 5月27日

GridPilot: Real-Time Grid-Responsive Control for AI Supercomputers

Arxiv

0+阅读 · 5月25日

Heterogeneous Multi-Agent Modeling for Measurement and Network Analysis of the Data Service Market

Arxiv

0+阅读 · 5月22日

Robust Restless Multi-Armed Bandit for Data Center Flexibility Services Through Virtual Machine Scheduling

Arxiv

0+阅读 · 5月18日

Carbon-Aware Compute--Power Scheduling for AI Data Centers with Microgrid Prosumer Operations

Arxiv

0+阅读 · 5月12日

In-Network Artificial Computing Enhanced Light Model-Switching for Emergency Communications Networks

Arxiv

0+阅读 · 5月11日

A Physics-Aware Framework for Short-Term GPU Power Forecasting of AI Data Centers

Arxiv

0+阅读 · 4月14日

相关基金

计及多重-复合不确定性的电力系统稳定约束优化调度研究

国家自然科学基金

1+阅读 · 2016年12月31日

家庭智能用电任务调度优化及其对电网负荷影响分析模型

国家自然科学基金

1+阅读 · 2015年12月31日

智能电网环境下地理分布式互联网数据中心的能量成本降低方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心网络中延时敏感的传输控制协议

国家自然科学基金

0+阅读 · 2015年12月31日

面向绿色数据中心的高效能分布式储能技术

国家自然科学基金

1+阅读 · 2015年12月31日

面向主动配电网的分布式能源多目标鲁棒经济优化调度

国家自然科学基金

1+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

低保守性自适应鲁棒优化及其在含大规模风电电网调度中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

新能源电力系统多时间尺度动力学特性及其暂态稳定机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员