Big Data Workload Profiling for Energy-Aware Cloud Resource Management - 专知论文

会员服务 ·

0

负载 · 大数据 · 能耗感知 · 云资源管理 · 调度 ·

Big Data Workload Profiling for Energy-Aware Cloud Resource Management

翻译：面向能耗感知的云资源管理的大数据负载剖析

Milan Parikh,Aniket Abhishek Soni,Sneja Mitinbhai Shah,Ayush Raj Jha

from arxiv, 10 pages, 3 figures. Accepted and presented at the 2026 International Conference on Data Analytics for Sustainability and Engineering Technology (DASET 2026), Track: Big Data and Machine Learning Applications

Cloud data centers face increasing pressure to reduce operational energy consumption as big data workloads continue to grow in scale and complexity. This paper presents a workload aware and energy efficient scheduling framework that profiles CPU utilization, memory demand, and storage IO behavior to guide virtual machine placement decisions. By combining historical execution logs with real time telemetry, the proposed system predicts the energy and performance impact of candidate placements and enables adaptive consolidation while preserving service level agreement compliance. The framework is evaluated using representative Hadoop MapReduce, Spark MLlib, and ETL workloads deployed on a multi node cloud testbed. Experimental results demonstrate consistent energy savings of 15 to 20 percent compared to a baseline scheduler, with negligible performance degradation. These findings highlight workload profiling as a practical and scalable strategy for improving the sustainability of cloud based big data processing environments.

翻译：随着大数据工作负载的规模和复杂性持续增长，云数据中心面临着降低运营能耗的日益增长的压力。本文提出了一种负载感知且高能效的调度框架，该框架通过剖析CPU利用率、内存需求和存储IO行为来指导虚拟机放置决策。通过将历史执行日志与实时遥测数据相结合，所提出的系统能够预测候选放置方案对能耗和性能的影响，并在保证服务等级协议合规性的同时实现自适应整合。该框架通过部署在多节点云测试平台上的代表性Hadoop MapReduce、Spark MLlib和ETL工作负载进行评估。实验结果表明，与基线调度器相比，该系统能实现15%至20%的稳定节能，且性能下降可忽略不计。这些发现凸显了负载剖析作为一种实用且可扩展的策略，对于提升基于云的大数据处理环境的可持续性具有重要意义。

0

相关内容

【干货书】高性能大数据计算，275页pdf

【干货书】高性能大数据计算，275页pdf

专知会员服务

81+阅读 · 2023年1月3日

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

专知会员服务

46+阅读 · 2022年5月27日

【开放书】《大数据价值的要素》，411页pdf，Elements of big data value

【开放书】《大数据价值的要素》，411页pdf，Elements of big data value

专知会员服务

27+阅读 · 2022年3月24日

大数据存储技术综述

专知会员服务

18+阅读 · 2020年11月8日

【2020新书】数据工程师的指南：Azure存储、流媒体和批处理分析，450页pdf

【2020新书】数据工程师的指南：Azure存储、流媒体和批处理分析，450页pdf

专知会员服务

21+阅读 · 2020年10月31日

网络流量监测与分析大数据综述，A Survey on Big Data for Network Traffic Monitoring and Analysis

网络流量监测与分析大数据综述，A Survey on Big Data for Network Traffic Monitoring and Analysis

专知会员服务

65+阅读 · 2020年3月5日

【大规模数据系统，552页ppt】Large-scale Data Systems

【大规模数据系统，552页ppt】Large-scale Data Systems

专知会员服务

61+阅读 · 2019年12月21日

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

专知会员服务

14+阅读 · 2019年11月8日

【电子书】现代大数据算法（Modern Big Data Algorithms）52页PDF免费下载

【电子书】现代大数据算法（Modern Big Data Algorithms）52页PDF免费下载

专知会员服务

23+阅读 · 2019年11月7日

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

专知会员服务

19+阅读 · 2019年11月5日

《2021—2022中国大数据产业发展报告》

《2021—2022中国大数据产业发展报告》

专知

13+阅读 · 2022年1月23日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

36大数据

13+阅读 · 2019年3月20日

【工业大数据】工业大数据分析处理技术与应用

【工业大数据】工业大数据分析处理技术与应用

产业智能官

29+阅读 · 2019年2月2日

【大数据】大数据参考架构和关键技术（综合）

【大数据】大数据参考架构和关键技术（综合）

产业智能官

14+阅读 · 2018年11月22日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

【工业大数据】35页PPT讲解：工业大数据特点、价值及其计算

【工业大数据】35页PPT讲解：工业大数据特点、价值及其计算

产业智能官

10+阅读 · 2018年1月20日

【工业大数据】一文带你读懂《工业大数据白皮书》

【工业大数据】一文带你读懂《工业大数据白皮书》

产业智能官

14+阅读 · 2018年1月20日

【工业互联网】工业互联网与工业大数据分析的应用

【工业互联网】工业互联网与工业大数据分析的应用

产业智能官

12+阅读 · 2017年12月26日

管理决策大数据分析方法与关键技术

国家自然科学基金

8+阅读 · 2015年12月31日

云存储系统中节能关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

智能电网环境下地理分布式互联网数据中心的能量成本降低方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向绿色数据中心的高效能分布式储能技术

国家自然科学基金

1+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

多数据中心环境中科学大数据应用的数据布局与执行优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

大数据高效能存储与管理方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向大数据计算的高吞吐量众核处理器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

TENORAN: Automating Fine-grained Energy Efficiency Profiling in Open RAN Systems

Arxiv

0+阅读 · 2月13日

On the Power Saving in High-Speed Ethernet-based Networks for Supercomputers and Data Centers

Arxiv

0+阅读 · 2月13日

Performance Cost Tradeoffs in Intelligent Load Balancing for Multi Data Center Cloud Systems: From Static Policies to Adaptive Resource Distribution

Arxiv

0+阅读 · 2月10日

Adaptive AI-based Decentralized Resource Management in the Cloud-Edge Continuum

Arxiv

0+阅读 · 2月6日

Data analysis of cloud virtualization experiments

Arxiv

0+阅读 · 2月5日

ECORE: Energy-Conscious Optimized Routing for Deep Learning Models at the Edge

Arxiv

0+阅读 · 2月3日

Harnessing Flexible Spatial and Temporal Data Center Workloads for Grid Regulation Services

Arxiv

0+阅读 · 2月2日

Artifact for Service-Level Energy Modeling and Experimentation for Cloud-Native Microservices

Arxiv

0+阅读 · 1月23日

Online Rack Placement in Large-Scale Data Centers: Online Sampling Optimization and Deployment

Arxiv

0+阅读 · 1月16日

Coordinated Cooling and Compute Management for AI Datacenters

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

云资源管理

最新内容

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

8+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

6+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

7+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

11+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

19+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

相关VIP内容

【干货书】高性能大数据计算，275页pdf

【干货书】高性能大数据计算，275页pdf

专知会员服务

81+阅读 · 2023年1月3日

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

专知会员服务

46+阅读 · 2022年5月27日

【开放书】《大数据价值的要素》，411页pdf，Elements of big data value

【开放书】《大数据价值的要素》，411页pdf，Elements of big data value

专知会员服务

27+阅读 · 2022年3月24日

大数据存储技术综述

专知会员服务

18+阅读 · 2020年11月8日

【2020新书】数据工程师的指南：Azure存储、流媒体和批处理分析，450页pdf

【2020新书】数据工程师的指南：Azure存储、流媒体和批处理分析，450页pdf

专知会员服务

21+阅读 · 2020年10月31日

网络流量监测与分析大数据综述，A Survey on Big Data for Network Traffic Monitoring and Analysis

网络流量监测与分析大数据综述，A Survey on Big Data for Network Traffic Monitoring and Analysis

专知会员服务

65+阅读 · 2020年3月5日

【大规模数据系统，552页ppt】Large-scale Data Systems

【大规模数据系统，552页ppt】Large-scale Data Systems

专知会员服务

61+阅读 · 2019年12月21日

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

专知会员服务

14+阅读 · 2019年11月8日

【电子书】现代大数据算法（Modern Big Data Algorithms）52页PDF免费下载

【电子书】现代大数据算法（Modern Big Data Algorithms）52页PDF免费下载

专知会员服务

23+阅读 · 2019年11月7日

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

专知会员服务

19+阅读 · 2019年11月5日

热门VIP内容

开通专知VIP会员享更多权益服务

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

相关资讯

《2021—2022中国大数据产业发展报告》

《2021—2022中国大数据产业发展报告》

专知

13+阅读 · 2022年1月23日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

36大数据

13+阅读 · 2019年3月20日

【工业大数据】工业大数据分析处理技术与应用

【工业大数据】工业大数据分析处理技术与应用

产业智能官

29+阅读 · 2019年2月2日

【大数据】大数据参考架构和关键技术（综合）

【大数据】大数据参考架构和关键技术（综合）

产业智能官

14+阅读 · 2018年11月22日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

【工业大数据】35页PPT讲解：工业大数据特点、价值及其计算

【工业大数据】35页PPT讲解：工业大数据特点、价值及其计算

产业智能官

10+阅读 · 2018年1月20日

【工业大数据】一文带你读懂《工业大数据白皮书》

【工业大数据】一文带你读懂《工业大数据白皮书》

产业智能官

14+阅读 · 2018年1月20日

【工业互联网】工业互联网与工业大数据分析的应用

【工业互联网】工业互联网与工业大数据分析的应用

产业智能官

12+阅读 · 2017年12月26日

相关论文

TENORAN: Automating Fine-grained Energy Efficiency Profiling in Open RAN Systems

Arxiv

0+阅读 · 2月13日

On the Power Saving in High-Speed Ethernet-based Networks for Supercomputers and Data Centers

Arxiv

0+阅读 · 2月13日

Performance Cost Tradeoffs in Intelligent Load Balancing for Multi Data Center Cloud Systems: From Static Policies to Adaptive Resource Distribution

Arxiv

0+阅读 · 2月10日

Adaptive AI-based Decentralized Resource Management in the Cloud-Edge Continuum

Arxiv

0+阅读 · 2月6日

Data analysis of cloud virtualization experiments

Arxiv

0+阅读 · 2月5日

ECORE: Energy-Conscious Optimized Routing for Deep Learning Models at the Edge

Arxiv

0+阅读 · 2月3日

Harnessing Flexible Spatial and Temporal Data Center Workloads for Grid Regulation Services

Arxiv

0+阅读 · 2月2日

Artifact for Service-Level Energy Modeling and Experimentation for Cloud-Native Microservices

Arxiv

0+阅读 · 1月23日

Online Rack Placement in Large-Scale Data Centers: Online Sampling Optimization and Deployment

Arxiv

0+阅读 · 1月16日

Coordinated Cooling and Compute Management for AI Datacenters

Arxiv

0+阅读 · 1月13日

相关基金

管理决策大数据分析方法与关键技术

国家自然科学基金

8+阅读 · 2015年12月31日

云存储系统中节能关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

智能电网环境下地理分布式互联网数据中心的能量成本降低方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向绿色数据中心的高效能分布式储能技术

国家自然科学基金

1+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

多数据中心环境中科学大数据应用的数据布局与执行优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

大数据高效能存储与管理方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向大数据计算的高吞吐量众核处理器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员