Intelligent resource prediction for SAP HANA continuous integration build workloads - 专知论文

会员服务 ·

0

Intelligent resource prediction for SAP HANA continuous integration build workloads

翻译：针对SAP HANA持续集成构建工作负载的智能资源预测

Torsten Mandel,Jonathan Bader,Hanyoung Yoo,Stephan Kraft

Large enterprises often operate extensive Continuous Integration (CI) pipelines on large, heterogeneous compute clusters, where conservative, statically defined resource requirements are used to ensure build reliability. This practice leads to substantial system memory over-allocation, reduced cluster utilization, and increased operational costs. In this paper, we motivate the need for intelligent resource prediction by analyzing over 300,000 historical build executions from a production CI environment with more than one thousand compute nodes. Our analysis shows that, on average, more than 60% of allocated system memory remains unused. We then compare multiple machine learning approaches for predicting build task memory usage, including classification-based methods and regression-based quantile prediction. Our final solution employs a LightGBM-XGBoost quantile regression ensemble optimized to minimize under-allocation while reducing over-provisioning. We integrate this solution into the production CI pipeline via a microservice-based orchestration layer, achieving average memory savings of approximately 36GB per build and reducing under-allocation rates to below 0.3% without negatively impacting build execution times.

翻译：大型企业通常会在大规模异构计算集群上运行复杂的持续集成（CI）流水线，其中采用保守的静态定义资源需求来确保构建可靠性。这种做法会导致系统内存严重过度分配、集群利用率降低以及运营成本增加。本文通过分析拥有超过一千个计算节点的生产CI环境中30余万次历史构建执行，论证了智能资源预测的必要性。分析表明，平均超过60%的已分配系统内存未被使用。随后，我们比较了多种用于预测构建任务内存使用量的机器学习方法，包括基于分类的方法和基于回归的分位数预测。最终方案采用了针对LightGBM-XGBoost分位数回归集成优化，旨在最小化欠分配同时减少过度配置。我们通过基于微服务的编排层将该方案集成到生产CI流水线中，实现了每次构建平均约36GB的内存节省，并将欠分配率降至0.3%以下，且未对构建执行时间产生负面影响。

0

相关内容

构建面向终端的 AI 编程智能体：脚手架、测试环境、上下文工程及实践经验

构建面向终端的 AI 编程智能体：脚手架、测试环境、上下文工程及实践经验

专知会员服务

25+阅读 · 3月8日

【AAAI2026】URaG：面向高效长文档理解的多模态大语言模型统一检索与生成框架

【AAAI2026】URaG：面向高效长文档理解的多模态大语言模型统一检索与生成框架

专知会员服务

15+阅读 · 2025年11月14日

《以任务为中心的建模未来：将集成数字成熟度路径与用户故事框架融入任务工程》最新文献

《以任务为中心的建模未来：将集成数字成熟度路径与用户故事框架融入任务工程》最新文献

专知会员服务

30+阅读 · 2025年10月2日

《大规模供应链中断实时管理中智能决策支持系统的弹性集成》最新295页

《大规模供应链中断实时管理中智能决策支持系统的弹性集成》最新295页

专知会员服务

18+阅读 · 2025年5月9日

《战斗资源分配支持 (CORALS) 持续集成策略》54页技术报告，加拿大国防研究与发展部：通过自动化软件开发、构建、测试、集成和部署过程实现更快的交付

《战斗资源分配支持 (CORALS) 持续集成策略》54页技术报告，加拿大国防研究与发展部：通过自动化软件开发、构建、测试、集成和部署过程实现更快的交付

专知会员服务

22+阅读 · 2022年12月26日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知会员服务

147+阅读 · 2022年11月14日

【AI+军事】附论文+PPT《利用机器学习技术对海军资产进行预测性维护》，西班牙海军等

【AI+军事】附论文+PPT《利用机器学习技术对海军资产进行预测性维护》，西班牙海军等

专知会员服务

58+阅读 · 2022年4月13日

世界经济论坛《利用人工智能加速能源转型》最新发布白皮书，Harnessing Artificial Intelligence to Accelerate the Energy Transition

世界经济论坛《利用人工智能加速能源转型》最新发布白皮书，Harnessing Artificial Intelligence to Accelerate the Energy Transition

专知会员服务

29+阅读 · 2022年4月4日

【AI+招投标策略】普渡大学博士论文《多智能体系统的博弈论建模：在系统工程和采办过程中的应用》，109页PDF

【AI+招投标策略】普渡大学博士论文《多智能体系统的博弈论建模：在系统工程和采办过程中的应用》，109页PDF

专知会员服务

56+阅读 · 2022年4月1日

【O'Reilly TensorFlow Conference 2019】HARP：高效的GPU共享系统（HARP: An efficient and elastic GPU-sharing system），Alibaba | Pengfei Fan，Lingling Jin

【O'Reilly TensorFlow Conference 2019】HARP：高效的GPU共享系统（HARP: An efficient and elastic GPU-sharing system），Alibaba | Pengfei Fan，Lingling Jin

专知会员服务

10+阅读 · 2019年11月13日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

30+阅读 · 2022年11月23日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

专知

19+阅读 · 2022年10月23日

【数字孪生】使用数字孪生体进行预测性维护

【数字孪生】使用数字孪生体进行预测性维护

产业智能官

28+阅读 · 2019年7月22日

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

产业智能官

35+阅读 · 2019年4月30日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

使用 Canal 实现数据异构

使用 Canal 实现数据异构

性能与架构

20+阅读 · 2019年3月4日

【智能制造】德勤：预测性维护和智能工厂

【智能制造】德勤：预测性维护和智能工厂

产业智能官

11+阅读 · 2018年11月27日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

占坑！利用 JenKins 持续集成 iOS 项目时遇到的问题

占坑！利用 JenKins 持续集成 iOS 项目时遇到的问题

DevOps时代

36+阅读 · 2018年7月19日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心资源利用率敏感的编译方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多色集合理论的工艺规划和生产调度集成建模理论与优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

云环境中支持混合并行模式的科学工作流的执行优化

国家自然科学基金

0+阅读 · 2014年12月31日

基于动态作业负荷的混联制造系统预知维护和机会维修方法

国家自然科学基金

2+阅读 · 2014年12月31日

周期性手工装配作业肌肉疲劳预测建模与其装配质量改善

国家自然科学基金

0+阅读 · 2014年12月31日

Adaptive and AI-Augmented Security Testing: A Systematic Survey of Program Analysis, Feedback-Driven Testing, and Hybrid Learning-Based Approaches

Arxiv

0+阅读 · 4月29日

Data Engineering Patterns for Cross-System Reconciliation in Regulated Enterprises: Architecture, Anomaly Detection, and Governance

Arxiv

0+阅读 · 4月16日

GENSERVE: Efficient Co-Serving of Heterogeneous Diffusion Model Workloads

Arxiv

0+阅读 · 4月8日

Measurement of Generative AI Workload Power Profiles for Whole-Facility Data Center Infrastructure Planning

Arxiv

0+阅读 · 4月8日

Intelligent Cloud Orchestration: A Hybrid Predictive and Heuristic Framework for Cost Optimization

Arxiv

0+阅读 · 4月2日

EcoThink: A Green Adaptive Inference Framework for Sustainable and Accessible Agents

Arxiv

0+阅读 · 3月26日

SWARM+: Scalable and Resilient Multi-Agent Consensus for Fully-Decentralized Data-Aware Workload Management

Arxiv

0+阅读 · 3月19日

STRATUS: A Multi-agent System for Autonomous Reliability Engineering of Modern Clouds

Arxiv

0+阅读 · 3月19日

CarbonPATH: Carbon-aware pathfinding and architecture optimization for chiplet-based AI systems

Arxiv

0+阅读 · 3月4日

Workload-Aware Incremental Reclustering in Cloud Data Warehouses

Arxiv

0+阅读 · 2月26日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

4+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

7+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

6+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

8+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

构建面向终端的 AI 编程智能体：脚手架、测试环境、上下文工程及实践经验

构建面向终端的 AI 编程智能体：脚手架、测试环境、上下文工程及实践经验

专知会员服务

25+阅读 · 3月8日

【AAAI2026】URaG：面向高效长文档理解的多模态大语言模型统一检索与生成框架

【AAAI2026】URaG：面向高效长文档理解的多模态大语言模型统一检索与生成框架

专知会员服务

15+阅读 · 2025年11月14日

《以任务为中心的建模未来：将集成数字成熟度路径与用户故事框架融入任务工程》最新文献

《以任务为中心的建模未来：将集成数字成熟度路径与用户故事框架融入任务工程》最新文献

专知会员服务

30+阅读 · 2025年10月2日

《大规模供应链中断实时管理中智能决策支持系统的弹性集成》最新295页

《大规模供应链中断实时管理中智能决策支持系统的弹性集成》最新295页

专知会员服务

18+阅读 · 2025年5月9日

《战斗资源分配支持 (CORALS) 持续集成策略》54页技术报告，加拿大国防研究与发展部：通过自动化软件开发、构建、测试、集成和部署过程实现更快的交付

《战斗资源分配支持 (CORALS) 持续集成策略》54页技术报告，加拿大国防研究与发展部：通过自动化软件开发、构建、测试、集成和部署过程实现更快的交付

专知会员服务

22+阅读 · 2022年12月26日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知会员服务

147+阅读 · 2022年11月14日

【AI+军事】附论文+PPT《利用机器学习技术对海军资产进行预测性维护》，西班牙海军等

【AI+军事】附论文+PPT《利用机器学习技术对海军资产进行预测性维护》，西班牙海军等

专知会员服务

58+阅读 · 2022年4月13日

世界经济论坛《利用人工智能加速能源转型》最新发布白皮书，Harnessing Artificial Intelligence to Accelerate the Energy Transition

世界经济论坛《利用人工智能加速能源转型》最新发布白皮书，Harnessing Artificial Intelligence to Accelerate the Energy Transition

专知会员服务

29+阅读 · 2022年4月4日

【AI+招投标策略】普渡大学博士论文《多智能体系统的博弈论建模：在系统工程和采办过程中的应用》，109页PDF

【AI+招投标策略】普渡大学博士论文《多智能体系统的博弈论建模：在系统工程和采办过程中的应用》，109页PDF

专知会员服务

56+阅读 · 2022年4月1日

【O'Reilly TensorFlow Conference 2019】HARP：高效的GPU共享系统（HARP: An efficient and elastic GPU-sharing system），Alibaba | Pengfei Fan，Lingling Jin

【O'Reilly TensorFlow Conference 2019】HARP：高效的GPU共享系统（HARP: An efficient and elastic GPU-sharing system），Alibaba | Pengfei Fan，Lingling Jin

专知会员服务

10+阅读 · 2019年11月13日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

30+阅读 · 2022年11月23日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

专知

19+阅读 · 2022年10月23日

【数字孪生】使用数字孪生体进行预测性维护

【数字孪生】使用数字孪生体进行预测性维护

产业智能官

28+阅读 · 2019年7月22日

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

产业智能官

35+阅读 · 2019年4月30日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

使用 Canal 实现数据异构

使用 Canal 实现数据异构

性能与架构

20+阅读 · 2019年3月4日

【智能制造】德勤：预测性维护和智能工厂

【智能制造】德勤：预测性维护和智能工厂

产业智能官

11+阅读 · 2018年11月27日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

占坑！利用 JenKins 持续集成 iOS 项目时遇到的问题

占坑！利用 JenKins 持续集成 iOS 项目时遇到的问题

DevOps时代

36+阅读 · 2018年7月19日

相关论文

Adaptive and AI-Augmented Security Testing: A Systematic Survey of Program Analysis, Feedback-Driven Testing, and Hybrid Learning-Based Approaches

Arxiv

0+阅读 · 4月29日

Data Engineering Patterns for Cross-System Reconciliation in Regulated Enterprises: Architecture, Anomaly Detection, and Governance

Arxiv

0+阅读 · 4月16日

GENSERVE: Efficient Co-Serving of Heterogeneous Diffusion Model Workloads

Arxiv

0+阅读 · 4月8日

Measurement of Generative AI Workload Power Profiles for Whole-Facility Data Center Infrastructure Planning

Arxiv

0+阅读 · 4月8日

Intelligent Cloud Orchestration: A Hybrid Predictive and Heuristic Framework for Cost Optimization

Arxiv

0+阅读 · 4月2日

EcoThink: A Green Adaptive Inference Framework for Sustainable and Accessible Agents

Arxiv

0+阅读 · 3月26日

SWARM+: Scalable and Resilient Multi-Agent Consensus for Fully-Decentralized Data-Aware Workload Management

Arxiv

0+阅读 · 3月19日

STRATUS: A Multi-agent System for Autonomous Reliability Engineering of Modern Clouds

Arxiv

0+阅读 · 3月19日

CarbonPATH: Carbon-aware pathfinding and architecture optimization for chiplet-based AI systems

Arxiv

0+阅读 · 3月4日

Workload-Aware Incremental Reclustering in Cloud Data Warehouses

Arxiv

0+阅读 · 2月26日

相关基金

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心资源利用率敏感的编译方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多色集合理论的工艺规划和生产调度集成建模理论与优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

云环境中支持混合并行模式的科学工作流的执行优化

国家自然科学基金

0+阅读 · 2014年12月31日

基于动态作业负荷的混联制造系统预知维护和机会维修方法

国家自然科学基金

2+阅读 · 2014年12月31日

周期性手工装配作业肌肉疲劳预测建模与其装配质量改善

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员