Deploying complex, distributed scientific workflows across diverse HPC sites is often hindered by site-specific dependencies and complex build environments. This paper investigates the design and performance of portable HPC container images capable of encapsulating MPI- and CUDA-enabled software stacks without sacrificing bare-metal performance. This work is part of recent work performed within the EBRAINS Research Infrastructure, to evaluate the implementation of portable HPC (Apptainer-based) container images targeting the EBRAINS Software Distribution (ESD) -- a Spack-based software ecosystem comprising approximately 80 top-level packages (and 800 dependencies). We evaluate a hybrid, PMIx-based containerization strategy using Apptainer that seamlessly bypasses the need for site-specific builds by dynamically leveraging host-level specialized hardware, such as network interfaces and GPUs, on two production HPC clusters: Karolina and Jureca-DC. We demonstrate the feasibility of building portable, MPI- and CUDA-enabled scientific software into container images that correctly leverage site-installed drivers and hardware to reproduce bare-metal communication behavior. Using communication microbenchmarks (e.g., OSU and NCCL) alongside performance metrics of applications from neuroscience, we measure and verify their performance against bare-metal deployments. Crucially, our verification approach extends beyond top-level runtime measurements; we highlight the analysis of underlying debug logs to actively detect misbehavior and misconfigurations, such as suboptimal transport pathways. Ultimately, this investigation demonstrates the feasibility of a simple and reproducible methodology for decoupling software environments from underlying infrastructures, paving the way for automated pipelines that ensure optimized, performance-verified execution across varied HPC architectures.


翻译:在多样化的高性能计算站点间部署复杂分布式科学工作流,常受限于站点特定的依赖项和复杂的构建环境。本文研究了可移植高性能计算容器镜像的设计与性能,该镜像能够封装支持MPI和CUDA的软件栈,同时不牺牲裸机性能。本研究是近期在EBRAINS研究基础设施内开展的工作的一部分,旨在评估针对EBRAINS软件分发平台的可移植高性能计算(基于Apptainer)容器镜像的实现——该平台是一个基于Spack的软件生态系统,包含约80个顶层软件包(及800个依赖项)。我们在两个生产级高性能计算集群(Karolina和Jureca-DC)上,评估了一种基于PMIx的混合容器化策略,该策略通过Apptainer动态利用主机层专用硬件(如网络接口和GPU),从而无缝规避了对站点特定构建的需求。我们证明了将支持MPI和CUDA的科学软件构建到容器镜像中的可行性,这些镜像能正确利用站点安装的驱动程序和硬件,复现裸机通信行为。通过使用通信微基准测试(如OSU和NCCL)以及神经科学应用的性能指标,我们测量并验证了其相对于裸机部署的性能。关键的是,我们的验证方法超越了顶层运行时测量;我们强调通过分析底层调试日志来主动检测异常行为和配置错误,例如次优传输路径。最终,本研究证明了一种简单且可复现的方法论在实现软件环境与底层基础设施解耦方面的可行性,为建立自动化流程铺平了道路,从而确保在多样化的高性能计算架构上实现经过性能验证的优化执行。

0
下载
关闭预览

相关内容

软件(中国大陆及香港用语,台湾作软体,英文:Software)是一系列按照特定顺序组织的计算机数据和指令的集合。一般来讲软件被划分为编程语言、系统软件、应用软件和介于这两者之间的中间件。软件就是程序加文档的集合体。
《中国绿色算力发展研究报告(2024年)》,81页pdf
专知会员服务
31+阅读 · 2024年7月14日
《“边缘计算+”技术白皮书》,82页pdf
专知
11+阅读 · 2022年8月28日
分布式智能计算系统前沿
中国计算机学会
19+阅读 · 2019年10月8日
浅谈 Kubernetes 在生产环境中的架构
DevOps时代
11+阅读 · 2019年5月8日
【HPC】HPC高性能计算知识: 主要应用场景和软件
产业智能官
22+阅读 · 2019年3月27日
【边缘智能】边缘计算驱动的深度学习加速技术
产业智能官
20+阅读 · 2019年2月8日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
最新“指挥控制”领域出版物合集(16份)
专知会员服务
5+阅读 · 4月12日
面向军事作战需求开发的人工智能(RAIMOND)
专知会员服务
12+阅读 · 4月12日
远程空中优势:新一代超视距导弹的兴起
专知会员服务
2+阅读 · 4月12日
大语言模型溯因推理的统一分类学与综述
专知会员服务
2+阅读 · 4月12日
相关VIP内容
《中国绿色算力发展研究报告(2024年)》,81页pdf
专知会员服务
31+阅读 · 2024年7月14日
相关资讯
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员