The first OpenFOAM HPC Challenge (OHC-1) was organised by the OpenFOAM HPC Technical Committee (HPCTC) to collect a snapshot of OpenFOAM's computational performance on contemporary production hardware and to compare hardware-constrained submissions with software-track optimisations. Participants ran a common incompressible steady-state RANS case, the open-closed cooling DrivAer (occDrivAer) configuration, on prescribed meshes, submitting either with the reference setup (hardware track) or with modified solvers, decomposition strategies, or accelerator offloading (software track). In total, 237 valid datapoints were submitted by 12 contributors: 175 in the hardware track and 62 in the software track. The hardware track covered 25 distinct CPU models across AMD, Intel, and ARM families, with runs spanning from single-node configurations up to 256 nodes (32768 CPU cores). Wall-clock times ranged from 7.8 minutes to 65.7 hours and reported energy-to-solution from 2.1 to 236.9 kWh. Analysis of the hardware track identified a Pareto front of optimal balance between time- and energy-to-solution, and revealed that on-package high-bandwidth memory (HBM) dominates single-node performance for next-generation CPUs. Software-track submissions achieved up to 28% lower energy per iteration, 17% higher maximum performance per node, and 72% shorter minimum time per iteration than the best hardware-track results, with full GPU ports and selective-memory optimisations leading the performance range. This manuscript describes the challenge organisation, the case setup and metrics, and presents the main findings from both tracks together with an outlook for future challenges.


翻译:首届OpenFOAM高性能计算挑战赛(OHC-1)由OpenFOAM高性能计算技术委员会(HPCTC)组织,旨在收集OpenFOAM在当代生产硬件上计算性能的快照,并对比硬件约束提交方案与软件优化方案。参赛者使用预设网格运行标准不可压缩稳态RANS算例——敞开/封闭冷却DrivAer(occDrivAer)构型,可选择提交参考配置方案(硬件赛道)或修改求解器、分解策略及加速器卸载方案(软件赛道)。12位贡献者共提交237个有效数据点:其中硬件赛道175个,软件赛道62个。硬件赛道覆盖AMD、Intel和ARM架构的25种不同CPU型号,运行配置从单节点扩展至256节点(32768个CPU核心)。实测运行时间范围从7.8分钟到65.7小时,能量消耗报告值为2.1至236.9千瓦时。硬件赛道分析确定了时间与能量消耗最优平衡的帕累托前沿,并揭示片上高带宽内存(HBM)是下一代CPU单节点性能主导因素。相较于硬件赛道最优结果,软件赛道提交方案实现每迭代能耗降低28%、单节点最大性能提升17%、单迭代最小时间缩短72%,其中完全GPU端口迁移和选择性内存优化方案处于性能前沿。本文阐述赛事组织架构、算例设置与评价指标,呈现两条赛道的主要发现,并展望未来挑战方向。

0
下载
关闭预览

相关内容

软件(中国大陆及香港用语,台湾作软体,英文:Software)是一系列按照特定顺序组织的计算机数据和指令的集合。一般来讲软件被划分为编程语言、系统软件、应用软件和介于这两者之间的中间件。软件就是程序加文档的集合体。
280页PDF,全方位评估OpenAI o1,Leetcode刷题准确率竟这么高
复杂推理大模型OpenAI o1亮相,数学与代码能力飞跃
专知会员服务
37+阅读 · 2024年9月16日
《OpenAI o1大模型》中英文技术报告,44页pdf
专知会员服务
150+阅读 · 2024年9月15日
OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
专知会员服务
38+阅读 · 2024年9月13日
国家首部《“东数西算”算力报告》发布,
专知会员服务
42+阅读 · 2023年11月15日
【HPC】HPC高性能计算知识: 主要应用场景和软件
产业智能官
22+阅读 · 2019年3月27日
第8弹:从零开始深度学习(Software篇) | 2017 CS231n
AI研习社
41+阅读 · 2017年12月28日
【每月好书】OpenCV算法精解
Python程序员
10+阅读 · 2017年11月21日
推荐|caffe-orc主流ocr算法:CNN+BLSTM+CTC架构实现!
全球人工智能
19+阅读 · 2017年10月29日
YesOfCourse团队在Kaggle文本匹配竞赛中获得优异成绩
中国科学院网络数据重点实验室
10+阅读 · 2017年6月15日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年6月30日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 3月23日
Arxiv
0+阅读 · 2月24日
VIP会员
最新内容
AutoScientists:自组织智能体团队驱动长期科学实验
战略前沿人工智能的再思考(中文)
专知会员服务
2+阅读 · 今天14:53
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
2+阅读 · 今天14:51
“史诗怒火行动”中美军损失的作战飞机
专知会员服务
2+阅读 · 今天14:38
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
5+阅读 · 5月28日
Agent Harness综述:大模型智能体执行器工程全景
专知会员服务
13+阅读 · 5月28日
《基于理论的威慑效能评估》
专知会员服务
8+阅读 · 5月28日
相关VIP内容
相关资讯
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年6月30日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员