位于芬兰的 LUMI 超级计算机仍在组装过程中,但项目团队已经介绍了他们的最新进展。据悉,由 AMD 提供技术支撑的这套装置,一共有 2560 个计算节点。每个节点包括一枚 64 核心的 Trento CPU、以及四路 Instinct miMI250X GPU 加速卡。
按照原计划,拥有 375+ PFLOPs 算力的 LUMI 超算本该在 2021 年底前上线。但受供应链短缺的挑战,最新目标已设定在 2022 年中期全面上线。
虽然硬件仍处于组装过程中,但高性能计算(HPC)工程师一直在努力优化开源 Linux 软件堆栈。
作为 CSC 的首席 HPC 科学家,Georgios Markomanolis 曾于去年 2 月发表过一次很棒的演讲。
期间提到了 Radeon Open eCosystem 的现状,以及他们经手的所有移植工作 —— 包括让传统上以 NVIDIA 为中心的 HPC 工作负载,也能够在那时的 AMD 测试硬件上工作。
早期规划使用的是 Instinct MI100 GPU 加速卡,但 LUMI 也在等待 MI250X 的落地成熟。
(图 via Phoronix)
在上周末的 FOSDEM 2022 大会期间,Georgios Markomanolis 又分享了他们在过去一年的开源软件工作新进展。
可知 HPC 工程师们已经对面向 GPU 计算的 AMD ROCm 开源软件堆栈使用得更加技术纯熟。
同时继续在 HIP 上努力将更多 CUDA 代码库移植到 AMD GPU 支持软件中。
然后努力对代码进行微调,以便在 AMD 硬件上顺畅运行。
而在过去一年里被添加到工具包中的新软件组件,值得一提的就包括 AMD 的 GPUFort 开源项目。
其旨在帮助开发者将 OpenACC 和 CUDA Fortran 代码,迁移到以 AMD 为主的架构中。
尽管相关工作仍相当复杂,但通过将相关代码库移植到 AMD ROCm 空间,应用程序可获得最佳的 GPU 性能表现。
最后,对 LUMI 上线运营的具体事务感兴趣的朋友,可移步至 FOSDEM.org 查阅更多正在进行 CSC 开源移植和调优工作。