凭借英特尔 Ponte Vecchio 硬件,Aurora 超级计算机终于突破了超大规模障碍,实现了最高的人工智能性能。由英特尔支持的"极光"(Aurora)超级计算机计算能力达到 1.01 Exaflops,人工智能能力达到 10.6 Exaflops,系统达到满负荷运行状态。
由英特尔、阿贡国家实验室(Argonne National Laboratory)和HPE合作研发的Aurora超级计算机以585.34 petaflops的部分系统运行速度排名第二。阿贡的早期科学计划取得了重大进展,该计划重点关注科学研究中的高性能计算和人工智能应用。图为安装团队成员在阿贡国家实验室的众多机架中穿行。(图片来源:阿贡国家实验室)
Aurora超级计算机部署在阿贡国家实验室,由惠普企业公司(HPE)合作建造,有望成为高性能计算和人工智能领域表现最出色的产品之一。该平台由英特尔至强 CPU Max 和数据中心 GPU Max 系列提供支持,与AMD 展开了激烈的竞争,后者成功地率先突破了Exaflops关卡。与此同时,尽管早在 2019 年就宣布了 Aurora 超级计算机,但它几乎没能达到预期目标,但如今,该系统的运行能力已达到 87%,即总共 9234 个节点。
在规格方面,Aurora 超级计算机由 166 个机架组成,其中包括 10624 个刀片服务器、21248 个英特尔至强 CPU Max 芯片(第四代)和 63744 个英特尔数据中心 GPU Max 系列单元(Ponte Vecchio)。它基于 HPE slingshot 光纤架构进行互连,使用 84992 个端点。
在性能指标方面,Aurora 超级计算机在 HPL LINPACK 基准测试中名列第二,但仅用了总节点容量的 87%(9234 个节点对 10624 个节点)就达到了 1.012 exaflops,成功突破了1 Exaflops障碍。在 HPCG 测试中,该系统也以 5612 TFLOPs/second 的成绩排名第三,仅使用了系统的 39%。
利用 Xe 核心架构及其多个人工智能硬件模块,曙光超级计算机目前在人工智能性能排行榜上名列第一,额定总性能为 10.6 AI Exaflops。该性能使用 LINPACK 混合精度(HPL-MxP)基准进行测量。
采用英特尔至强CPU Max系列和英特尔数据中心GPU Max系列技术部署的新型超级计算机彰显了英特尔推进高性能计算和人工智能的目标。这些系统包括欧洲-地中海气候变化中心(CMCC)的Cassandra,用于加速气候变化建模;意大利国家新技术、能源和可持续经济发展局(ENEA)的CRESCO 8,用于实现核聚变能源的突破;德克萨斯高级计算中心 (TACC),该中心已全面投入使用,可对超音速湍流进行生物数据分析,并对多种材料进行原子模拟;以及英国原子能管理局 (UKAEA),用于解决未来核聚变发电厂设计中的内存约束问题。
混合精度人工智能基准测试的结果将为英特尔面向人工智能和高性能计算的下一代 GPU(代号为 Falcon Shores)奠定基础。Falcon Shores将利用下一代英特尔Xe架构和英特尔高迪的最佳性能。这种集成实现了统一的编程接口。
英特尔至强6的早期性能结果显示,与上一代产品相比, 配备P核和多路复用器组合级(MCR)内存(8800 MT/s)的实际高性能计算应用(如欧洲海洋建模核心(NEMO))的性能提高了2.3倍,为成为高性能计算解决方案的首选主机CPU奠定了坚实的基础。