日前,AMD发布了新一代计算加速卡Instinct MI250、MI250X,基于6nm工艺、CNDA2架构,内部封装两颗GPU、八颗HBM2e,最多14080个计算核心、880个矩阵核心、128GB显存内存。作为AMD的第一款百亿亿次计算级别产品,MI250系列已经得到了很多客户方案,尤其是联合美国能源部的超算“Frontier”,已经整装待发,峰值性能超过150亿亿次。
这就是MI250X加速卡的真容,中间两颗大的芯片自然是MI200计算模块,周边八颗小的就是HBM2e内存,单颗32GB,通过2.5D EFB桥接技术彼此互连。
整卡采用OAM形态,也就是基于开放计算项目(OCP)指定的加速卡模组标准,NVIDIA、Intel也都采纳。
这是1U半高刀片规格的单个节点,集成八块MI250X,另有两颗霄龙处理器,代号“Trento”,基于三代霄龙7003 Milan的定制版,主要加强了Infinity Fabric IO部分,便于控制八路加速卡。
MI250X单卡功耗就有560W,Trento霄龙暂无具体规格估计也在280W左右,那么这一个节点的整体功耗,就在5000W左右,一小时就是5度电,散热上风冷也不够了,全部都是水冷。
而且,这还没算上12通道内存、硬盘、网络等等。
美国的三大百亿亿次超级计算机中,除了AMD Frontier,Intel承接了“Aurora”,采用超过1.8万颗下一代可扩展至强Sapphire Rapids、超过5.4万块全新加速卡Ponte Vecchio,每个节点双路CPU加六路GPU,号称性能超过200亿亿次,但进度最慢。
NVIDIA则利用自己的A100加速卡,联合AMD第三代霄龙,打造了“Polaris”,分别有1120颗、2240块,每个节点双路配四块卡,性能相对最低,但因为都是成熟硬件,进度是最快的,今年年内上线,明年还会升级一次。