最近,AMD正式发布了第五代Turin EPYC 9005系列,在前四代的扎实基础上,工艺架构、规格性能等各方面立体化升级,再次取得“遥遥领先”。发布会后,快科技采访了AMD服务器部门高管Ravi Kuppuswamy、Madhu Rangarajan等人,对EPYC 9005系列的更深入细节做了一番交流。
首先谈谈EPYC 9005系列的工艺问题。
上一代的EPYC 9004/8004系列,都是基于5/6nm工艺,也就是CCD计算模块是5nm,IOD输入输出模块是6nm。
这一代则升级使用了3/4/6nm三种不同的工艺,其中IOD模块还是6nm(但内部进行了升级),CCD模块首次分为两种:Zen 5版本采用的是4nm,Zen 5c版本采用的是3nm。
为何如此区分?原因其实很简单,更先进的工艺可以让Zen 5c CCD模块在有限的芯片面积内塞入更多模块、更多核心。
Zen 5部分的CCD每个内部还是8核心,但是CCD数量从上代的12个增至16个,得以从最多96核心192线程增至最多128核心256线程。
Zen 5c部分的CCD每个内部依旧是16核心,CCD数量则从8个增至12个,上代的最多128核心256线程,就变成了空前的最多192核心384线程,创下x86处理器新纪录。
其次是架构方面。
上一代EPYC首次引入了Zen 4、Zen 4c两种架构版本,并划分出Genoa EPYC 9004系列、Bergamo 97x4系列两条产品线,后者进一步延伸出了Siena EPYC 8004系列。
新一代EPYC在延续这一设计的同时,也对产品体系做了调整。
EPYC 9005系列进化为Zen 5、Zen 5c两种版本,一如上代,它们俩并非传统的所谓“大小核”,而依然是完全相同的架构、IPC性能、ISA指令集,一二三级缓存总量也相同,唯一的区别还是后者的核心更多,所以其每核心的三级缓存小一些。
事实上,无论Zen 5还是Zen 5c,整颗芯片的最大三级缓存总量是相同的,但由于Zen 5c的每个CCD内拥有两倍于Zen 5的核心数,因此分配到的三级缓存更少一些,每个核心最多32MB。
这么做的好处是Zen 5c可以容纳更多核心,支持更高密度计算,同时与Zen 5共享系统平台,对于操作系统和应用软件来说也不需要特殊的适配和优化,大大降低客户成本,加速普及。
需要强调的是,如果跨CCD访问三级缓存,延迟会变得非常高,大大影响性能,因此AMD没有做三级缓存的跨CCD全共享设计,每一个CCD内的核心只访问自己的三级缓存。
如果仔细看EPYC 9005系列会发现Zen 5、Zen 5c都在其中,没有刻意划分(甚至产品代号都同为“Turin“),不像上代分为不同产品系列。
AMD发言人对此表示,上代的Genoa、Bergamo是分不同时间发布的,但是Zen 5、Zen 5c是同时发布的,基于统一的产品栈,所以它们就是在一起的。
AMD也贴心地提供了详细的产品列表,展示不同的SKU型号,可以看到不同的主频、不同的缓存、不同的功耗。
如果一定要区分也简单,8-72核心的都是Zen 5,144-192核心的都是Zen 5c,96/128核心的编号9x55的为Zen 5、编号9x45的为Zen 5c。
另外,IOD虽然工艺没变,但是内部做了升级,主要是提升了内存控制器、内存速度,以及IOD/CCD核心之间的沟通,可以理解为在I/O物理层与核心之间的互连性能会更好。
但是,AMD并没有在IOD内集成专门的AI加速器,因为AMD发言人表示,这样会增加芯片面积和功耗,也会吃掉内存带宽,如果需要AI加速,用更专业的GPU就好了,比如AMD自家的Instinct MI系列,它们的性能会更好。
AMD发言人说到,GPU拥有每美元的最佳AI性能,而CPU能实现每美元的最佳通用计算性能。