一是代号Sierra Forest、E核设计的至强6000E系列,包括6700E/6900E;
二是代号Granite Rapids、P核设计的至强6000P系列,包括6900P/6700P/6500P/6300P。
至强6没有采用消费级酷睿P核+E核的异构架构设计,而是分成了两个不同的体系,原因在于服务器、数据中心、网络、边缘等领域的需求是截然不同的。
P核架构的Granite Ridge一如传统至强,针对计算密集型应用、AI负载等需要尽可能高性能的应用做优化。
E核架构的Sierra Forest则面向高密度、可扩展负载等非常在意高能效的应用做优化。
同时,二者在硬件平台、软件开发堆栈上彼此共享,可以说是分工不分家。
【架构技术篇】
为了分出P核、E核两条路,至强6从底层架构到堆叠封装都做了全新的设计,扩展性更强大、更灵活,因此在核心数量上实现了前所未有的飞跃。
四代至强(Sapphire Rapids)是四个对等模块(Tile),五代至强(Emerald Rapids)精简为两个对等模块,但规格显著提升。
至强6调整为一个或多个核心计算模块,搭配固定的两个IO输入输出与互连模块。
不同模块之间采用EMIB封装组合,提供高带宽、低功耗、低延迟的互连通道。
其中,计算模块包含了CPU核心、各级缓存、内存控制器。
它采用最新的Intel 3制造工艺,可以视为酷睿Ultra使用的Intel 4的升级版本,专为至强优化增强。
IO模块包含PCIe、UPI、CXL等连接总线控制器,以及DSA、IAA、QAT、DLB等加速器引擎。
它采用成熟的Intel 7工艺制造,不需要太多的晶体管和太小的面积,也能有效控制成本。
至强6700系列可以视为“基础款”,E核版本也就是6700E系列是单个计算模块,最多144核心(144线程)。
P核版本则有三种配置,顶级的XCC是两个计算模块,最多86核心(192线程);中间的HCC是一个计算模块,最多48核心;然后LCC是一个较小的计算模块,最多16核心。
注意,E核不支持超线程,P核支持超线程,不再一一注明。
至强6900系列则是“加强版”,E核版本的ZCC封装两个计算模块,核心数翻番做到288个(288线程),但要到明年初才能看到,也就是6900E系列。
P核版本的UCC更是三个计算模块,核心数达128个(256线程),今年第三季度推出,成为6900P系列。
【型号规格篇】
至强6是一个庞大的家族,打头阵的时E核设计的基础版至强6700E系列,共有七款不同型号。
旗舰型号至强6780E,144核心(144线程),双路就是288核心,三级缓存108MB(平均每个核心0.75MB),频率并不高,基准只有2.2GHz,全核睿频、单核睿频最高都是3.0GHz,热设计功耗达330W。
内存支持8通道的DDR5-6400,内置加速器DSA、IAA、QAT、DLB都是两个,支持2048个TDX密钥,还有4条UPI 2.0总线、88条PCIe 5.0/CXL 2.0总线。
至强6766E也是144核心,但降低了频率只1.9-2.7GHz,热设计功耗250W。
其他型号就不一一赘述了,包括128/112/96/64个核心,主频最高也不过3.2GHz,三级缓存统一96MB。
热设计功耗205-250W不等,单双路配置、内存频率、加速器数量、UPI总线数量等也做了不同区分。
另外,144/96/64核心的四款型号提供超过7年的超长生命周期支持。
未来产品的具体型号没有公布,但给出了大体规格。
至强6700P P核版本最多86核心,支持1/2/4/8路并行(单系统最多688核心1376线程),内存最高8通道DDR5-8000,热设计功耗最高350W。
至强6900P最多128核心(256线程),但仅支持单双路并行(单系统最多256核心),内存最高12通道DDR5-8800,并提供最多96条PCIe 5.0/CXL 2.0总线、6条UPI 2.0总线,热设计功耗最高可达500W。
至强6900E最多达到空前的288个核心(288线程),内存频率最高只有DDR5-6400,其他和至强6900P基本一致。
【性能对比篇】
接下来就该说说性能了,不过这种产品很难上手实测,只能看看官方宣传数据了。
至强6 E核版本替代的是五年左右之前的老平台,比如二代至强,网络与微服务性能提升最多2.6倍,媒体性能提升最多2.6倍,数据服务性能提升最多2.7倍,网络性能提升最多3.4倍,多媒体转码性能提升最多4.2倍。
至强6 P核版本则面向代际升级,AI性能提升最多2倍,通用计算性能提升最多2倍,HPC高性能计算性能提升最多2.3倍。
当然,考虑到四代至强是去年初发布的,五代至强是去年底发布的,这节奏属实有点太快了。
至强6700E最大的好处就是计算密度非常高,用来取代二代至强,同样的性能下可以将占用空间从220个机架减少到66个。
同时可以节省大量的能耗,官方数据称4年时间可节能8.4万兆瓦,相当于减少3.4万公吨的二氧化碳排放量。
对比竞品AMD EPYC,官方称P核版本的双路至强6 128核心,对比双路EPYC 9654 96核心,AI推理性能领先最多3.7倍。
E核版本的双路至强6756E 128核心,对比双路EPYC 9534 64核心,媒体转码性能领先最多1.3倍。
至强6 E核版本对比二代至强的提升。
至强6 E核版本对比五代至强的提升。
至强6 E核版本对比五代至强的能效提升:综合性能提升18%的同时,40-60%利用率区间的节能效果最好,最多280W。