2022年3月,NVIDIA发布了首款数据中心CPU Grace、新一代高性能计算GPU Hopper,同时利用它们打造了两颗“超级芯片”(Super Chip),一是Grace CPU二合一,二是Grace CPU+Hopper GPU二合一,看起来都极为酷炫。现在,足足14个月过去了,NVIDIA终于宣布,GH200 Grace Hopper超级芯片已经全面投产,将为复杂AI、HPC工作负载提供澎湃的动力。
再加上Grace CPU、Hopper GPU、Ada Lovelace GPU、BlueField DPU等全套系统方案,NVIDIA现在已经有400多种配置,可满足市场对生成式AI的激增需求。
欧洲和美国的超大规模云服务商、超算中心,将会成为接入GH200系统的首批客户。
同时,黄仁勋还公布了Grace Hopper的更多细节,尤其是它的CPU、GPU之间使用NVLink-C2C互连技术,总带宽高达900GB/s,相比传统的PCIe 5.0通道超出足足7倍,能够满足要求最苛刻的生成式AI和HPC应用,功耗也降低了超过80%。
Grace CPU拥有72个Armv9 CPU核心,缓存容量198MB,支持LPDDR5X ECC内存,带宽高达1TB/s,还支持PCIe 5.0。
Hopper GPU则采用台积电4nm定制工艺,集成多达800亿个晶体管,号称世界上最先进的芯片,集成18432个CUDA核心、576个Tenor核心、60MB二级缓存,支持6144-bit HBM3/2e高带宽内存。
同时,NVIDIA宣布推出一款新型大内存AI超级计算机“DGX GH200”,可用于开发面向生成式AI语言应用、推荐系统和数据分析工作负载的下一代大模型。
它配备了多达256颗GH200 Grace Hopper超级芯片,彼此NVLink Switch System互相连接,带宽提升48倍以上,对外可作为单个GPU使用,浮点性能高达1PFlops(每秒1千万亿次浮点计算)。
同时还有144TB共享内存,相比2020年的上一代DGX A100增大了近500倍。