AMD官宣下代GPU加速卡Instinct MI355X:288GB海量内存 3nm CNDA4全新架构

2024年10月11日 03:43 次阅读 稿源:快科技 条评论

除了正式发布升级版的Instinct MI325X GPU加速卡,AMD还宣布了全新的下一代Instinct MI350系列的首款产品“Instinct MI355X”,并披露了部分规格、性能数据。MI355X将在2025年下半年上市,也就是还有差不多一年时间。

MI350系列将首次升级为台积电3nm工艺,首次采用CDNA 4架构,首次引入FP6、FP4浮点数据类型,搭配内存还是HBM3E但是容量高达288GB。

具体功耗没有披露,但是MI325X已经最高达1000W,AMD也透露MI355X会顺应行业趋势(NVIDIA B200 1000W、GB200 1700W),因此必然会显著超过1000W。

FP6、FP4都属于浮点数据格式,分别代表6位、4位精度,也就是只需6位、4位就能表达一个数字,相比于FP16、F8精度大大降低,但是数据处理量也大大减少,适合大模型的量化,特别是大语言模型和混合专家模型。

如果你不需要太高的精度,更想要速度,FP6、FP4就非常适合。

MI355X上的FP6、FP4浮点性能都是9.2 PFlops(每秒9200万亿次运算),同时还将FP16、FP8性能都提升了80%,分别达到2.3 PFlops、4.6 PFlops。

NVIDIA Blackwell GPU同样引入了FP6、FP4精度,但是性能更高,分别达20 PFlops、40 PFlops。

单卡多达288GB HBM3E内存确实是无可匹敌,同时带宽高达8TB/s。

对比MI325X分别多出1/8、1/3,而相比目前已上市的MI300X都增加了足足50%。

对比竞品,Blackwell B200也只有192GB HBM3E,但带宽同样做到了8TB/s。

MI355X同样支持单平台八卡,这样就有总计2.3TB HBME内存、64TB/s带宽,性能更是高达FP16 18.5 PFlops、FP8 37 PFlops、FP6/FP4 74 PFlops。

它也将在明年下半年供货。

Instinct系列的性能进步幅度无疑是飞跃性的,一代一个新模样,跨代对比更是惊人。

MI355X对比MI300X,FP16性能达到了7.4倍之多,HBM容量也有1.5倍,所能处理的模型参数规模,也从7140亿增加到4.2万亿,足足6倍之多。

展望未来,2026年将推出再下一代的Instinct MI400系列,基于再下一代的CDNA架构(CDNA 5?),规格和性能必将再次迈上一个大大的台阶。

对文章打分

AMD官宣下代GPU加速卡Instinct MI355X:288GB海量内存 3nm CNDA4全新架构

1 (50%)
已有 条意见

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      Top 10

      招聘

      created by ceallan