英特尔刚刚介绍了面向数据中心的 Flex 系列 GPU,旨在与英伟达 A10 展开直接的竞争。由该公司分享的第一方基准测试成绩可知,Flex 系列 GPU 能够在特定工作负载下 —— 比如 8-bit 解码和 HEVC 转码应用程序中 —— 实现五倍于 NVIDIA A10 的性能表现。
(via WCCFTech)
首先,Intel Flex 170 的功耗为 150W,配备 32 个光追单元 / 32 个 Xe-Cores,整体采用了半高 PCIe 扩展卡的外形。
此外该 GPU 加速卡基于单插槽设计的 Xe HPG 架构,具有 2 组媒体引擎,目前英特尔已开始向客户出货。
其次,Intel Flex 140 的功耗为 75W,配备 16 个光追单元 / 16 个 Xe-Cores,同样采用了半高 PCIe 扩展卡的外形。
该 GPU 加速卡也基于单插槽设计的 Xe HPG 架构,具有 4 组媒体引擎,可处理 8k60 @ 12-bit HDR 解码 / 8k @ 10-bit HDR 编码,并且支持 VP9、AVC、HEVC 和 AV1 格式。
基准测试方面,英特尔声称在某些工作负载中可交付 5 倍于 NVIDIA A10 竞品的性能。
在 AVC 8-bit 解码工作负载中,英特尔 Flex 140 数据中心 GPU 可应付 168 路、而 NVIDIA A10 仅为 37 路。
另外 Flex 140 可处理 208 / 218 / 228 路的 HEVC / AV1 / VP9 流,而 NVIDIA A10 只有 81 / 49 / 66 路。
转码性能方面,Intel Flex 140 可在 4K60 性能质量 / H.265 HEVC 转码工作中提供 8 / 1 路支持,并于 1080p60 性能质量预设下实现 36 / 7 路支持。
鉴于 Flex 170 / 140 存在两倍的媒体引擎数量差距,这里可简单推算前者拥有 2.5 倍于 NVIDIA A10 的特定工作负载性能表现。此外与 x264 格式相比,其能够节省 30% 的内容分发成本。
接着聊聊 Flex 系列数据中心 GPU 的云游戏跑分,英特尔重申对云游戏软件堆栈的广泛支持,可在 CPU 和 GPU 上提供无缝的云桌面虚拟化(VDI)运行体验。
虽然这里没有直接拿 NVIDIA A10 进行对比,但 Flex 系列 GPU 还是给我们留下了较为深刻的印象,比如 Flex 170 就支持多达 23 路的《狂野飙车 9:传奇》云游戏流。
然后在 HEVC 和 Resnet50 跑分方面,Intel Flex GPU 领先 NVIDIA A10 多达 35% 。尽管大多数其它基准测试并未直接与竞品对比,但诸多 AI 推理工作负载还是有望为潜在客户提供基准参考。