随着评测解禁,英伟达 GeForce RTX 4090 也被人压榨出了 100 TFLOPs 的算力,成为了迄今性能最为强悍的游戏显卡。作为参考,公版(Founders Edition)显卡的默认性能为 83 TFLOPs(低了 17 TFLOPs),而上一代 GeForce RTX 3090 Ti 更是只有 40 TFLOPs 。
RTX 4090 指导价为 1599 美元 / 12999 RMB
为了达成 100 TFLOPs,WCCFTech 试着解锁功率与温度限制,并将 GPU 核心 / 显存频率分别提升了 +275 / +1100 MHz 。
接着通过 Afterburner 给 GPU 核心加压 +55%,不然可能在 100% 占用率下导致性能滑坡。
然后这张 RTX 4090 显卡的 AD102 GPU 核心飙到了 3150 MHz、最大功耗 547W、最高温度 69℃,而且测试是在风冷条件下实施的、没有使用水冷或液氮散热。
最终我们看到了将近 101 TFLOPs 的神奇数据,较默认状态下提升了 22% 的性能、达到了 RTX 3090 Ti 的 2.5 倍。
此外这枚 AD102 GPU 的 FP32 性能也超过了 50%,将面向数据中心的 Hopper H100 GPU 也抛在了脑后。
相信当 Quadro 专业卡产品线也迎来 Ada Lovelace 架构更新时,我们有望见到 RTX 6000 / L60 成为业内流行的计算 / AI 加速卡。
规格方面,RTX 4090 启用了 144 组 SM 单元中的 128 组 / 16384 个 CUDA 核心,辅以 72MB L2 缓存 / 176 个 ROP 光栅单元。
显存为 24GB @ 384-bit 的 21Gbps GDDR6X,带宽高达 1 TB/s(与 RTX 3090 Ti 一致),TBP 功耗 450W、通过单 16-pin 12VHPWR 接口供电(理论功率上限 600W)。