当前位置：首页 > 科技资讯 > GPU延迟对比：AMD RDNA2完胜NVIDIA安培

GPU延迟对比：AMD RDNA2完胜NVIDIA安培

作者宏煊网络科技

2025-06-03 阅读 0

CPU缓存与内存延迟测试，相信大家都有所耳闻，但是GPU同样的测试却几乎没人做过。

ChipsAndCheese就做了一次特别的测试，对比考察了AMD、NVIDIAGPU架构的缓存、显存迟问题。

首先是AMDRDNA2、NVIDIAAmpere两家最新架构的比拼，代表是RX6900XT、RTX3090，前者在几乎所有阶段都完胜。

RNDA2架构创新性地加入了InfinityCache无限缓存，提升带宽的同时，延迟也可圈可点，二级缓存命中率上只增加了大约20ns的延迟，明显低于Ampere。

更惊人的是，RDNA2显存延迟和Ampere几乎一模一样，但是别忘了，Ampere只有两个层级的缓存，RDNA2却有四个。

Ampere的缓存架构更加传统，SM阵列私有一级缓存到二级缓存要增加超过100ns的延迟，RDNA2从零级缓存到二级缓存则只增加了约66ns。看起来，GA102核心面积过大，也直接增加了延迟。

这正好可以解释AMDRDNA2架构在低分辨率下性能、能效更优秀，因为二级缓存、三级缓存延迟很低，更适合执行较小的负载。Ampere则相反，高负载下优势明显，比如说4K分辨率。

说完了GPU之间的对比，那么GPU、CPU放在一起怎么样呢？这里以RX6900XT、Intel四代酷睿i7-4770为例来看看。

CPU的缓存自然不是一个级别的，所以这里Y轴用了线性数据，可以看到全程大大低于RDNA2，搭配DDR3-1600CL9内存延迟只有63ns，RX6900XT、GDDR6的组合则有226ns，另外末级缓存平均延迟分别是53.42ns、123.2ns。

再看看前几代的NVIDIAGPU，包括Maxwell架构的GTX980Ti、Pascal架构的GTX1080、Turing架构的RTX2060Mobile。

Maxwell、Pascal其实差不多，前者整体略高一些，可能是受制于芯片面积较大、核心频率较低。

Turing则已经有了Ampere的样子，一级缓存延迟低得多，二级差不多，奇怪的是显存延迟在32MB之后偏高，原因未知。

AMD考察了TeraScale架构的HD5850/6950、GCN架构的HD7970，再加上RX6900XT，很明显在逐代降低，而且是各级缓存都在同时进步。

预约SEO专家添加微信号：xxxxxxx 领取免费VIP内部课程

上一篇：NVIDIA规范RTX 30系列显卡销售：严禁商家提前收钱预定

上一篇：AMD 28nm挖掘机库存有多少！映泰还在发布七代APU主板

宏煊网络科技作者

宏煊网络科技是专业科技新媒体网站。网站著眼于新一代科技新闻的全面及时处理报导,让网民在外面第二时间交待全球新一代的科技资讯。内容涵括AI+、互联网、IT、创业投资、核定、区块链、智能硬件等领域

曾操作某大型门户网站日IP达100万（纯SEO流量），拥有上千网站提供SEO友情链接资源（参加培训免费赠送100个单向友情链接），免费赠送附子SEO内部VIP课程，2018年新版实战课程介绍