GDDR3显卡值得买?显存技术分析与测试
泡泡网显卡频道7月9日 显存对于一款专业游戏显卡来说,重要性不言而喻,显存颗粒体质的好坏同样关乎玩家们超频的乐趣,时代变迁技术发展,曾经的GDDR3和如今的GDDR5到底有哪些性能上的提升呢?为什么常见的中高端游戏显卡配备GDDR5显存,低端显卡有配备GDDR3显存?GDDR5到底强在哪里?两者有何不同?我们带着这些问题走进今天的技术探究。
● GDDR3:一代王者GDDR3源于DDR2技术
无论GDDR还是GDDR2,由于在技术方面与DDR/DDR2并无太大差别,因此最终在频率方面GDDR并不比DDR高太多。在经历了GDDR2的失败之后,两大图形巨头NVIDIA和ATI对JEDEC组织慢如蜗牛般的标准制订流程感到越来越失望,认为他们制定的显存不能适应GPU快节奏的产品更新换代周期,于是NVIDIA和ATI的工作人员积极参与到了JEDEC组织当中,以加速显存标准的起草及制定。
双方一致认为,显存与内存在数据存储的应用方面完全不同,在内存核心频率(电容刷新频率)无法提升的情况下,单纯提高I/O频率来获得高带宽很不现实。因此,必须要有一种针对高速点对点环境而重新定义的I/O接口。于是GDDR3诞生了,这是第一款真正完全为GPU设计的存储器。
GDDR3和GDDR2/DDR2一样,都是4Bit预取架构,GDDR3主要针对GDDR2高功耗高发热的缺点进行改进,并提升传输效率来缓解高延迟的负面影响。
-
点对点DQS,读写无需等待
GDDR2只有一条数据选择脉冲(DQS),是单一双向的,而GDDR3则拥有读与写两条独立的DQS,而且是点对点设计。这样做的好处在于,在读取之后如果马上进行写入时,不必再等DQS的方向转变,由此实现读写操作的快速切换。
相比GDDR2/DDR2,GDDR3的读写切换动作可以少一个时钟周期,如果需要对某一个连续的区块同时读写数据时,GDDR3的速度就要比GDDR2快一倍。
由于存储单元自身的特性,内存颗粒的逻辑Bank是无法同时读写数据的,并不存在“全双工”一说,但GDDR3的这项改进让顺序读写成为可能。GPU本身缓存很小,与显存之间的数据交换极其频繁,读写操作穿插进行,因此GDDR3点对点设计的DQS可以让显存存储效率大增。但对于CPU来说,读写切换并不如GPU那么频繁,而且CPU拥有大容量的二三级缓存,所以GDDR3这种设计并不能极大的提升内存带宽,也没有引入到下一代DDR3当中。
-
改进I/O接口,简化数据处理,控制功耗
同时GDDR3也对I/O控制电路和终结电阻进行了修改,它不再沿用GDDR2的“推式(Push Pull)”接收器,而将其改为虚拟开极逻辑方式(Pseudo Open Drain Logic),并且通过将所有的三相数据信号转移到本位电路上,来简化数据处理,将DC电流压至最小,只有当逻辑LOW移至总线上时才会消费电力,从而很好的控制了功耗和发热。
即便使用了8bit预取技术,可GDDR4还是没有与GDDR3拉开频率差距,因为瓶颈在I/O控制器上面而不是内核,而GDDR5就是用来解决这一瓶颈的。
● GDDR5:恐怖的频率是如何达成的
和GDDR4一样,GDDR5采用了DDR3的8bit预取技术,核心频率显然不是瓶颈,如何提升I/O频率才是当务之急。但GDDR5并没有让I/O频率翻倍,而是使用了两条并行的DQ总线,从而实现双倍的接口带宽。
双DQ总线的结果就是,GDDR5的针脚数从GDDR3/4的136Ball大幅增至170Ball,相应的GPU显存控制器也需要重新设计。GDDR5显存拥有多达16个物理Bank,这些Bank被分为四组,双DQ总线交叉控制四组Bank,达到了实时读写操作,一举将数据传输率提升至4GHz以上!
以往GDDR1/2/3/4和DDR1/2/3的数据总线都是DDR技术(通过差分时钟在上升沿和下降沿各传输一次数据),官方标称的频率X2就是数据传输率,也就是通常我们所说的等效频率。而GDDR5则不同,它有两条数据总线,相当于Rambus的QDR技术,所以官方标称频率X4才是数据传输率。比如HD4870官方显存频率是900MHz,而大家习惯称之为3600MHz。
NVIDIA对于GDDR5当然很感兴趣,但却一点都不着急,保守的NVIDIA决定坚守GDDR3,GTX200核心使用了512Bit显存控制器来提升带宽。比起R600的环形总线,NVIDIA从256Bit到384Bit再到512Bit一步一个脚印走出来的交叉总线显然更加成熟。
以256Bit对抗512Bit,ATI只能将筹码全部押在GDDR5身上,于是在GDDR5标准尚未完全确立之前,ATI已经在紧锣密鼓的测试性能,并督促DRAM厂投产。可以说GDDR5和GDDR2/4一样也是个早产儿,但失败乃成功之母,有了完善的技术规格和制造工艺的支持,GDDR5一出世便令人刮目相看。
我们目前从大部分的显卡身上都可以看到GDDR5显存颗粒的身影,GDDR5在GDDR3/4优秀特性的基础上,还有诸多改进和新特性,下面就对它们进行详细分析。
-
数据和地址总线转位技术:信号质量高、功率消耗少
在1Byte数据中的8个值中,如果超过一半的数值是0,那么GDDR5就会自动执行转位传输,把0变成1、1变成0,通过1个附加的DBI(数据总线转位值)来判定数据流是正位还是反位。GDDR5的这项技术是从GDDR4继承发展而来的。
DRAM在传输数据时,只有0会消耗电能,减少0的传输数量,既能保证信号质量,也能减少内部终结电阻和外部终结电路的功率消耗。GDDR5的地址总线也使用了类似的技术,通过额外的ABI通道来转位数据流,从而较少信号噪声,并降低功耗。
-
智能的可编程I/O控制接口:简化PCB设计和成本
GDDR5对I/O控制器做了很多改进,加入了全新的自动校准引擎,保证GDDR5显存颗粒更好的适应GPU显存控制器的需求,确保数据传输稳定可靠。
自动校准引擎可以监控电压和温度变化,通过校验数据输出驱动器导通电阻与ODT终结电阻值来作出补偿,数据、地址、指令终结电阻都可以被软件或驱动控制。
此外GDDR5还能支持时间延迟和信号强度调整,灵活的协调数据同步,以往通过“蛇形走线”平衡延迟的方法彻底成为历史,GDDR5没有这种顾虑,因此能极大的简化PCB布线和成本,并有利于冲击更高频率。
-
数据遮盖技术:减轻数据总线压力
GDDR5的Burst Length(对相邻存储单元连续进行数据传输的周期数)是8bit,也就是说GDDR5颗粒一次至少要传输256bit数据,但很多时候并不是所有的数据都需要被改写,导致无效的数据传输。
为此,GDDR5使用了一项数据遮盖技术,通过地址线传输保护信息,所有被保护的数据在传输过程中就不会被改写,只有暴露的数据才会被写入新的数据。如此以来,GDDR5的数据线压力减轻不少,功耗发热也得到进一步控制。
-
误差补偿技术:提高传输效率,避免灾难性错误
为了保证数据在高速传输过程中的有效性,GDDR5新增一项错误侦测与修正技术。GDDR5使用了成熟的CRC(循环冗余校验),通过DQ和DBI总线,实时检查错误,第一时间重新发送数据。
这项技术对于高频率传输数据尤为重要,它能有效的减少数据传输错误导致系统崩溃的概率,大幅减少了由超频或高温导致的一系列问题,而且能够一定程度上提升数据传输效率。
-
折叠模式:32bit颗粒当作16bit用
GDDR5作为高端显卡专用的显卡,只有32bit的颗粒。由于GDDR5拥有两条并行的数据总线,这就使得GDDR5的工作模式变得更加灵活,它既可以工作在32bit模式下也可以工作在16bit模式下。这样一个32bit显存控制器就可以控制两颗GDDR5显存,显存容量可以轻松翻倍。
其实,GDDR3/4都可以通过这种方式扩充显存容量,但原理则完全不同。此前必须GPU的显存控制器在设计时支持双Bank模式才能支持更多的显存颗粒。而现在,8颗GDDR5显存总计256bit可以直接被128bit的GPU使用,从而简化了显存控制器设计,HD4770就是很好的例子。
此次测试的显卡主要定位高端,测试时所有游戏中开启全部特效,包括4X抗锯齿(AA)和16X各向异性过滤(AF)。虽然很多游戏提供了更高精度的AA,但由于实用价值不高,且没有可对比性,所以不做测试。
也有部分显示器是(1920x1200),游戏在这种分辨率下的性能表现与1920x1080差不多,FPS稍低一点点,使用这种显示器的朋友依然可以参考我们的测试成绩。
● 测试平台主板:技嘉Z87X-UD3H
Z87X-UD3H就是8系主板中的主力军,这款Intel Z87芯片组的主板采用LGA1150接口,用于搭配第四代酷睿处理器使用。全能是这款产品的最好概括:IR全数字供电方案带来最效率电气性能,两倍铜、两倍金奢华用料保证最坚固品质,全新的BIOS界面、应用中心让技嘉主板有了更多亮点。这款产品之中,足以见证技嘉走上王座的决心。
● 测试平台电源:Antec HCP1200
安钛克Antec HCP1200电源在世界超频大赛中非常常见,通过了80PLUS认证,转换效率高达92.4%,支持4路12V输出,最高电流72A,支持四卡SLI/交火。平均无故障运行时间为10万小时。配备一颗8cm静音风扇,运行噪音极低。
●测试平台SSD:OCZ Vetrx3 240GB
OCZ的Vertex系列属于它的高端固态硬盘,专门为高端玩家和存储发烧友设计。随着Sandforce控制器大红大紫,OCZ也将Vertex系列升级到了全新的SF1200方案。如今SATA3.0 6Gbps接口大行其道,OCZ推出了基于SF2200系列主控芯片的Vertex 3固态硬盘,涵盖60-480GB容量范围。
说了这么多关于两种主流显存颗粒的技术分析,可能有些玩家已经看得很头晕了,不过没关系,技术方面的知识大家了解下就足够了,因为对于我们玩家来说,最重要的是想知道在游戏性能方面两种显存颗粒到底存在多大区别?GDDR5提升到底有多大?ok,下面我们就通过两款同型号显卡在不同显存颗粒下的实测表现来看一看GDDR5和GDDR3他们到底如何。
既然针对平台不同,测试项目自然也相去甚远。三大平台除了PC追求极致性能外,笔记本和平板都受限于电池和移动因素,性能不是很高,因此之前的3Dmark11虽然有三档可选,依然不能准确衡量移动设备的真实性能。
3DMARK主界面
而这次Futuremark为移动平台量身定做了专有测试方案,新一代3DMark三个场景的画面精细程度以及对配置的要求可谓天差地别。
Fire Strike、Cloud Gate、Ice Storm三大场景,他们分别对应当前最热门的三大类型的电脑——台式电脑、笔记本电脑和平板电脑。
GDDR5显存显卡跑分成绩
GDDR3显存显卡跑分成绩
GDDR5显存显卡跑分成绩
GDDR3显存显卡跑分成绩
在3DMark跑分测试中,我们可以明显看出两款显存颗粒的性能差距,FireStrike拉开了500分、Ice Storm相差30000分之多,高下立判。
3DMark11的测试重点是实时利用DX11 API更新和渲染复杂的游戏世界,通过六个不同测试环节得到一个综合评分,藉此评判一套PC系统的基准性能水平。
● 3DMark 11的特色与亮点:
1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面细分、计算着色器、多线程。
2、原生支持64bit,保留32bit:原生64位编译程序,独立的32位、64位可执行文件,并支持兼容模式。
3、新测试场景:总计六个测试场景,包括四个图形测试(其实是两个场景)、一个物理测试、一个综合测试,全面衡量GPU、CPU性能。
4、抛弃PhysX,使用Bullet物理引擎:抛弃封闭的NVIDIA PhysX而改用开源的Bullet专业物理库,支持碰撞检测、刚体、软体,根据ZLib授权协议而免费使用。
上图中我们可以清晰看出,GDDR3确实已经“扛不住”了,3DMark11 P档落后了400多分,显然显存的用料水平已经足以影响一款显卡的性能。反观GDDR5,出色的频率表现已经说明了一切。
这些年我们看到了不少形态各异的劳拉,从丰乳肥臀的动作游戏主角到喜欢探索亚特兰蒂斯文明的睿智贵族。不过我们从未见过这样的劳拉。Crystal Dynamics的《古墓丽影9》让我们看到了一个参加初次探险的年轻劳拉,她遭遇海难被困在刀枪林立的小岛上,必须将自己的智谋和求生欲望提升到极限。
剧情介绍:故事从年少时期的劳拉开始,劳拉所乘坐的“坚忍号”仿佛是被宿命所呼唤,在日本海的魔鬼海遭遇到了台风,不幸搁浅。劳拉也被迫到岛上开始自己的求生经历。
古墓丽影9的游戏画面较之前代上升了不少,游戏要求也提高了不少。
这是我们开启不同画质的游戏截图对比,可以看出“高”特效的画质已经非常不错了。
古墓丽影9使我们玩家都玩过的游戏,实测当中两款显卡的表现基本上差出了一个层级,13帧的差距说明GDDR3的确已经老了。
GDDR5显存颗粒用料可谓是优异的,在低端卡中使用如此用料的厂商多半会将显卡价格抬高一个层级,我们玩家熟悉的EVGA品牌显卡多会采用这样的价格策略,而在使用过程中,与打价格战的显卡产品没有本质上的性能差距,优势也就是毫厘之间,所以我们玩家在挑选低端显卡时还是要注重性价比的。
京东商城出售的GT730 1GD5显卡就具备了这种性价比的优势。
在众多采用GDDR3显存颗粒的低端显卡中,厂家方面的态度还是很有诚意的,随说贵了几十块钱,但是性能提升了一大块,颇具性价比的举措。
之前的技术解析方面也提到了,GDDR5显存颗粒的功耗表现十分突出,性能强功耗低,展现了科技的价值。
GDDR5在硬件指标和性能上全面压制GDDR3,价格又与GDDR3相差无几。所以找不到理由不选GDDR5。可以看到,目前的GDDR5显存颗粒在多个方面存在绝对优势,而在我们比较关心的频率、传输速率、显存带宽、等效频率、封装工艺、功耗、理论成绩、游戏成绩等方面,GDDR5是完胜于上一代的老显存,这个时代还能看到GDDR3显存,绝对是厂家在成本上的妥协,我们玩家需要认清这一点。■