256位宽逐鹿中端!千元级显卡另类评测
泡泡网显卡频道6月13日 与现在一个指甲盖大小的芯片就能装下整个图书馆的信息不同,在计算机诞生初期存贮信息可是不折不扣的“体力活”,当时还不存在内存条的概念,最早的“内存”是以磁芯的形式排列在线路上,每个磁芯与晶体管组成的一个双稳态电路作为一比特(BIT)的存储器,每一比特都要有玉米粒大小,这意味着一间的机房只能容纳区区数百k字节的容量。
大规模集成电路的出现让这种情况得到终结,随着制造工艺的科技化,出现了焊接在主板上集成内存芯片,以内存芯片的形式为计算机的运算提供直接支持。
而随着显卡性能的不断进化,内存颗粒直接当做显存使用慢慢变得不合时宜,无论如何修补优化,显存频率和位宽终究成了显卡巨大的瓶颈。
在过去的十几年时间里,DirectX已经稳步成为微软Windows平台上进行游戏开发首选API。每一代DirectX都带来对新的图形硬件特性的支持,每次版本变更都能帮助游戏开发者们迈出惊人的一步。就拿近几年来说,DX9C、DX10及相关显卡的发布都带来了令人惊讶的游戏画面,给与玩家非常好的游戏体验。
尤其是Microsoft发布的DirectX 10、11代表了自从可编程Shader出现以来在3D API方面的最巨大的进步。通过一番脱胎换骨般的重建,DirectX 10、11展现出一系列非常醒目的新特性,包括高度优化的运行时,强大的Geometry Shader,纹理数组,曲面细分等等;这些特性将引领PC实时三维图形进入一个全新的世界。Crysis惊艳的画面让玩家耳目一新,而新的DX11游戏更是达到了画面的巅峰,显卡实时渲染出来的人物及风景效果足以媲美照片、CG动画甚至电影,让人叹为观止!
与此同时,这些新游戏的要求自然也不低,就拿DirectX 10 Shader model 4.0来说,新版本的临时寄存器由DX9C的32个扩充到了4096个,将常量寄存器由原来的256个扩充到了65536个!在每个纹理阵列中,最多可以保存512张同样大小的纹理,而且每张贴图的分辨率被扩展到了8192×8192。更大的分辨率意味着画面中更丰富的纹理细节,也意味着要占用更多的显存空间。
而让显存位宽越来越拮据的最重要推手是显示器的进化。两年前,不少高端显示器还在使用1080P分辨率,但面板工艺的不断进步让更高分辨率的显示器逐渐走向消费级市场。2560X1440或者2560X1600分辨率的显示器比比皆是,4K甚至8K显示器也一一亮相。
表现在3D游戏中,不同分辨率和画质设定所产生的纹理数据变化非常大,在使用高分辨率、全屏抗锯齿、各项异性过滤以及HDR的情况下,超大的纹理数据会占用大量的显存空间,假如纹理缓存不够用,要么重新清空显存后继续加载数据,要么调用速度较慢的系统内存充当显存,不管怎样都会对3D性能造成很大影响,出现FPS下降甚至画面停顿的现象。分辨率成倍的增加对显存的容量好吞吐量都提出了更高的要求。
● 内存、显存位宽——SDR/DDR1/2/3单条内存都是64bit
显存控制器集成在GPU内部,理论上位宽可以无限提升,但受制因素较多:高位宽对PCB布线提出严格要求,显存颗粒及芯片设计也必须作相应的调整。可谓是牵一发而动全身,所以技术难度不大,成本却难以控制,所以多年来硬件其它参数一再突破,显存位宽基本上墨守成规,停滞不前。
● GDDR5折叠模式:32bit颗粒当作16bit用
GDDR5作为高端显卡专用的显卡,只有32bit的颗粒。由于GDDR5拥有两条并行的数据总线,这就使得GDDR5的工作模式变得更加灵活,它既可以工作在32bit模式下也可以工作在16bit模式下。这样一个32bit显存控制器就可以控制两颗GDDR5显存。
其实,GDDR3/4都可以通过这种方式扩充显存容量,但原理则完全不同。此前必须GPU的显存控制器在设计时支持双Bank模式才能支持更多的显存颗粒。GDDR5的这种特性让cost down有利可图。
目前NVIDIA低端产品通常采用128bit位宽设计,中端采用128bit-192bit位宽设计,256bit位宽的显卡有GTX 670、GTX 680等,最便宜的也要两千多元。而AMD采用256bit位宽设计的中端主流Radeon HD7850的零售价格已经跌至千元左右。
显存到底对游戏性能有多大的影响?下面我们通过测试说明。测试时所有游戏中开启全部特效,包4X抗锯齿(AA)和16X各向异性过滤(AF)。虽然很多游戏提供了更高精度的AA,但由于实用价值不高,且没有可对比性,所以不做测试。
分辨率测目前主流的1920x1080。目前也有部分显示器是(1920x1200),游戏在这种分辨率下的性能表现与1920x1080差不多,FPS稍低一点点,使用这种显示器的朋友依然可以参考我们的测试成绩。
参测显卡:迪兰HD7850 酷能+ 2G DC
酷能+DC中的DC为DualCool的缩写,中文名为倍酷,从名称上可以很直接的了解其含义:双风扇散热系统。以这次评测的HD7850为例,我们将HD7850酷能+2GB和HD7850酷能+DC 2G进行比较,其主要差异就在于散热器的变化:风扇数量由1个变成2个:
基于PWM控制的智能4-pin散热风扇,可以根据显卡运行状态自主调节转速,完美平衡散热效能和噪音水平,为用户提供非常好的应用体验。
3根6mm全铜U形热管提供了出众的散热效能,可以有效带走GPU表面的过多热量。升级为双风扇散热器让迪兰酷能+倍酷系列显卡综合散热性能提升20%,同时噪音降低15%。超高效率的“倍酷”双风扇散热设计进一步优化空气流通,有效带走热管及散热鳍片上的多余热量。
迪兰HD7850酷能+DC 2G版采用红色的PCB,PCB的颜色并不会影响到产品性能,完全是出于外观的考虑。做为专业的A卡制造商,迪兰选择了最能代表AMD的红色。
视频输出接口采用了DVI+HDMI+DP的组合
测试说明:显存位宽和频率有所不同,一款显卡出厂时位宽多少就已经固定无法改变,所以我们并不能直接了当的测试显存位宽对显卡性能的影响,但通过相似显卡的测试,我们可以从侧面印证。
●测试一:不同显存类型对游戏性能的影响
大家都知道gDDR3和GDDR5对显卡性能的影响非常大,因为显存带宽的不同,同样核心的显卡在同一款游戏中有着截然不同的表现。
gDDR3和真正GDDR5显存的显卡性能差距非常明显
● 测试二:位宽不同对游戏性能的影响
GTX 650Ti BOOST相比GTX 650Ti,除了频率稍高,最大的亮点就是显存位宽从128bit增加到192bit,性能大幅增加,而HD7850 256bit的位宽则在高特效、大分辨率下更具优势。
总结:
由于成本的制约,长期以来,256bit显存位宽只有高端显卡才可拥有,而在HD7000时代,现在只需千元就可以选购到256bit位宽的产品,高显存位宽提供更高的显存带宽,在单位时间处理大量的像素渲染时就不会出现小带宽导致的数据拥堵问题,越是大的分辨率,越是超高的特效,对显存吞吐量就提出了越高的要求,显卡位宽对游戏性能的影响也就越大。在游戏画面日益逼真的今天,Radeon HD7850在性价比方面的优势逐渐显现,相信不久的将来会有越来越多的千元256bit显卡出现!
上面说到的一些专业术语可能初学者看不太明白,这里解释一下关于显存的专业术语。
● 规格:16M×32Bit是什么意思?
当您浏览网站或者查看显卡规格时,往往都会看到类似“某某显卡使用了4颗16M×32Bit的GDDR3显存”这样的文字,这其中16M×32Bit就是该显存颗粒的主要规格,是国际统一的命名标准,可以到存储厂商官方网站上查到。
不少资料中表述16M×32Bit,16M表示显存存储单元的容量为16Mbit,小编经过查证发现这种说法是翻译错误,事实上16M是指显存(内存)颗粒中拥有的Bank数量,而32Bit则是每Bank的位宽或者说容量。这样一来显存颗粒的容量算法就很好理解了。
● 容量:单颗显存容量=存储单元数量×每单元数据位宽/8
以最常见的16M×32bit GDDR3显存为例,16×32/8=64MB,一颗显存就是64MB的容量,那么这块显卡用了4颗显存就组成了256MB。
很多人可能会纳闷上面的公式中为何要除以8,因为官方规格中的16M的单位是Megabit(兆位)而不是MegaByte(兆字节),它两之间的换算需要除以8。
● 速度:显存理论频率=1000/时钟周期×2
大家常说某某显卡采用了1.4ns颗粒,另一个显卡用了更快的1.2ns颗粒,超频更猛等等……这个1.2ns就是显存的时钟周期,同样的我们需要换算成更容易理解的数字。
套用以上公式,我们来算算主流规格显存的理论频率是多少:
0.8ns颗粒=1000/0.8×2=2500MHz=2.50GHz
为什么要乘以2,因为DDR系列存储颗粒属于双倍传输,在工作频率和数据位宽相同的情况下,显存带宽是SDRAM的2倍,因此大家习惯于在基础频率上乘2,超高的频率确实比较好看。
● 位宽:显存位宽=单颗显存数据位宽×显存数量
这个不难理解,比如显卡使用了4颗16M×32bit GDDR3显存,那么位宽就是32bit×4=128bit。需要注意的是,并非所有情况下这个公式都成立,除了显存数量之外,GPU显存控制器的位宽决定了显卡位宽上限。
低端显卡核心拥有128Bit显存控制器,因此4颗GDDR3显存就能满足位宽需求,即便PCB上集成了8颗显存,显卡位宽依然是128bit。如果是中端显卡的话,8颗显存正好是256Bit,与核心相吻合。
● 带宽:显存带宽=显存位宽×显存工作频率/8
单纯看显存位宽意义并不大,最终影响显卡性能的其实是带宽。我们可以把带宽比作是马路的车行流量,显然马路越宽(显存位宽),车速越高(显存频率),最终的带宽就越高。
以GTX260为例,显存频率2GHz,位宽448bit,计算所得带宽就是112GB/s。除以8的原因还是因为bit和Byte之间的换算,带宽是显存速度的最终衡量。■<