多少流处理器够用?四款9系列显卡横评
导读:在很多用户的意识中,显卡的参数只有显存容量和显存位宽这两种,而对“流处理器”这个概念知之甚少。然而,实际上流处理器才是当今显卡最重要的参数,远远比显存容量、显存位宽重要。今天,本文就是要告诉大家流处理器到底有多重要!
大家知道,在图形的渲染过程中,主要是像素渲染、顶点渲染以及纹理渲染三大部分组成,这三个步骤也是显卡渲染出一幅3D图像必须的过程,每一幅完整的图像都少不了这几个步骤。
在Geforce 8系列显卡之前,执行这三个操作的单元完全独立,在显核心内部有专门的像素渲染管线、顶点着色单元、纹理单元,他们各司其职。而到了Geforce 8时代,像素渲染管线和顶点着色单元不再有区别,而是被统称为“流处理器”,这种将像素管线和顶点单元结合的方式,也就是我们经常听到的统一渲染架构。
稍微有点硬件知识的朋友就知道,在Geforce 8之前,像素渲染管线和顶点着色单元这两个参数非常重要,这两个部分的多少完全决定了显卡的性能表现,NVIDIA和ATI双方都为了提升像素管线和顶点单元的数量而想尽一切办法,比如说提升工艺等。
经典的R580架构,48个像素管线,8个顶点着色单元
但是还有人会注意到,即使在Geforce 8之前,显卡核心内的渲染管线和顶点着色单元的数量并不一样,比如说G71就拥有24条像素管线和8个顶点管线,而1950Pro则拥有36个像素单元和8个顶点单元。那这又是为什么呢?这个问题得从“管线渲染架构”的缺点说起!
可以看到,在之前的显示芯片设计的时候,显示芯片厂商在设计的时候并不会将顶点管线和象素管线按照相同的数目去做。而是将顶点管线相对放的少一些,多放一些象素渲染管线。
那么显示芯片厂商为什么要这么做呢?答案是:这样的结构和比例是芯片设计厂商根据常见游戏的情况而决定的。
不同的游戏在开发的过程中,设计的游戏复杂度是不同的,有的游戏就非常简单,3D模型也相对简单,这样游戏就可以在更多的玩家的电脑上运行。有的游戏的3D模型和后期特效就非常复杂,这样在保证了游戏的效果的同时就让很多配置不是那么好的玩家无法运行或者运行起来特别慢。
除去游戏复杂度的区别,游戏的开发商和显示芯片厂商还处在一个更加难以解决的怪圈中,这就是,游戏开发商无法在游戏的资源消耗定向上达成一致,所以带给了显示芯片厂商很大的麻烦。
具体来说就是,有的厂商会开发一些3D模型很复杂,顶点数目很多的游戏,这些游戏就需要耗费很大的顶点渲染管线的资源,这类游戏可以把通常场景很复杂,里面的3D模型的细节非常到位。而另一类厂商则会将焦点放在后期的象素级别的特效,这样的好处就是可以给游戏带来更炫的视觉效果。
举例来说,像《帝国时代3》《英雄连》这样的游戏,就属于顶点处理性能要求比较高的,因为这样的即时战略游戏很有可能在一个画面中出现大量的人物,这样顶点的总数目就会很多,相对消耗顶点渲染管线的性能更加多一些。
而《优品飞车》系列游戏就属于典型的象素性能要求比较高的,因为在优品飞车中,连最新的《优品飞车10:卡本峡谷》也都没有支持车辆的损坏,每个车都是一个固定的刚体3D模型,三维顶点数目很少。而如果特效全开的情况下,绚丽的画面效果非常消耗象素渲染管线的性能,即使最好的显卡也不会跑得很爽。
不同的游戏风格造成了显示芯片厂商只能造出更加强大的显示芯片来满足这些不同的游戏,但是如何进行配比,将是一个很挠头的事情,因为这就像一个天平,偏向哪边都会失去另一部分。
在这种情况下,显示芯片厂商只能按照最常见的游戏的情况来设计显示芯片,尽最大能力去满足不同的游戏。
而游戏厂商在设计游戏的时候也不能随心所欲的设计游戏,必须满足显示芯片的性能配比,这样才能在消耗性能最小的情况下达到最好的游戏效果。
这个矛盾一天不得到解决,显示芯片最大的效能就不能有效的得到发挥,这也一直是显示芯片的性能提高的最大瓶颈所在,在这样的架构上,不断的加“管线”,提高频率是显示芯片厂商唯一能作的事情。
总结 传统显示芯片架构的缺点在于:
1 游戏厂商不能设计出更自由的游戏。
2 显示芯片的效率不高。
3 显示芯片的性能提升有限。
很显然,统一渲染架构的出现就是为了解决这些问题的,因为流处理器既可以处理顶点方面的操作,也可以处理像素方面的操作。统一渲染架构通过专用的超线程调度模块,根据游戏的负载来指配流处理器按照不同比例处理像素和纹理运算,最大化GPU的资源利用,从而获得非常好的效能!
经过两年的发展,统一渲染架构也走向了成熟,如果说G80是DX10初生的婴儿,那么G9x则正好是青壮年时期的代表。如今,NVIDIA全线产品都已经过渡到了Geforce 9时代,甚至高端市场上都已经推出了GTX 200系列产品。随着中、低端产品线的完善,产品的规格也层出不穷,比如现在Geforce 9系列产品就高达6、7款。
事实上,从第一款基于统一渲染架构的显卡G80诞生到现在,NVIDIA显卡的根本架构就没有什么大的改变,而现在的Geforce 9系列显卡,则更加如此了。所有Geforce 9系列显卡都采用完全一样的架构,不同产品与不同产品之间最直接的就是流处理器数量、显存搭配等方面的差距。我们来看看下面这个数据:
型号 | 核心 | 流处理器 | 频率 |
9800GTX | G92 | 128SP | 675/1688/2200MHz |
9800GT | G92 | 112SP | 600/1500/1800MHz |
9600GT | G94 | 64SP | 650/1625/1800MHz |
9600GSO | G94 | 48SP | 650/1625/1400MHz |
上面的表格则是当今Geforce 9系列显卡中,流处理器数量比较具有代表性的几款产品,大家可以看出除了流处理器数量之外,显卡频率也不尽相同。
大家知道,频率是显卡厂商可以任意调整的,一款体制好的显卡,超频后性能有很大的提升,一款体制较差的产品,可能很难以超频。而显存频率则更加灵活,显卡厂商可以采用各种高低频率的显存颗粒,并且在这个基础之上还可以进行超频与降频等。而唯一更改不了的,就是流处理器数量。
流处理器数量和核心是与生俱来的,同一款核心的产品,不管它来自那个品牌,其流处理器数量都是完全一样的。NVIDIA也正是通过控制流处理器数量来推出面向各种市场级别的显卡。所以说,一款显卡中含有的流处理器数量越多,那么它的性能就越好。
在很多人的意识中,显卡的容量是放在第一位的,笔者逛中关村的时候经常会听到,“这显卡是多少兆的?”...... 。而事实上,显卡有多少兆并不重要,重要的还是流处理器的数量。下面,我们就要来告诉你流处理器到底有多重要。
本次测试我们选择的是Geforce 9系列显卡中四款流处理器数量不一样,而显存规格均为512M/256Bit的几款产品,实际上和前面那一页表中介绍的那几款差不多。
硬件系统配置 | |
Intel E8200 2.66GHz | |
主 板 |
MSI X48C 白金版 |
显 卡 |
Inno3D 9800GTX 128SP 盈通9800GT游戏高高手 112SP 小影霸GX5 9600GT 64SP Inno3D 9600GSO 48SP |
内 存 |
Geil DDR2-800 1GB×2 (5-5-5-15-2T) |
硬 盘 |
希捷7200.10 |
电 源 |
海韵 M12 600W |
软件系统配置 | |
Windows vista SP1 32Bit | |
DirectX |
10.0 (6.00.6000.16386) |
显示驱动 |
Forceware 180.43Beta |
我们统一在完全一样的测试平台、软件测试环境下进行测试,为了让成绩精确,我们甚至将四款参测显卡的频率都设定在650/1625/1800MHz上面。同时显卡的驱动程序也采用NVIDIA最新的Beta版FW 180.43。另外,我们还关闭了显卡的物理加速功能。
测试方法和我们之前测试显卡基本无太大差距,主要是通过游戏来了解显卡的流处理器数量到底有多重要。好,下面我们正式开始测试!
● DX10基准性能测试——3DMark Vantage
由于本次参加测试的显卡既有高端的,中低端的产品,所以我们在3DMark Vantage测试中,选择了比较折中的Performance模式进行测试,避免低端显卡跑不动的情况。
为了让大家能够直观的看出流处理器数量带来的性能差距,我们通过计算相邻性能的两块显卡之间得分的百分比来展示:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为18%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为16%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为2%;
为什么会出现显卡越高,性能提升的百分比反而越低呢?我们将在最后的总结中给大家说明。我们继续看游戏的成绩以及性能提升的百分比!
● 2007年度非常好的游戏——《使命召唤4:现代战争》
由于《使命召唤3》是XBOX360独占游戏,并没有PC版本,因此PC游戏玩家对于使命召唤系列游戏的印象大都停留在《使命召唤2》时代,但经典的《使命召唤2》给玩家带来了不一样的二战游戏体验,因此支持PC版的4代作品备受期待。此次《使命召唤4》全平台出击,自发布以来就好评不断,销量长期霸占榜首!
自从《使命召唤4》宣布以现代战争(Call of Duty 4:Modern Warfare)为游戏主轴,许多好奇的玩家就不断在猜测,注重历史写实的Infinity Ward会把战场移至何处,大部份都以为会是越战或是伊拉克战争。但是为了避开敏感的话题,开发小组选择创作虚构的故事,将战争带领至更多想像之外的国家。此次《使命召唤4》挟著“至今最紧张刺激的FPS游戏”诉求,将战场拉到现在的中东及东欧等区域。
虽然使命召唤4的场景已不再是二战,但它依然保持了和使命召唤2/3系列相近的画面风格,相信老玩家在游戏中一定会有亲切感,战斗中的爆炸、烟雾效果更加逼真,物理效果也加强了游戏的真实感。
● 画面设置和测试方法
使命召唤4引擎对显卡的要求不像DX10游戏那么BT,中端显卡特效全开都能有不低的FPS,这也是它能够迅速普及的原因。所以,本次测试我们直接采用1680×1050的分辨率,并且分别开启AA和不开启AA进行测试。
测试方法:Demo有一段固定的爆炸场景,FPS比较稳定,也符合游戏实际运行时的情形,用Fraps统计这个过程的FPS,作为最终成绩。
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为13%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为20%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为2%;
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为12%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为26%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为2%;
●DX9C游戏性能测试:《帝国时代3:亚洲王朝》
其画面风格一如既往的华丽无比,虽然游戏引擎比较老,但通过精妙的色彩搭配和美术设计,《帝国3》比起DX10 RTS大作《英雄连》和《冲突世界》都是不落下风。
画面设置:帝国3的最新资料片也使用了原来的游戏引擎,画面风格没有任何变化,系统需求也是照旧,对于如今的显卡来说特效全开并且打开抗锯齿运行游戏没有任何难度。起“边缘光滑”开启至“高”就是4AA。分辨率同样为1680×1050。
测试方法:及时战略游戏如果没有专用测试程序,就很难在游戏中公平的测试,所以我们选用了游戏即时演算的主界面统计帧数,也能客观的反映出各卡在该游戏中的差距。
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为13%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为15%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为3%;
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为12%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为11%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为1%;
●DX9C游戏性能测试:《半条命2:第二章》
《半条命2:第二章》作为《半条命2:第一章》的续集,引擎在HDR和室外场景的渲染方面有所增强,树叶渲染上将采用Alpha覆盖技术,提供更好的树叶细节和反锯齿效果。此外还引入全新的粒子系统,将提供动态软阴影效果。物理引擎也经过重新设计,提供大场景大范围的物理效果。
画面设置:《第二章》还是原来的Source引擎,虽然做了一些改进,但对显卡的要求并没有提高,所以我们测试时特效全开最高,并且打开游戏自带的AA和AF。
测试方法:游戏支持命令录制demo供测试,我们录制的demo覆盖了室内室外场景。
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为15%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为21%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为1%;
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为13%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为18%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为1%;
● DX9C最新赛车游戏:《优品飞车11》
如果你已经厌烦了在黑夜里飙车,那么《优品飞车11》一定能再次让你满意,因为这次EA让玩家们在NFS的世界里重见了阳光。不管优品飞车系列怎么改变,不变的就是那些忠实的老玩家还有源源不断的新玩家。
优品飞车几乎每年一次更新,在上一代作品发布的一年后,EA为我们带来了系列的最新作《ProStreet》。告别了连续几代的黑夜,重新迎来了太阳。
● 画面设置和测试方法
在上一代的《优品飞车10》中画面设置是不支持目前主流的宽屏分辨率的。而在新作中这种问题已经得到解决,玩家们的大屏幕显示器不会再次面临英雄无用武之地的尴尬。我们将所有效果开启至最高并分别开关AA和AF。
测试模式:特效全开最高我们选取NEVADA HIGHWAY赛道进行游戏,使用Fraps统计在相同赛道段的平均FPS。
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为9%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为6%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为2%;
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为11%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为5%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为2%;
●OpenGL游戏性能测试:《雷神战争》
《敌占区:雷神战争》作为QUAKE系列游戏的最新作,由于引擎源自Doom 3,但比DOOM3在很多方面都有所加强,最引入注目的MegaTexture技术的首次使用。简单而言,MegaTexture就是一张超大的贴图。在《敌占区:雷神战争》中每张MegaTexture容量达到了3GB(类似ClipTexture,并非全场景的动态贴图),在得到更好效果的同时,对显存容量的要求也更高。除此之外,引擎还引入了视差映射、凸凹紋理映射、法向映射和Specular Highlighting、软粒子等目前流行的显示技术。
画面设置:毕竟是源于老迈的DOOM3架构,引擎无论如何改进,对配置的要求也不可能出现翻天覆地的变化,自然是特效全开,并开启游戏内置的4AA16AF。
测试方法:我们自行录制了一段多人对战Demo,调用游戏内置的控制台命令行播放录像,然后就可以得到比较准确的全程FPS。第一次回放Demo时由于Loading的原因成绩较低,所以取第二次的成绩为最终结果。
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为16%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为6%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为18%;
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为16%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为28%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为9%;
● DX10 RTS游戏——《冲突世界》
看之前的游戏介绍,很多人都以为这是一款FPS游戏,因为它的画面效果和模型细节实在是太细腻了,事实上它是一款RTS游戏,一款场景比《英雄连》还有宏大、细节和特效更加丰富的即时战略游戏!
《冲突世界》(World in Conflict)是一款以假想的世界战争为题材的新作,在游戏的开场动画中,玩家就可以看到重装坦克入侵美国的大街小巷,士兵架着机枪在海岸线上殊死保卫。西雅图遭到了严重的空袭。本作的剧本作者Larry Bond是知名的畅销书作者,与汤姆?克兰西一起创作了《Red Storm Rising》,曾经参与了《鱼叉》系列海战游戏的开发,这次他与Massive的游戏开发大师们合作为玩家带来了又一款军事惊悚游戏。
● 画面设置和测试方法
《冲突世界》游戏自带的画面设置多达44个选项,预置Very High/High/Medium/Low几种模式, 本次测试采用High模式,然后手动开启关闭AA/AF选项,对比几款显卡的性能表现:
《冲突世界》和《英雄连》类似,内置了一段非常华丽的过场动画作为测试程序,最终得出最大、最小和平均FPS,测试结果非常精确。
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为14%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为10%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为2%;
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为13%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为4%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为0%;
● 首款DX10游戏大作——《失落星球:极限状态》
2007年5月份正式发布的《失落星球:极限状态》(Lost Planet:Extreme Condition),是业界首款支持DX10的游戏,它的发布打破了长久以来DX10显卡没有DX10游戏可玩的僵局,因此受到了大批PC玩家的青睐,并迅速成为显卡性能测试工具之一。
《失落星球》无论DX10还是DX9版本,画面都非常出色,但除了绚丽的画面之外,游戏本身也是可圈可点,最大的特色就是节奏紧凑、战斗过程紧张、激烈、刺激,关卡的BOSS战需要很高的操作技巧和灵活性,需要反复尝试才能通过,这非常适合那些喜欢挑战极限的玩家。所以该游戏虽然关卡不多,但所得到的游戏体验比较丰富,其任务系统非常简单,但情节引人入胜,大有一玩到底、不通关誓不罢休的味道。
● 画面设置和测试方法
《失落星球》最新的1.004补丁加入了四项DX10特效,并且大幅改进了DX10模式下的执行效率。本次我们测试依然采用1680×1050的分辨率,特效开最高,手动开启/关闭AA/AF选项,下面来看看测试成绩。
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为13%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为15%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为7%;
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为9%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为10%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为6%;
●DX10游戏性能测试:《生化奇兵》
早在游戏Demo版发布之前,BIOSHOCK就已经声名远扬,著名游戏杂志Gameinformer在较早的时候对其进行了完整测试,并给出了惊人的满分10分,将几乎所有的溢美之词都献给了这款游戏,称之为难得一见的史诗性大作。
测试方法:《生化奇兵》并不像其他几款DX10游戏那样自带测试程序,所以我们只能用Fraps来记录游戏运行的实时FPS,测试场景选取了第一关动态海面作为户外模式获得成绩。
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为27%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为17%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为2%;
●DX10游戏性能测试:《孤岛危机》
Crysis(孤岛危机)无疑是现阶段对电脑配置要求最高的PC游戏大作。Crysis的游戏画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏。
画面设置:游戏版本为V1.2,如果开启最强DX10效果(Very High),即便是许多高端显卡也只能在低分辨率看幻灯片,所以本次我们只是在1024×768分辨率下的High模式分别开启AA/AF和不开启AA/AF进行测试。
测试方法:Crysis内置了CPU和GPU两个测试程序,我们使用GPU测试程序,这个程序会自动切换地图内的全岛风景,得到稳定的平均FPS值。
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为13%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为15%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为3%;
相邻性能两款显卡的性能差距百分比:
● 拥有64个流处理器的9600GT相对于拥有48个流处理器的9600GSO来说,性能提升幅度为19%;
● 拥有112个流处理器的9800GT相对于拥有64个流处理器的9600GT来说,性能提升幅度为17%;
● 拥有128个流处理器的9800GTX相对于拥有112个流处理器的9800GT来说,性能提升幅度为2%;
前面我们一共测试了9个游戏和一个3DMark Vantage基准性能,可以看出,64个流处理器的9600GT相对于48个流处理器的9600GSO性能提升基本都在10%以上(极个别游戏除外),112个流处理器的9800GT相对于64个流处理器的9600GT性能提升也基本都在10%以上(极个别游戏除外),甚至部分游戏超过了20%。但为什么128个流处理器的9800GTX相对于9800GT,性能提升却都在5%以内呢?是不是这个时候,流处理器的作用就不大了呢?
实际上,我们没有办法完全这么说,可以这样理解:当9600GT、9800GT的时候,由于是中端显卡,显存还无法对核心的处理能力造成瓶颈,所以这个时候只要流处理器数量有所提升,性能则会有很大的提升幅度。而在9800GTX上,由于核心处理能力非常强大,此时显存已经满足不了核心强大的数据处理能力,这时候显存就成了显卡上的瓶颈,比如带宽、容量,所以在这种情况下,即使提升流处理器的数量,性能提升也不明显。
另外大家可能普遍发现9600GT与9800GT的性能差距比较大,这又是为什么呢?实际上很好理解,9600GT拥有64个流处理器,而9800GT拥有112个流处理器,两者的流处理器差距高达48个;而9600GSO与9600GT的差距只有16个,同样9800GT与9800GTX的差距也只有16个,所以9600GT与9800GT之间的差距大也是理所当然的,甚至我们发现他们之间的差距比我们想象中的还要小一些,证明在9800GT这个阶段,显存已经对核心产生了不太明显的瓶颈。
所有的测试均反映了以下几个问题:
● 流处理器数量对于中端显卡非常重要,买中端、主流显卡的时候,一定要注意尽量购买流处理器数量较多的产品;
● 在千元级显卡上,512M/256Bit的显存搭配已经对核心造成了瓶颈,显存带宽可以通过提升频率来提高吞吐量,所以这也是各大厂商为什么要在千元级显卡大量推出高频版本的原因;
● 在高端显卡上,显存的容量也非常重要,特别是在运行DX10游戏并开启AA/AF时,大容量显存性能会有质的提升;而在低端显卡上,则不用太注重显存的容量;
总之,大家在购买显卡的时候,一定不要先问显卡是多少兆的,而是要先问有多少个流处理器,将流处理器数量放在首位,才能保证购买到性价比高的产品。<