性能再度提升!技嘉 GTX670 OC版评测
泡泡网显卡频道5月15日 GK104核心每个SM流处理器数量从GTX580的32个猛增到192个,共计1536个流处理器(GTX670有删减)!流处理器与核心同频率。这些大刀阔斧的改进让它的浮点运算能力翻番,性能也凌驾于南方群岛大溪地之上!
而日前发布的GTX670以其卓越的性能,环保的功耗再一次成为能效比最高的桌面显卡。虽然因为供货紧张等原因,目前国内这款产品的定价还略高,但依然挡不住Nfan们的热情,一线厂商技嘉有备而来,和NV同步发售了非公版GV-N670OC-2GD(以下简称GTX670 OC)。
根据之前的首发测试我们知道,GTX670相对于旗舰级的GTX680性能损失非常少,那素以用料扎实、散热设计优秀的技嘉显卡这次推出的非公版GTX670是否能延续以往的高水准?
作为NVIDIA目前次高端的型号,GTX670在硬件配备方面可以看成是GTX680的删节版,但同样搭载了GK104显示核心,显存规格也和GTX680并无二致,这款GTX670的性能应该不会让大家失望。
GTX670采用的GK104核心拥有1344个CUDA核心,112个纹理单元以及32个ROP光栅单元,核心频率915MHz,等效显存频率6008MHz,搭配2GB GDDR5显存,位宽256bit。长篇大论的分析相信大家看得都很累,最后我们将Tahiti与GK104这两颗GPU的所有规格都列出来,进行全方位的对比:
下面就通过数据分析一下架构的特性:
1. GK104的晶体管数比GF110减少了,但流处理器数量达到了三倍,NVIDIA改进架构、提高浮点运算的努力效果显著。但是,同为1536个流处理器,GK104的晶体管数要远大于Cayman核心,这就证明了SIMT还是要比SIMD更消耗晶体管;
2. GTX680的核心与显存频率都创新高,但是TDP却不到200W,这都要归功于它小核心的设计、以及不再使用双倍CUDA频率的作法,NVIDIA控制功耗的作法成效显著;
3. Tahiti的晶体管数是GK104的1.22倍,流处理器数量是1.33倍,这两个数字差距不是很大,N/A双方自DX10时代以来头一次达到了相似的晶体管利用率;
4. 从Cayman到Tahiti,AMD用了1.63倍的晶体管数才让流处理器数量达到了原来的1.33倍;从GF110到GK104,NVIDIA减少了晶体管数量却让流处理器达到原来的三倍;可以看出双方都在向对方的架构靠拢,目的只有一个,就是提高GPU的运算效能;
通过之前的测试数据来看,AMD的GCN架构相比上代确实提高了GPU的效能。而NVIDIA方面,GTX670的性能也必定远超GTX580。
在核心面积、晶体管数量、功耗、流处理器数量、显存容量、显存位宽得各方面都不占优势(唯一的优势就是频率)的情况下,GTX670的综合性能是否能够超越HD7970?
基于效能和计算能力方面的考虑,NVIDIA与AMD不约而同的改变了架构,NVIDIA虽然还是采用SIMT架构,但也借鉴了AMD“较老”的SIMD架构之作法,降低控制逻辑单元和指令发射器的比例,用较少的逻辑单元去控制更多的CUDA核心。于是一组SM当中容纳了192个核心的壮举就变成了现实!
通过上面这个示意图就看的很清楚了,CUDA核心的缩小主要归功于28nm工艺的使用,而如此之多的CUDA核心,与之搭配的控制逻辑单元面积反而缩小了,NVIDIA强化运算单元削减控制单元的意图就很明显了。
Fermi的硬件相关性检查变为Kepler的软件预解码
此时相信有人会问,降低控制单元的比例那是不是意味着NVIDIA赖以成名的高效率架构将会一去不复返了?理论上来说效率肯定会有损失,但实际上并没有想象中的那么严重。NVIDIA发现线程的调度有一定的规律性,编译器所发出的条件指令可以被预测到,此前这部分工作是由专门的硬件单元来完成的,而现在可以用简单的程序来取代,这样就能节约不少的晶体管。
随意在开普勒中NVIDIA将一大部分指令派发和控制的操作交给了软件(驱动)来处理。而且GPU的架构并没有本质上的改变,只是结构和规模以及控制方式发生了变化,只要驱动支持到位,与游戏开发商保持紧密的合作,效率损失必然会降到最低——事实上NVIDIA著名的The Way策略就是干这一行的!
The Way(游戏之道)计划可以保证NVIDA的GPU架构与游戏完美兼容
这方面NVIDIA与AMD的思路和目的是相同的,但最终体现在架构上还是有所区别。NVIDIA的架构被称为SIMT(Single Instruction Multiple Threads,单指令多线程),NVIDIA并不像AMD那样把多少个运算单元捆绑为一组,而是以线程为单位自由分配,控制逻辑单元会根据线程的任务量和SM内部CUDA运算单元的负载来决定调动多少个CUDA核心进行计算,这一过程完全是动态的。
但不可忽视的是,软件预解码虽然大大节约了GPU的晶体管开销,让流处理器数量和运算能力大增,但对驱动和游戏优化提出了更高的要求,这种情况伴随着AMD度过了好多年,现在NVIDIA也要面对相同的问题了,希望他能做得更好一些。
虽然公版GTX670的规格已经非常强悍了,但是技嘉推出的GTX670 OC更加强悍,下面是它的详细规格表。
可以看到这款三风扇显卡默认频率就达到了980MHz,这个频率下显卡的性能会再次提升,但也不会太高而导致显卡工作不稳定。
由于PCB和散热器用料扎实,显卡入手份量十足,比公版重了不少。
相比NVIDIA公版的GTX670使用的双6PIN电源接口,技嘉GTX670 OC使用了6PIN+8PIN电源接口,可以提供更大的功率,GPU也可以稳定运行在更高的频率之上。
技嘉GTX670 OC供电部分特写
公版GTX670 PCB
&nb
采三个低转速的大风扇既可以有效散热,又能保证运行时的低噪音。
拆解之后我们可以看到这款显卡的散热器做工非常不错,三根8MM热管横贯密集的散热鳍片,而多风扇设计在带走GPU核心热量的同时也能照顾到供电部分。
技嘉GTX670 OC比公版GTX670要长一些,适合空间比较大的机箱。
接口部分依然延续了公版GTX670 DP+HDMI+DVIX2的完美设计,对于支持四屏输出的显卡来说,这样的搭配非常合理。
为了让测试平台与今天测试的主角NVIDIA GTX670显卡相配,我们特意选择了目前最新的高端的硬件配置与之搭配,确保能够最大化发挥出GTX670的实际性能,测试平台使用了Intel Core i7 3770K,8GB DDR3 1600内存。
Intel Core i7-3770K
Core i7-3770K将是Ivy Bridge家族中的旗舰型号,22nm工艺制造,LGA1155封装接口,四核心八线程,原始主频3.5GHz,动态加速最高3.9GHz,三级缓存8MB,整合图形核心HD Graphics 4000,热设计功耗77W,预计售价332美元,将会取代Core i7-2700K。
技嘉G1.Sniper M3主板
技嘉 G1.Sniper M3是一款采用m-ATX板型设计的高端Z77主板,它结合了屡获殊荣的G1.Killer设计理念,目标是给玩家提供强大的性能。无论是内建Creative专业级音效处理器、Sound Core3D高质感音效输出还是支持 cFosSpeed 与网络加速技术的芯片,都是为了让玩家能有最棒的娱乐和联网游戏体验。
Steelseries KANA游戏鼠标
该鼠标的尺寸为124x64x37mm,可以说是中等鼠标,比较符合亚洲游戏用户的使用习惯。鼠标的正面采用了类肤式设计,手感舒适,防滑效果不错。鼠标的重量为72g,要比普通的鼠标略轻一些,这样长时间使用鼠标也不会出现疲惫感,而且用户对鼠标可以做到更好的操控。
Steelseries 6Gv2游戏键盘
这款6Gv2键盘延续了一贯的cherry黑轴机械开关,并在外形上与前作6G、7G有一定的传承。它取消了7G键盘的USB HUB以及音频接口,简化了接口,但在按键布局上有所优化,并能够通过PS/2转接实现全键无冲。
为能够全面衡量GTX670显卡的实际性能,我们不仅采用了多款权威测试软件检测显卡综合效能,还采用不同DirectX版本游戏来检验显卡在不同环境下的适应能力,同时,测试中还专门加入了曲面细分效率测试,下表是技嘉GTX670 OC显卡测试成绩汇总。
通过与公版GTX670的对比我们发现在功耗增加不多的情况下技嘉GTX670 OC的性能较公版产品提高不少,而相比上代旗舰GTX580更是遥遥领先。
总结:公版GTX670是一款能效比极高的显卡,它拥有的动态超频幅度,轻松让显卡运行在默认设定更高的频率下。技嘉GTX670 OC的基础核心频率达到了980MHZ,但功耗和发热控制的非常好,尤其采用了技嘉自主研发的散热器,让噪音和温度达到了非常好的一个平衡点,这对于追求高性能,而又讨厌高功耗、高噪音的玩家来说无疑非常具有吸引力。■<