DX11性价比之王!GTX460双雄权威评测
第二章/第三节 GF104专为游戏玩家设计:删除显存ECC、去掉双精度运算
GF100核心当中有很多功能都是普通用户根本用不到的,比如显存ECC、双精度浮点运算和CUDA C++指令,这些技术和功能是NVIDIA为专业用户而定制的。
● GF104删除显存ECC功能
GF100核心是第一颗在显存中提供了基于纠错码(ECC)数据保护功能的GPU。GPU计算用户使用ECC来在高性能计算环境中增强数据完整性。ECC是诸如医疗成像以及大型集群计算等领域中一个迫切需要的特性。
显存ECC可以减少数据运算出错的几率,而对于图形渲染来说,算错几个像素可能无伤大雅。所以GTX480系列都没有用到显存ECC功能,目前还只有Tesla系列支持显存ECC,备受超级计算数据中心的亲睐。
定位较低的GTX460就更不需要显存ECC功能了,所以在GF104核心设计之初就直接被删除。
● GF104精简双精度浮点运算能力
GF100相对于以往的GPU,大幅度改进了双精度浮点运算能力,其效率达到了单精度浮点运算的1/2,而ATI全系列显卡是1/5,NV上代显卡是1/8。目前尚不清楚GF104核心到底是完全删除了双精度运算单元、还是降低了双精度运算效率。无论是哪种方式,对于普通用户来说都没有任何影响,因为所有的3D图形渲染和民用CUDA软件都不会用到双精度运算。
NVIDIA称,没有计划使用GF104核心来制造Tesla GPU计算产品,事实上此前的Tesla都使用的是高端GPU。GF104是专门针对普通用户和游戏玩家而设计的,并没有“一心二用”的去兼顾HPC市场。
● GF104核心的二级缓存容量为512KB,与Cypress相等
GF100的二级缓存容量为768KB,GF104减少至512KB。如果平均下来GF100的每颗CUDA核心可以分到1.5KB的缓存,而GF104的每颗CUDA核心可以分到1.33KB的缓存,新核心的缓存配比略有减少。
二级缓存和显存控制器是关联的
不过即便如此,GF104核心512KB的L2容量也与ATI优异的Cypress相等。此外二级缓存容量还是与显存控制器有一定的关联关系。其中GTX460 1GB 256Bit的版本,L2可以使用全部的512KB,而768MB 192bit的版本只能使用到384KB L2。
GF100的缓存架构让各流水线之间可以高效地通信,减少了显存读写操作
缓存容量的减少,或多或少的会影响GPU的性能,3D图形渲染也会有损失。但GF104继承了GF100共享式的二级缓存设计,缓存利用率非常高,即便缓存容量遭到了缩水,也要比ATI独享式二级缓存(L2绑定显存控制器)的效率高。其原理大家可以参照CPU领域奔腾双核与速龙2系列的性能表现即可。