灭杀老卡!NVIDIA新架构40nmGT220首测
泡泡网显卡频道10月12日 今年7月份,NVIDIA正式开始面向OEM商提供全新的40nm工艺,硬件支持DirectX 10.1的显卡产品——GT220与GT210。两个月之后,面向零售市场的GT220显卡终于进入了电脑卖场的柜台,NVIDIA从此迈入了DirectX 10.1时代。
一直以来,NVIDIA在面对新工艺以及新标准方面都似乎比AMD慢半拍(DirectX 10例外),早在今年5月份,AMD就正式推出了首款40nm的GPU产品RV740,NVIDIA现在推出40nm产品GT220,整整晚了4个月。而早在两年前,AMD就率先在HD3000系列显卡上引入了DirectX 10.1技术,NVIDIA则一直表示并不看好DirectX 10.1,直到如今才推出GT220显卡,硬件上实现了对DirectX 10.1的支持。
当然,工艺与技术的进步是必然的,40nm也必将有到来并且普及的那一天。如今,这一天到来了,NVIDIA和AMD都开始准备大批量在40nm工艺生产线上生产新的产品。但是对于DirectX 10.1,很多朋友可能会比较疑问:NVIDIA在之前非常排挤DirectX 10.1,认为DX10.1没有用,为何现在又“食言”推出了DirectX 10.1的显卡呢?关于这一点,NVIDIA官方并没有给出答复,且这款产品也以非常低调的方式上市,可以看出NVIDIA并不想在GT220的DirectX 10.1特性上做过多的解释。
不过笔者认为,NVIDIA之所以现在推出了硬件支持DirectX 10.1的显卡,很大程度上是“顺便”加上该功能的。从显卡架构上来说,,硬件加入DirectX 10.1功能并不需要花太多的时间进行研发,完全可以顺手牵羊的将该功能加入;其次,加入DirectX 10.1功能也可以避免AMD落井下石,疯狂贬低N卡不支持DirectX 10.1的事情发生。
不管怎样,NVIDIA终于推出DirectX 10.1的显卡,并且在首款DirectX 10.1显卡上引入了40nm的先进工艺。虽然GT220是一款主流级显卡,但对于NVIDIA来说仍然是一款划时代的产品。可以预料,在未来很长一段时间之内,GT220都将占据着主流以及低端独立显卡市场,成为DirectX 11显卡普及之前最重要的产品之一。
虽然型号为GTX(S)2xx的产品在市场上已经随处可见,但细细一观察我们就会发现,在GT220到来之前,只有GTX260(含)以上的产品才真正意义上是基于GT200架构的产品,千元市场最热门的GTS250并不是基于GT200架构的产品,而是之前9800GTX+的马甲版,采用的是G92核心。虽然之前有消息称9800GT及9600系列产品也会更名到GT2xx系列,但一直没有见到动静,也就不了了之了。
如今,GT220的正式面世,才真正意义上的意味着GT200架构的普及,GT220才是首款真正意义上采用GT200架构的中低端产品。GT220沿用了与GTX280完全一样的核心架构,只是规格上做了大幅度的删减,流处理器为48个,也就是两组TPC(线程处理器簇);GTX280拥有10组TPC,所以拥有240个流处理器。
GTX280核心架构图,拥有10组TPC,而GT220只有两组
对NVIDIA显卡技术比较了解的朋友应该知道,GT200核心架构被称为第二代统一架构,而G80/G92时代的核心架构被称为第一代统一渲染架构,细心的朋友可以看出:GT200的核心架构去掉了“渲染”这两个字,从这个细微的变化就可以看出NVIDIA新一代GPU架构重点已经不在3D渲染,更大程度上的考虑到3D与通用计算性能。所以,GT200架构相对于第一代的统一渲染架构来说,在通用计算性能方面再上一层楼。
相对于G80/G92的第一代统一渲染架构来说,GT200几乎所有的微架构都作了调整,并大幅扩充规模。也正是因为架构的调整,使得GTX200架构更加适合通用计算,当然3D渲染也一样非常重要。所以GT200架构的主要含义就是将图形处理架构和并行计算架构完美的结合起来,成为一颗真正意义上的通用处理器,超越图形处理器的概念!
AMD早在HD3000系列显卡上就完成了对DirectX 10.1的硬件支持,但NVIDIA似乎一直并不看好DirectX 10.1。NVIDIA认为,DirectX 10.1并没有画质上的改善,仅仅是对DX10的一个可有可无的升级版本,而且DX10.1中的特效也完全可以通过DX10软件实现。所以,从RV670核心的HD3800系列发布至2009年的两年时间内,NVIDIA都没有推出硬件支持DirectX 10.1的显卡。
虽然说DirectX 10.1中的特效确实可以通过DX10显卡软件实现,但作为A卡最重要的卖点之一,AMD无时无刻不借此对NVIDIA的产品施加压力,经常对NVIDIA“落井下石”的予以打击。当然NVIDIA也有自己独有的技术,譬如成熟的CUDA通用计算架构、PhysX物理加速以及3D立体幻镜技术等等。
● DX10.1主要更新内容:
-
支持Shader Mode 4.1;
-
新的着色指令支持立方体纹理贴图阵列;
-
应用程序可以控制多重采样和超级采样的使用,并选择在特定场景出现的采样模板;
-
可以直接对压缩的纹理材质进行渲染;
-
更具弹性的资源复制和利用;
-
包括多个渲染目标的总体混合模式,以及更新的浮点混合功能;
终于,NVIDIA推出了GT220——首款硬件支持DirectX 10.1的产品,正如前文所说,GT220之所以支持DirectX 10.1,一方面可能是由于开发工作量很小,加上这个功能很方便;另一方面也是为了不受AMD在这方面的欺负。当然,作为一款低端显卡,DirectX 10.1也是一个很好的卖点,何况GT220很可能在未来很长时间内都是中低端市场的主流产品。
随着GT220对DirectX 10.1的支持,N卡也终于可以在支持DirectX 10.1的游戏中开启DirectX 10.1特效了,上图就是使用NVIDIA GT220在《鹰击长空》这款游戏中正常打开DirectX 10.1支持的截图。
如果一定要说DirectX 10.1是NVIDIA随手加入的新功能的话,那么核心工艺的进步就是GT220的一大进步了。GT220是NVIDIA首款采用40nm制程工艺的桌面级显卡产品。晶体管的发展一直都是依靠着制程工艺的进步,如果没有制程工艺的进步,那么摩尔定律也不可能实现,更不用说双倍于摩尔定律发展速度的GPU了。
更加先进的工艺可以降低产品成本、提高核心面积的利用率、同样的核心面积内集成更多的晶体管以实现更高性能的产品、降低功耗与发热量等等好处。对于芯片厂商来说,工艺的每一次提升都是至关重要的。如果没有工艺的限制,那么世界上也根本不可能有最强性能芯片的这种定义,想堆多少晶体管就堆多少。
根据GT220的定位来看,主要是面向中低端以及主流市场,目的是要接替9600GSO。众所周知,9600GSO采用55nm工艺,而GT220采用40nm工艺,两者的流处理器数量都是48个。那么我们来看看40nm工艺到底能比55nm工艺的核心面积小多少呢?
上面两张照片是笔者通过电子游标卡尺测量得出的两款核心边长数据,根据NVIDIA之前公布的官方数据,采用G94核心的9600GSO核心面积为240mm2,虽然和笔者徒手量的有一些差距,不过差距并不大。然而,从照片中可以看出GT220核心面积则有大幅度降低。通过游标卡尺得出的数据大约是10mm,就算我们量的值偏小按照10.5mm算,核心面积也不过110mm2。这两者的差距是非常大的,大家从照片中也可以看出两款核心面积的差距。
我们目前还没有得到GT220到底拥有多少个晶体管,也没有得到官方的核心面积资料。上面测量的数据虽然不是完全精确,但通过高精度的游标卡尺测量的数据也还是非常具有代表性了。GT220核心面积大幅度降低,很大程度上都是40nm工艺的功劳。而且,GT220还集成了HD-Audio单元,这一部分也是有要消耗晶体管的,所以看得出40nm工艺的确让产品的核心面积大幅度降低了。
AMD自从HD2000系列显卡开始就在显卡内集成了音频解码单元,以方便用户在使用HDMI输出时可以同时得到视频与音频信号,实现真正意义上的“高清一线通功能”。而NVIDIA的显卡则一直没有直接集成该模块,部分厂商利用了通过连接线的方式直接获取主板集成声卡上的SPDIF音频。
A卡HDMI可以直接提供视频和音频信号的输出,而N卡HDMI输出音频必须“移花接木”
N卡这种“移花接木”的办法虽然可行,但是毕竟存在一个音频信号导入\\输出的过程,而很多用户都并不太了解这个过程到底应该怎么做。从目前市售显卡的情况来看,有直接提供HDMI接口支持的、有通过DVI to HDMI转接头支持HDMI的、有通过光纤导入音频之后再从HDMI导出的、也有通过同轴导入音频再从HDMI导出的、还有通过SPDIF线缆导入音频再从HDMI导出的,各种实现方法均不一样,导致使用非常混乱,用户也在这其中深感不便。为此,笔者之前专门写了一篇文章介绍了A卡与N卡的HDMI音频使用文章,感兴趣的朋友可以点击这里。
设备管理器识别了HD2000系列显卡内置音频单元
然而,正式因为N卡HDMI不能直接输出音频而真正意义上实现高清一线通功能,导致在高清风暴来临的时候N卡表现不利,很多高清爱好者以及HTPC都选用了AMD的显卡,因为不仅仅可以当显卡用,还可以通过HDMI给电视机输出音频信号,不用再单独连接声卡。
如今,NVIDIA在终于在GT220显卡上集成了Audio解码单元,在设备管理器中我们已经可以看到品牌为NVIDIA的High Definition Audio设备,使用显卡直接连接液晶电视,就可以实现视频和音频同步输出的功能。现在,NVIDIA也终于在高清解决方案不再落后于竞争对手了。
GT220显卡采用了一种叫做sGDDR3的显存颗粒(如下图),小写的s是small的缩写,代表更小封装的意思,从图中我们可以看出,GT220所采用的显存颗粒确实要比我们之前见过的GDDR3显存颗粒小不少。
从图上我们可以看出,GT220采用的是Hynix推出的sGDDR3显存芯片,其实Hynix官方并没有sGDDR3的这种说法,只是显卡厂商认为加一个s在前面,既可以符合这种小芯片封装的特点,也可以作为另外一个卖点。既然这样,我们就姑且叫这种小型封装的GDDR3显存叫sGDDR3吧!
sGDDR3显存采用96Ball的FBGA(细间距球栅阵列)封装,而普通的GDDR3显存采用的是136Ball的FBGA封装(早期有144Ball的MBGA封装的GDDR3产品),所以从颗粒面积上会小很多,同时对电路的要求也有所降低。
不过,采用96Ball封装的sGDDR3显存颗粒也有很多版本,可喜的是我们发现GT220这款显卡上正好采用的是电压最低的型号。通过官方的数据可以得知,GT220显卡上所采用的编号为H5TQ1G63BFR-12C的显存颗粒工作电压仅为1.5V,而其他大部分产品的工作电压都为1.8V,也就是说GT220上所采用的显存颗粒更加省电。
通过前面的介绍,相信各位对GT220的来龙去脉已经有了一个基本的了解。那么GT220的上市情况如何呢?根据我们的了解,不少品牌的GT220显卡都已经到货,其中同德旗下的自有显卡品牌耕昇更是一下推出了四款GT220产品。本次我们评测所使用的产品来自耕昇,在这里特别感谢耕昇最先为我们提供评测样品。
● Gainward Geforce GT220 红缨版-1G
耕昇GT220红樱版1GB正式出货的版本将采用1GB的sGDDR3显存颗粒,显存颗粒速度为1.2ns,显卡默认频率645/1404/1580MHz。
● Gainward Geforce GT220 红缨版
耕昇GT220红樱版和前面的红缨版1GB最大的差别就是采用了512MB的显存,这款显卡的默认频率为650/1414/1800,采用GDDR3 1.0ns颗粒。
● Gainward Geforce GT220 红翼版
GT220红翼版搭配512MB显存颗粒,默认频率为650/1380/800MHz,采用的是2.5ns的GDDR2显存颗粒。
● Gainward Geforce GT220 红魔版
GT220红魔版搭配128MB显存颗粒,默认频率为650/1414/1800MHz,采用的是1.0ns的GDDR3显存颗粒。
由于本次评测我们采用了前页中介绍的两款GT220红缨版产品,所以在这里我们单独对GT220红樱版进行介绍。需要特别注意的是,我们测试所使用的显卡为工程样品,默认频率很高,GT220红樱版1GB默认频率为675/1469/1660MHz,而512MB的版本默认频率为680/1479/2100MHz,和前一页中我们公布的数据相比频率更高一些。据悉,耕昇早期的打算是直接推出这种超高频率的产品,但后来估计是为了首先保证显卡的稳定性,将正式出货版的频率降低了一些。不过,在笔者的测试中,这两款产品在如此高频下仍然非常稳定,甚至还有超频的余地,所以可以看出GT220的超频潜力非常优秀。在此我们特别对此进行声明。
以下产品图片均是我们收到的GT220工程样品:
以上就是耕昇这两款红缨版GT220产品图秀,小图的左边是512MB显存容量版本的GT220红樱版,右边为1GB版本。从图上可以看出这两款产品外观上并没有太大的区别,显存方面一款采用的是1GB的颗粒,另一款采用512MB的颗粒。两款显卡的显存分布有一些不同,其余的设计均一模一样。
下面,我们即将正式进入集多项第一于一身的GT220显卡测试部分,首先我们还是来介绍一下本次测试所采用的测试平台。
● 测试平台
由于GT220定位于中低端市场,所以本次测试平台的CPU也采用了规格较低的E5200,这样可以让整个测试更加具有代表性。不过鉴于目前内存价格很低,所以直接搭配了4GB内存,在32Bit操作系统下可利用3GB。参测显卡包括耕昇提供的两款GT220红缨版、512MB/128Bit的9600GSO以及竞争对手HD4670。
● 测试项目
GT220这样的中低端显卡游戏性能并不强,配备GT220显卡的电脑配置也不会太高,所以对于这样的显卡来说,游戏性能并不是参考的主要对象。很多用户都用GT220做高清视频解码等。所以,本次除了游戏性能测试之外,我们还加入了高清解码效能的测试。
另外,前面我们讲到GT220是NVIDIA首款采用GTX200架构的低端产品,在通用计算能力方面更强。为了证实这一点,我们还加入了GT220对比9600GSO视频编码能力测试。
GT220或许相对于9600GSO等产品来说性能并不是最重要的,最重要的是其采用了40nm工艺,功耗和发热量都应当有显著的降低,到底是不是这样呢?我们依然通过测试来进行验证。
GT220虽然是一款低端显卡,但是不是就一定只能玩2D游戏呢?答案是否定的,笔者随便找了几款非常热门,且3D效果非常好的热门游戏进行测试,都可以在很高的分辨率下流畅的运行。比如DirectX 10游戏《鬼泣4》、DirectX 9游戏《战火兄弟连:地狱之路》以及刚刚发布不久且人气非常旺的《街霸4》,都可以在1680×1050分辨率下流畅运行。
● 《鬼泣4》
● 《战火兄弟连:地狱之路》
● 《街头霸王IV》
从这三款游戏的测试结果我们可以看出,GT220完全可以在1680×1050这样的高分辨率下流畅运行这三款游戏,其中采用512MB显存、频率较高的GT220性能领先采用1GB显存,频率较低显存的GT220不少,看来显卡的频率仍然在很大程度上要比容量重要。
另外,我们还可以看到GT220和9600GSO性能基本上差距不大,而和HD4670相比是各有胜负,想必这是由于不同的游戏对N卡与A卡的支持度有一定关系。
面对着如今游戏对显卡的3D性能要求越来越高,所以在高分辨率下一些新游戏还是跑不动的,再加上本次测试平台的CPU也是低端产品,所以我们对部分游戏使用1280×720这样的720P分辨率进行测试。除了分辨率有所降低之外,其余设置仍然以最高画质运行。下面是我们测试的成绩,
● 《使命召唤5》
● 《孤岛惊魂2》
● 《优品飞车:变速》
从本页这三款游戏的测试结果中我们看到,在《使命召唤5》这款游戏中,GT20完全领先AMD HD4670,而在《孤岛惊魂2》与《优品飞车:变速》中,高频的GT220又与HD4670性能基本持平。
我们知道GT220有一个很大的特点就是加入了DirectX 10.1的硬件支持,也就代表着目前市面上一些已有的DX10.1游戏不再是A卡说了算。同时,GT220仍然支持NVIDIA独有的物理加速技术,所以我们还挑选了这两种比较具有代表性的游戏进行了测试。
● DirectX 10.1游戏《鹰击长空》
● 物理加速游戏《镜之边缘》
DX10.1游戏我们采用的是《鹰击长空》,我们可以看到即使是低频版的GT220性能也相对9600GSO提升了25%,高频版本更是获得了27FPS的良好表现。不过,HD4670在这款游戏中表现很优秀,达到了30FPS,以3帧的幅度领先GT220.
在物理加速游戏《镜之边缘》的测试中,不管是9600GSO,还是GT220都可以非常流畅的运行,而ATI的HD4670由于无法支持物理加速,在开启物理特效的情况下只能跑6.6帧,比幻灯片还慢。
前面我们说到,GT220采用了目前为止非常先进的GPU工艺制程——40纳米,先进的工艺不仅仅可以体现在面积减小、成本降低、超频能力增强等方面,而且在GPU的工作温度与功耗方面也会有非常好的表现。
● 待机状态下温度与功耗测试(Lower is better):
在待机状态下(Windows 桌面)我们看到,GT220的温度仅仅只有33-34摄氏度,而55nm工艺的9600GSO待机温度高达42摄氏度,HD4670的温度高达42.5摄氏度。功耗方面,待机状态下安装GT220整个平台的功耗刚好为100瓦,而9600GSO功耗高达130瓦,HD4670表现还不错,但也比GT220要高出不少,为109瓦。
● 满载状态下温度与功耗测试(Lower is better):
满负载状态下,GT220的温度大约在70摄氏度左右,9600GSO虽然温度表现不错,只有59摄氏度,但大家应该可以看出这款产品本身默认频率就要低一些,所以得到这个温度也并不奇怪。而在功率方面,我们看到了GT220在满负载条件下只有156瓦的功耗,而9600GSO的功耗高达181瓦,HD4670的功耗高达164瓦。
● 推荐配置
从上面的介绍中已经看出GT220的高性价比以及高能耗比,不仅适合中端游戏玩家选用,还比较适合对发热量以及功耗比较敏感的HTPC用户。在最后我们在为大家介绍两款针对不同人群的配置。
● 中端游戏推荐配置
这款配置总价位不到3600元,性价比非常高,采用了GT220显卡并支持1080P的23寸显示器,使得游戏、高清两不误,非常适合大部分用户选用。
● HTPC推荐配置
这款配置搭配了1TB的大容量硬盘,从而能够储存更多的高清影片,值得说明的这套配置所采用的显示器原生支持HDMI音频输入和GT220显卡完美搭配。进而在客厅更爽的感受高清所打来的快感。
通过前面的介绍以及测试,我们对NVIDIA这次推出的GT220也有了较深的了解和认识。总结起来,新推出的GT220具有以下几点实质性的优势:
1、性能表现良好
对于一款低端显卡,GT220完全可以给用户带来良好的3D游戏体验,近期的热门大作《街霸4》、《优品飞车:变速》、《使命召唤5》等游戏都完全可以流畅的运行,虽然分辨率不高,但是对于这样的低端显卡来说已经非常难得了了。并且,DX10.1游戏不再只有AMD显卡能够有良好的表现,N卡也同样可以硬件支持DirectX 10.1。
2、发热量与功耗都非常低
工艺的更新带来的最显著的效应就是发热量与功耗的大幅度降低,在前面测试中已经能够发现GT220的功耗相当低,较同规格的9600GSO降低了30W左右。另外尽管这款显卡的频率比较高,但在待机时的温度仅不到34度,从而彻底免除了用户对于GT220发热量以及功耗的顾虑。
3、原生支持HDMI音频输出
彻底改进了之前NVIDIA的显卡不能输出HDMI高清音频的不足,在GT220显卡上原生集成了Audio解码单元,使用户不必再为之前繁琐的连接方式所困扰。真正意义上的实现了视频和音频同步输出的功能。
4、完美支持PhysX、DirectCompute、OpenCL
另外,GT220还是目前可以完美支持PhysX物理加速的最低端型号,可以在采用物理引擎开发的游戏中获得非常好的视觉体验。同时,微软主导的DirectCompute GPU通用计算技术,Apple公司主导的OpenCL通用计算技术也可以完美支持,还有NVIDIA CUDA。
总的来说GT220得益于成熟的GT200构架,使得在相同流处理器以及相同显存规格下性能有小幅度增加,并且由于硬件支持DX10.1技术,在DX10.1游戏下的性能表现不会再处于劣势。得益于先进的40nm工艺,GT220的发热量与功耗也有很大的改进。在应用方面,GT220支持PhysX物理加速、CUDA通用运算技术、3D Vision立体视觉技术。因此GT220相对于竞争对手的产品在各个方面的优势相当明显。■<