NV迈进DX10.1时代!40nm工艺GT220评测
泡泡网显卡频道9月15日 近几年随着金融危机的来袭,很多IT厂商都放慢了新品的发布速度,就连显卡的领头军——NVIDIA和ATI也都放缓了前进的步伐,如身经百战的G92核心和以性价比著称的RV770,都已经服役了将近两年。而在今年ATI抢先推出了40nm工艺的HD4770之后,NVIDIA似乎开始感觉到压力了。
一直以来NVIDIA似乎都在采取稳中取胜的策略,并不盲目追求一些不成熟的新技术、新工艺。每代的高端核心均采用当时比较成熟的制造工艺,而新技术、新工艺会在后续的低端产品中进行试水,例如8800GTX上市时只采用了90nm工艺,而经过之后的数次改进,一代经典——65nm/55nm的G92诞生了。
这次的情况也不例外,在GTX285用保守的技术取得了阶段性的胜利以后,NVIDIA开始为下一代产品的成功积累经验,于是结合了目前众多新技术于一身的GT220诞生了。GT220虽然定位于低端,但我们认为确是一款划时代的产品,在支持的技术以及采用的工艺上创下了NVIDIA很多的第一次,下面我们就对GT220的新特性分别加以介绍。
● NVIDIA首款采用DX10.1的显卡
尽管在大多数人看来DX10.1和DX10并没有本质性的差别,但根据微软的说法,DX 10.1是对DX10的一系列完善、补充、拓展和延伸,并增加5个新的API、支持即将发布的最新硬件、强制要求FP32纹理过滤和4x MSAA多重采样反锯齿。
DX10.1主要更新内容:
1. 支持Shader Mode 4.1
2. 新的着色指令支持立方体纹理贴图阵列
3. 应用程序可以控制多重采样和超级采样的使用,并选择在特定场景出现的采样模板
4. 可以直接对压缩的纹理材质进行渲染
5. 更具弹性的资源复制和利用
6. 包括多个渲染目标的总体混合模式,以及更新的浮点混合功能
之前AMD所演示DX10.1全局照明以及MSAA效果
理论上来讲,DX10.1的要点在于提高执行效率、减少重复性的GPU资源浪费,至于特效方面不会带来太大的惊喜。而且目前的情况是,DX10游戏刚刚起步,DX10的指令和特效尚未得到充分利用,至于更新的DX10.1指令集恐怕无法在短时间内得到使用。另外,从DX10.1的更新内容来看,它远不如从DX9B到DX9C的改动那么巨大,因此DX10.1的意义恐怕会大打折扣。
尽管NVIDIA在一开始也并不看好DX10.1的前景,但由于DX10.1的高执行效率非常有助于低端显卡的性能提升,因此在GT220中首次引入这项技术,并且还会在新一代GT200全系列产品中逐步引入这项技术。关于DX10.1对性能的影响我们会在后面测到。
● NVIDIA首款采用40nm的显卡
除DX10.1之外,GT220最大的看点当然是40nm工艺,之前AMD也尝试过抢先采用40nm工艺GPU,但由于当时台积电40nm工艺还相当不成熟,导致良品率极低,直接造成了HD4770因供货不足,只能提早推出市场。同时也证明了过于激进的采用新工艺并不一定会取得成功。
而目前台积电的40nm工艺已经发展相当成熟,良品率已经提高到可以同时应对ATI、NVIDIA下一代DX11的多款产品线的需要,NVIDIA视时机又开始出手了。
GT220是NVIDIA首批现身市场的40nm工艺产品,和9600GSO(G94)的核心面积相比有明显减小,这就意味着几乎在相同的性能下,GT220的生产成本将大大下降,不仅如此在理论上GT220将拥有更低的功耗以及发热量。这一点我们后面也会测到。
● NVIDIA首款采用gDDR3的显卡
GT220在显存方面一改之前低端卡只采用性能低下的GDDR2局面,首次采用了gDDR3显存颗粒,虽然gDDR3单颗位宽只有GDDR3的一半,但存储密度却是GDDR3的两倍,而且在相同频率下(比如2000MHz),gDDR3的核心频率是GDDR3的一半,因此功耗发热要低很多。对于位宽不高的中低端显卡来说,gDDR3大容量、低成本、低功耗发热的特性简直相当完美!
为了和DDR3内存颗粒区分,DRAM厂将其称为Graphics DDR3 SDRAM,简写为gDDR3,和DDR3内存颗粒一样都是8bit预取技术,单颗16bit,定位中低端显卡;而传统的GDDR3则是Graphics GDDR3 SDRAM的简写,它和DDR2内存一样采用了4bit预取技术,单颗32bit,主要定位中高端显卡。但我们所得到的显卡并不是个gDDR3版本的,而是普通的GDDR2版本。
● NVIDIA首款集成声卡的显卡
之前对于组建HTPC的用户来说选显卡一直是一大难题,之前NVIDIA的显卡在HTPC领域的优势并不是很明显,这主要不是在性能方面而是由于之前NV的显卡并不能原生输出HDMI音频,因此用户在连接上会稍微有些麻烦。不过GT220彻底解决了这一问题。
GT220在核心内部已经原生集成了HD Audio CODEC,也就是说GT220已经不再需要和主板的声卡进行连接,就可以独立输出音频,极大地方便了HTPC用户,再加上其低功耗、低热量,相信一定是日后组建HTPC的首选。
在6月初我们就已经爆出NVIDIA将要发布采用40nm工艺并支持DX10.1显卡的GT220的消息,并且也在后续的消息指出先期发布的产品也并不仅仅只针对于OEM市场,也将面向于零售市场。而如今3个月已经过去了,却仍然只闻其声不见其物,并没有在市场上看到其零售版的身影,简直吊足了广大玩家胃口。
目前POP评测室已经得到了GT220的工程样版,该显卡核心开发代号为NV216,拥有48个流处理器,核心规格和G94核心的GeForce9600GSO基本相同,但这款产品是首批采用台积电40nm工艺并首次支持DX10.1的GPU,在显存搭配上采用1024MB的GDDR2显存。
从核心大小上可以看到,得益于40nm制作工艺,核心面积明显减小,降低了核心制作成本。另外,先进的制作工艺在理论上可以降低发热量,并且超频能力也会相应提高。
在测试之前,先来介绍一下我们测试平台、测试的项目以及测试方法等。另外,由于我们得到的产品为工程样品,其频率并没最终定下来。因此,就不和其他产品进行对比了。
● 测试平台
● 测试项目及方法
理论性能测试:选用最具权威性的3Dmark Vantage的总分及GPU得分进行测试。
常规性游戏测试:挑选几款热门游戏进行流畅性测试,模式:1440*900。
DX10.1性能对比:通过《晴空》这款DX10和DX10.1双模式游戏,对比出GT220是否对DX10.1游戏性能有提升。
功耗测试:由于测量显卡的功耗有一定的误差,因此我们关闭CPU及主板的省电功能,并选用整机的满载功耗和待机功耗。
发热量测试:室温为15度。
注:由于这款显卡并不是定位于游戏显卡,因此我们在游戏测试中只测DX9、DX10各两款游戏。
● 3DMark Vantage
3DMark Vantage是业界第一套专门基于微软DX10 API接口、Windows vista操作系统(需SP1)打造的综合性基准测试工具,能全面发挥多路显卡、多核心处理器的优势,可以在当前和未来一段时间内满足PC系统游戏性能测试需求。
● 测试成绩
这款产品定位低端,因此就不要指望其拥有多么强悍的性能了,但测试出来的成绩已经完全超越HD4650。可见GT220日后在低端产品中是一款非常具有竞争力的产品。
● 3D游戏性能对比测试:《最后的神迹》
由史克威尔·艾尼克斯负责开发的RPG大作《最后的神迹》是一款受到了很高评价的游戏,并且已经登陆PC平台。游戏采用虚幻3引擎开发,能够代表不少电视游戏平台移植作品的性能表现。
在测试中我们选用19寸液晶的标准分辨率(1680*1050)进行测试,可以看到GT220可以勉强在高分辨率下运行,但画面稍微有些停顿。
● DX9游戏性能测试:《求生之路》
《Left 4 Dead》使用强化版的Source引擎,代表着《半条命2》系列作品的硬件需求。是近期一款比较热门的电脑射击游戏,是不可或缺的DX9测试项目。
可能由于ATI的显卡在对DX9的支持上要好于NVIDIA的显卡,因此在这次测试中HD4650小幅领先。
● DX10游戏性能测试《鬼泣4》
作为主机移植大作的《鬼泣4》,也是近期很多玩家所钟爱的游戏。虽然是一款移植过来的作品,但是在画质上几乎无可挑剔,可玩度也非常高。
在测试中同样开启了4AA和16AF,测试帧数达到近40帧,还算基本流畅。看来GT220玩这款游戏基本不成问题。
● DX10游戏测试:《孤岛惊魂2》
《孤岛惊魂2》的故事背景虽然从前代中的海岛转换到了非洲草原,但漂亮的画面效果却被继承了下来。同时,由于其号称可以与Crysis媲美,成为了显卡测试中不可或缺的成员。
孤岛惊魂2果然相当考验显卡,在1440*900的分辨率下仅得到22帧的速度,不能算流畅。
● DX10.1游戏性能测试:《晴空》
虽然整体画面效果没有《CRYSIS》出色,不过其应用的光线追踪渲染技术还是非常考验显卡性能的,很多勉强通过了《CRYSIS》考验的显卡却在《晴空》面前纷纷落马。
DX10.1模式
DX10模式
在测试中我们开启的4AA,可以看到DX10.1还是有一定效果,由于DX10.1在DX10的基础上得到了一些精简以及优化,因此支持DX10.1的显卡,在理论执行效率上有所提升。但1帧的差距也不排除是测试误差。
游戏当然不是这些低端显卡的强项,实际上很多用户选择低端卡的目的也并不是为了玩游戏,而是组建可以播放高清的HTPC,而高清并不是所有主机就能播放的,必备的一点就是显卡必须要支持高清解码。不然,单纯靠CPU解码能力很难实现流畅的播放。
测试中我们采用VC-1编码的1080P电影,具体的规格如上图。
GT220实时CPU占用率9%
9500GT实时CPU占用率8%
HD4650实时CPU占用率7%
可以看出所测得三款显卡对于高清的支持都相当到位,在开启硬件加速的情况下,CPU的占用率都不过10%。但9500GT可能会在声音输出方面有一些小麻烦(须内部连接数字音频跳线)。
入门级显卡的测试重点当然不在于性能方面而是在节能方面,尤其是采用40nm新工艺的显卡,理论上功耗更低、更节能。下面我们就来测试一下这款显卡的是否节能。
● 满载功耗
● 待机功耗
40nm工艺果然名不虚传,即使在满载的时候整机功耗(注意是整机)也不过121W,在待机功耗更是下降到100W以下。这是其他任何一款显卡无法比拟的。
总的来说,GT220借助于NVIDIA卡特有的供电技术可以明显降低显卡和显存频率,节约电力,降低风扇噪音,但是毫不影响这些应用的性能。在待机模式下,显卡频率降至最低,并且降低芯片电压,关闭未被使用的电路,最大限度的节约电力,降低风扇噪音,延长板卡使用寿命。
之前已经提到过,40nm工艺的显卡不仅在功耗方面下降很多,在对发热量的控制方面也是相当优秀,在最后我们再来测试一下。
● 待机温度
● 满载温度
结果正如我们想得那样,40nm工艺显然带来了功耗以及发热量的重大改进。在这次测试中,GT220的表现非常完美,即使是在满载的情况下温度也不过50度。
尽管我们测试的这款显卡在性能上不是很突出,但我们已经从这款显卡看到了NVIDIA新一代GT200以及下一代GT300显卡的优势,得益于台积电40nm工艺使得新一代显卡在同等性能下,拥有更小的核心面积,进而大大的降低制作成本。功耗以及发热量的改善,能够使显卡的频率进一步提升,从而达到前所未有的性能。
另外,GT220的核心还集成HDMI音频输出的功能,打破了一直以来NV的卡不能输出声音的尴尬,并且相信NVIDIA将在新一代显卡中全面普及这项技术。使得NVIDIA在高清领域的优势更加明显。
除此之外再加上NVIDIA原有的特色技术,例如:通用计算技术CUDA、物理加速技术PhysX以及立体视觉技术3D vision,使得NVIDIA的新一代GT200系列,在同时代产品中更具竞争力。并且我们相信NVIDIA下一代GT300核心也将是一款另我们眼前一亮的产品。■<