如王者般归来!丽台WinFast GT240实测
泡泡网显卡频道12月21日 说起丽台,很多DIY老玩家都是耳熟能详,而近些年,丽台对市场策略进行调整,将主要精力投放在专业显卡市场,在民用显卡产品方面却鲜有佳作。
最近我们得到消息,丽台在2009年即将结束的时候又重新进入了民用显卡市场,丽台此举如同《指环王》中穿过亡者之道的阿拉贡一样,手持纳西尔圣剑,重新夺回刚铎国王一样。
丽台重返民用显卡市场的第一件事就是跟NVIDIA同步推出了基于GT215核心的民用显卡——GT240。今天这块卡也来到了我们泡泡网的显卡频道,让我们来通过几个测试大致了解一下它的性能如何。
今年的10月12日NVIDIA正式发布了其首批采用40nm工艺的产品——GT220/210,这两款产品并不仅仅只是一次简单的工艺升级,最主要的是加入了原生HDMI音频输出以及DX10.1等一系列新技术。因此,我们可以说新一代GT200系列是NVIDIA一个新的里程碑。
NVIDIA GT240基于GT215核心
但GT220/210毕竟定位于低端,还无法满足大部分玩家对于性能的需要。而最近NVIDIA发布的面向于主流级的产品GT240则可以充分满足游戏玩家的需求。这款产品不仅同样使用了40nm工艺技术,并且流处理器增加至96个,可以流畅运行大部分游戏。并且原生支持HDMI音频输出,因此也同样适合HTPC用户使用。
丽台WinFast GT240采用了40nm工艺的GT215核心,拥有96个流处理器,支持第二代PureVIDEO HD高清解码引擎和CUDA、Physx物理加速。显存部分采用4颗GDDR5颗粒组成512M 128bit的规格。
在PCB设计方面,这款显卡采用了标准的大PCB设计。整体设计严谨可靠,没有丝毫缩水,在做工用料方面维持了其一惯的水准。
散热器方面,丽台GT240采用了来自瑞士的散热大厂ARCTIC COOLING的中段散热产品——Accelero L2 Pro,这款散热解决方案在常规GT240产品上并不多见。
92mm的大风扇可以根据当时GPU温度在900到2000转/每分钟之间自动调节,同时它还可以提供27CFM的风量,并保证功耗不高于100W的GPU正常工作。在这样强劲的散热器支持下,使得这款显卡的超频性更加值得期待。
供电部分采用了分离式供电设计,两相核心供电在前端、显存供电在后部,用料方面采用了全封闭电感以及日化固态电容。
接口采用了丰富的DVI+VGA+HDMI,照顾到了各种应用人群,三个接口位置合理,同时使用也互不冲突。在新工艺引进这方面,NVIDIA和ATI的做法完全不同。每当台积电宣布研发下一代工艺的时候,ATI总是愿意做台积电的小白鼠,有成功也有过失败。比如首款40nm工艺的桌面级显卡HD4770,就因为40nm产能问题导致HD4770“没出生就夭折”;而NVIDIA则不是这样的风格,往往是等到一代工艺已经很成熟,并且完全可以量产的时候才开始采纳,直接下大订单求得高利润。所以大家可以看到,ATI早在4月份就开始使用40nm工艺,而NVIDIA直到前段时间推出GT220才正式迈入40nm时代。
GT240的一个重要卖点就是采用了40nm工艺,更先进的工艺对于核心本身来说有着诸多的好处,比如降低产品成本、提高核心面积的利用率、同样的核心面积内集成更多的晶体管以实现更高性能的产品、降低功耗与发热量等等好处。对于芯片厂商来说,工艺的每一次提升都是至关重要的。如果没有工艺的限制,那么世界上也根本不可能有最强性能芯片的这种定义,想堆多少晶体管就堆多少。
对于用户来说,工艺的进步最大的优势就是功耗的降低,而功耗与温度、显卡散热器的搭配、噪音等等又有着不可分割的关系。目前最为先进的工艺就是40nm,所以说40nm是实现超低功耗的基本。根据NVIDIA官方的说法,GT240显卡待机功耗只有9W,甚至比一盏家用节能灯泡还要省电,及时满负载运行时的最大功耗也只有70W,这一点我们在前文中已经有所介绍。
通过前面的介绍我们了解到了GT240显卡可以直接使用GDDR5显存颗粒,从颗粒成本上来说,GDDR5显存颗粒明显要比如今已经非常成熟的GDDR3显存颗粒更贵,为什么GDDR5显存颗粒又是“低成本制胜的法宝”呢?要搞清楚这一点,我们首先需要明白GDDR5显存的工作原理以及其相对GDDR3、GDDR4的优势所在。
众所周知,在实际运行游戏从过程中,显存的频率远远比显存的容量重要,或者说现在显存容量已经不是显存性能发挥的瓶颈,最重要的是提升显存的频率才能够从根本上解决显存性能不足的问题。
显存的频率分为I/O频率和核心频率,两者都非常重要,GDDR4显存之所以失败就是因为I/O频率没有提升。和GDDR3以及GDDR4一样,GDDR5显存依然采用8Bit预取技术,也并没有让I/O频率翻倍,而是通过另外一个巧妙的办法解决了I/O频率不足的问题——两条并行的DQ总线,实现了双倍的接口带宽。
三星K4G10325FE-HC05颗粒,32bit/32MB规格,理论工作频率高达5GHz
双倍接口带宽可以起到什么作用呢?很简单的一个道理:可以实现位宽翻倍。简单的理解,128bit的GDDR5显存,几乎等效于256bit的GDDR3显存,因为他们的总存取带宽是完全一样的。所以我们看到,GT240采用的是128bit的显存控制器,但实际上性能并不会差,这一点在我们后文的测试中会予以验证。
对显卡比较熟悉的朋友就应该知道,256bit的显存布线要比128bit显存布线麻烦很多,成本也会自然上升。而GT240采用128Bit显存控制器却实现了等效于GDDR3显存256bit的性能,自然在PCB的设计上会很大程度上降低成本。不过就目前来说,GDDR5显存的出货量还不是太大,而且价格比GDDR3贵,笔者估计从成本上来说估计能和采用GDDR3的256bit持平,一旦GDDR5显存完全普及之后,成本优势即刻就会体现出来。
接下来我们来看看这款显卡在理论3D测试和游戏测试当中的表现如何。
● 测试平台
● 理论性能测试:3DMark Vantage
3DMark Vantage所使用的全新引擎在DX10特效方面和《孤岛危机》不相上下,但3DMark不是游戏,它不用考虑场景运行流畅度的问题,因此Vantage在特效的使用方面比Crysis更加大胆,“滥用”各种消耗资源的特效导致Vantage对显卡的要求空前高涨,号称“显卡危机”的Crysis也不得不甘拜下风。
在3DMark Vantage的测试结果中我们可以看到,采用GDDR5显存的丽台Winfast GT240由于带宽上比较占优势,以绝对的性能优势领先其他几款显卡。
● DX9游戏测试:《街头霸王4》
CAPCOM公司于1987年推出的大型电玩机台格斗游戏《街头霸王》,堪称目前格斗类游戏的始祖。经过了20多年的不断演化之后,如今的PC版《街头霸王4》不仅在画面上走向了全新方向,而且加入了各种新系统,试图让传统2D格斗游戏得到重生。
结果和前面的理论性能测试如出一辙,仍然是GT240性能处于绝对优势,显存带宽还是非常重要的。
● DX10游戏测试:《生化危机5》
09年3月初,《生化危机5》成功登陆PS3和XBOX360平台,并在首日就创下了400万的惊人出货量,向玩家证明了《生化危机》系列的成功。上周末,Capcom终于确定了《生化危机5》(Resident Evil 5)PC版的发售日期,于09年9月18日在欧洲地区上市。
性能的差距相当明显,GT240和9600GT的竞争对手HD4670根本没有办法流畅运行游戏,平均帧数只有20FPS。
● DX10.1游戏测试:《孤岛惊魂2》
自《孤岛惊魂》系列的版权被UBI购买之后,该公司蒙特利尔分部就已经开始着手开发新作,本作不但开发工作从Crytek转交给UBI,而且游戏的故事背景也与前作毫无关系,游戏的图形和物理引擎由UBI方面完全重新制作。
FarCry2是首批DX10.1游戏之一,但是它对DX10.1新指令的应用比较少,只是通过读取Z缓冲中的多重采样深度数据来达到更好的抗锯齿性能。在这款游戏中GT240依然以绝对的性能优势领先。
● 物理游戏性能测试:《一舞成名》
《一舞成名》是一款耗时三年、投资一千万美元打造的中国首款偶像育成类网游。同时,它还是中国首款采用世界非常先进Unreal3引擎、以国际AAA标准研发的原创网络游戏。音乐舞蹈是《一舞成名》的游戏形式,强大的3D互动社区、独创的选秀和偶像育成系统、让人感动流泪的故事情节,将为每一位玩家带来非同一般的体验。玩家要做的就是在《一舞成名》的虚拟世界中通过包括舞蹈在内的各种方式表现自己、传播自己的个性与形象,最终成为万人瞩目的明星。
测试结果一目了然,256bit显存位宽的9600GT领先于GT240,但和GT240性能相差不大,由于A卡不支持GPU物理加速,HD4670得分参考价值依然不大。
人们对视觉的追求是永无止境的。从简单无味的2D画质到美轮美奂的3D画质,从VCD到DVD再到高清视频,人们的视觉追求总是在一步一步提升。而对于这一切,电脑显卡是推动它发展的主要动力。早在DX9时代,高清视频就开始逐渐风靡起来,显卡的功能也不再紧紧是2D和3D画质渲染,同时还要担负起解码高清视频的任务。
NVIDIA早在G98时代就加入了高清视频全硬解的功能
进入DX10时代以来,NVIDIA和ATI两家都不约而同的将高清视频硬件解码当作显卡的一个标配功能。起初ATI在这方面做的非常好,不仅仅完全可以实现硬件解码H.264和VC-1这两个压缩方式的视频,同时还首次在显卡内集成了音频单元,主要为了实现HDMI高清一线通功能,因为HDMI的一大亮点就是可以支持音视频同步输出。
后来NVIDIA也不甘示弱,在G98(8400GS)核心中实现了VC-1和H.264全硬解码的功能,再前一段时间发布的GT220核心中正式加入了音频解码单元,可以支持5.1声道数字音频输出。当然,现在的GT240自然也拥有这些功能。高清解码已经是老技术了,但是加入音频解码单元对于NVIDIA来说还是新技术。
在高清解码方面,GPU硬件解码虽然实用且效率高,但是对一些很老的H.264或者VC-1压缩格式的视频来说,有时候总会出现一些这样那样的问题,比如挂不上字幕啦、不能开启硬件解码啦等等。也就是说GPU硬解高清对于老视频来说兼容性并不是100%的好。使用CPU解码倒是一个办法,但是效率又太低,看一些高码率的视频如同看幻灯片。
如何解决这个问题呢?聪明的NVIDIA想到了CUDA解码的办法,也就是调用GPU中的流处理器进行解码。大家知道,CUDA是NVIDIA的一个通用计算架构,也提供了一些C语言扩展。开发者可以利用CUDA来让GPU计算平时只能CPU计算的项目,也就是说将GPU模拟成CPU来使用了。
在高清领域,使用GPU模拟成CPU来解码,就完全解决了GPU硬件解码兼容性不太好的问题。关于CUDA硬件解码技术的详细介绍与测试,大家可以参阅我们之前的文章——《高清播放再次革命!CUDA解码方案评测》。当然,这一项技术乃NVIDIA独享,AMD目前还没有类似技术,故这算是N卡目前在高清技术方面比AMD更加领先的一点。
从GF8时代,NVIDIA就开始大力宣传一个口号——Graphics Plus,可以简单的理解为“超越传统显卡”。在NVIDIA的眼里,显卡不应该仅仅局限在3D图像渲染的范围内,还应该有通用计算、物理加速、高清解码等等功能。而这一切都在进入GT200时代之后得到了完善。
● CUDA通用计算 解决CPU高性能计算难题
CUDA是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA的处理器上以超高性能运行。按照NVIDIA官方的说法,将来还会支持其它语言,包括FORTRAN以及C++。
简单的理解,CUDA架构就是让之前只能处理图像渲染的GPU通用化处理任何类型的计算,而能够实现任意类型计算的处理器只有CPU,但CPU的计算能力相对于CPU来说很弱,尤其是在处理一些高性能计算的时候CPU的性能明显不足。GPU的通用化可以让需要高性能计算的时候直接调用GPU进行计算,CPU仅仅是处理程序本身的一些工作。
目前,支持CUDA的GPU销量已逾1亿,数以千计的软件开发人员正在使用免费的CUDA软件开发工具来解决各种专业以及家用应用程序中的问题。这些应用程序从视频与音频处理和物理效果模拟到石油天然气勘探、产品设计、医学成像以及科学研究,涵盖了各个领域。 目前市面上已经部署了超过一亿颗支持CUDA的GPU,数以千计的软件开发人员正在使用免费的CUDA软件工具来为各种应用程序加速。
● 内置物理引擎 玩物理游戏无需物理卡
电脑3D图形渲染技术已经发展了很多年,从某种程度上来说已经非常成熟。在DX9.0C时代,业内人士普遍认为3D图形渲染已经没有太大的发展空间,因为已经很真实了。但是有一些公司的眼光可与我们不一样,他们认为3D画质虽然已经很真实,但虚拟物体的物理运动轨迹以及游戏中经常所涉及到的爆炸等等效果还是与现实中的场景相差甚远。于是就有公司做起了物理引擎这一行当。
物理引擎的初衷仅仅是一个引擎,简单的理解就是游戏厂商采用了物理引擎之后,可以让游戏中的物体运动轨迹、撞击、爆炸等效果更佳真实,因为物理引擎的作用就是要让这些游戏中运动的东西按照物理定律进行运动。在这个领域,当时做的最成功的是Ageia与Havok。其中Havok是老牌物理引擎开发商,而Ageia作为后起之秀,靠一个叫做“物理加速卡”的东西一夜成名。
什么是物理加速卡呢?总所周知,计算机显示器上所显示出来的一切,都是要经过计算机进行计算的,计算的速度取决于CPU的计算能力。但是CPU的能力是有限的,Ageia公司发现他们想要实现的效果仅仅依靠CPU的计算根本不可能实现(CPU太弱了),于是他们干脆搞了一个专门计算游戏中物理场景的处理器,这个就叫PPU,也就是“物理处理器”。只要游戏中采用的是Ageia的物理引擎,那么再搭配上这个物理处理器,性能就可以获得很大的提升。将这个PPU安装到一片拥有完整电路、缓存设计的一块PCB上,这就是物理加速卡。
Ageia靠着物理加速卡一夜走红,NVIDIA见势将Ageia高价收入囊中。当然,NVIDIA看中的是Ageia的物理引擎技术,他们要实现的宏图霸业就是在NVIDIA显卡上计算物理场景,而不是需要一块单独的物理加速卡。这对于用户来说玩游戏不再需要话费高价购买一份专门的物理卡,对于NVIDIA来说可以使得其自家GPU的销量大涨。在这一步上,NVIDIA成功了,现在NVIDIA旗下的所有显卡(DX10之后)都支持直接使用GPU物理加速。
以蝙蝠侠为代表的新一代游戏,大半都支持物理引擎
其实,物理加速只所以能够在非常快的时间内应用到NVIDIA的显卡上,得归功于前一页我们介绍的CUDA架构。正是因为CUDA架构的通用性,才使得原本只能使用PPU计算的物理引擎,可以很方便的使用GPU进行计算。现在看来,NVIDIA这一步棋真是非常成功。
显卡的发展经过了纯文本时代、2D时代以及到了今天的3D时代,从图形渲染画质上来讲,已经很难再有很大的提升空间,在如今的游戏中,我们可以看到非常逼真的3D游戏模型、非常炫目的光影特效以及抗锯齿效果等等。但是,这一切仅仅是计算机图形的渲染进入了3D时代,在视觉上,我们仍然没有获得非常豪华的3D效果,比如当游戏中的怪兽拿着斧头朝你砍来的时候,你并不会下意识地躲闪。
相信各位一定看过3D电影,在3D电影场景中,迎面开过来的火车仿佛就要从屏幕上冲出来撞到自己一样,这样的效果对于人们来说,是非常具有吸引力的。在3D游戏中,这种身临其境的游戏体验更是游戏玩家所追求的极致。之前,有一些厂商通过对显示器进行特殊的设计,实现了3D效果,但从实际的效果来看,表现都非常一般,给人的第一感觉就是重影非常严重,笔者经常去中关村溜达,每次进海龙大厦都会抬头看看天花板上挂着的3D电视,那效果简直是要多烂有多烂。并且,这种显示器或者电视价格都非常高,普通用户根本无福享用。
去年,NVIDIA正式面向全球发布了3D Vision技术,通过一种较低成本的方式实现了更好的3D视觉,用户完全可以在自己家里实现3D家庭影院,当然最主要的作用是用作玩3D游戏。但是,这套系统需要一个120MHz刷新率的显示器和一个NVIDIA特制的3D眼镜,算下来价格也不便宜,但这项技术却为后来的普及奠定了基础。
由于成本较高,3D Vision没有办法普及,但NVIDIA似乎早就料到了这一点,今年打出了0成本的3D Vision解决方案——给用户赠送红蓝眼镜。按照NVIDIA官方的说法,这套0成本的3D Vision解决方案是一个预览版本。通过这个眼镜,用户可以在自己的电脑上观看到3D效果,而且不需要购买昂贵的显示器,市面上所有的显示器都可以支持。当然前提是你需要购买NVIDIA的显卡才能够使用此功能。
● 丽台WinFast GT240测试总结
通过测试我们不难发现,丽台WinFast GT240的表现可圈可点:性能方面实属上佳,相比同价位产品优势明显;散热方面出众,搭配ARCTIC COOLING的Accelero L2 Pro,在静音的同时提供了良好的散热效果;在所支持的技术上相当丰富,支持CUDA、PhysX、3D vision、高清音频输出等。
其实以重返民用市场上的第一作来讲,丽台WinFast GT240带给我们更多的不是它的性能有多好,而是它以低姿态重返市场的决心——目前台积电40nm工艺的良品率相比之前仍然没有多少提高,而这就导致09年末到10年初这段时间内很可能GT240会出现真空的“有价无货”状态,而丽台WinFast GT240刚出现就以599元的价格杀进市场,足以见得丽台欲重摘“民用显卡之王”桂冠的决心。在这里,我们虽然不能预祝这款产品卖的有多好,但至少我们可以预计到明年的显卡市场上有了丽台的加入,战局又将是另一番景象。■<