不给AMD任何机会!55nm双核GTX295首测
DX10时代,NVIDIA一直保持着对AMD压倒性优势,高中低端GeForce 8/9都完胜HD2000/3000。但这一局面因HD4000的发布而改变,虽然GTX280依然是单核心之王,虽然三路GTX280稳居游戏性能王者宝座,但单卡之王被双核心的HD4870X2夺走,HD4870/HD4850也能力压GTX260/9800GTX,从此NVIDIA高端优势不再。为了打击AMD的嚣张气焰,55nm工艺改进版GTX200核心被提上日程,双GTX200核心的GTX295也应运而生,HD4870X2的好日子也该到头了……
纵观NVIDIA近年来的GPU发展路线,与Intel的CPU有许多相似之处,总体而言是按照“架构年—工艺年”的钟摆式轨迹前进,G80(80nm)和E6X00(65nm)是老工艺+新架构,而G92(65nm)和E8X00(45nm)则是新工艺+老架构,到了GTX200(65nm)和Core i7(45nm)时代又变成了老工艺+新架构,接下来的产品自然是新工艺+老架构了,这就是我们今天的主角——55nm版GTX200核心。
与CPU厂商不同的是,GPU厂商只设计芯片并没有自己的晶圆厂,GPU必须交给台系半导体厂商代工,因此工艺方面GPU始终比CPU慢半拍。也许是在NV30时代吃了新工艺不完善的亏,NVIDIA对于新工艺的采用一直都比较谨慎。而竞争对手AMD(ATI)正好相反,总是能够抢先一步使用台积电非常先进的工艺。
就拿目前GPU领域非常先进的55nm工艺来说,去年底AMD上代RV670就已经率先享用,而NVIDIA方面直到今年10月份才在G94、G92等轻量级GPU上面使用55nm工艺,而且还犹抱琵琶半遮面,年底才真正量产并铺货。
但话又说回来了,即便是工艺落后对手将近一年,NVIDIA还是能够在竞争中保持全胜战绩,直到HD4000面世后才让NVIDIA感觉到了压力,这才“极不情愿”的将整个产品线更换到了55nm制程。
新工艺不仅可以让GPU的频率和性能得到提升,还能够降低发热与功耗,这就使得55nm版GTX200不再局限与单枪匹马作战了。继7950GX2与9800GX2之后,NVIDIA第三款双核心显卡GTX295新鲜出炉,泡泡网第一时间拿到了这块还处在保密协议中的神秘显卡,为大家献上两块双核心重量级显卡之间的岁末对决!
经常关注显卡资讯的朋友们应该知道,在新一代显卡的较量中,虽然HD4870/HD4850力压GTX260/9800GTX,但优势并不大。随着NVIDIA发布了“Big Bang II”驱动程序,全线显卡在最新游戏中都获得了大小不等的性能提升,在新驱动的助威下,HD4870/HD4850优势不再,高端显卡出现了罕见的势均力敌的局面,A卡和N卡在不同游戏中各有所长,谁也没有绝对的领先优势。
当然,NVIDIA还拥有AMD所不具备的PhysX物理引擎以及CUDA并行计算平台,但由于目前支持PhysX的重量级游戏还不够多、并行计算软件数量也比较少的原因,高端游戏玩家对这种附加值未能投入足够多的重视,真正左右玩家选择的还是游戏性能!于是,NVIDIA开始启用55nm工艺,整条产品线的规格与性能都获得了不同程度的提升:
● 55nm版9800GTX+高频制胜
9800GTX的55nm版本——9800GTX+,核心/流处理器从675/1688/提高至740/1836MHz,而显存保持2200MHz不变,由此9800GTX+面对HD4850得以反败为胜。
● 55nm版9600GT/9600GSO功耗发热更低
65nm版G94(A1)与55nm版G94(B1)核心大小对比
9600GT/9600GSO本身在性能方面就要强于对手的HD4670/4650,因此55nm版本并没有继续提高频率,而是将功耗/发热/成本控制放在了第一位,性价比得到了进一步提升。
● 55nm版GTX260呼之欲出
G200-100-A2,65nm版192SP GTX260
G200-103-A2,65nm版216SP GTX260
G200-103-B2,55nm最新版216SP GTX260
对付HD4870,NVIDIA对GTX260的规格进行了小幅提升,核心流处理器从192个增加至216个,各大AIC的产品也大都进行了默认超频,算是加量不加价的行为。这个策略与当年G80核心8800GTS(640M)从96SP升级至112SP如出一辙,新版本的GTX260只是缓兵之计,真正的重头产品是55nm版本的GTX200核心,新核心将会衍生出包括双核心在内的很多产品!
近年来NVIDIA和AMD双方都热衷于使用双核心来作为旗舰级显卡,这样就可以轻松将显卡性能翻倍,7950GX2、HD3870X2、9800GX2、HD4870X2都是曾经的单卡性能之王。但也有些例外,比如X1900XTX(X1950XTX)、8800GTX(8800Ultra)、HD2900XT、GTX280这些旗舰显卡仅为单核心设计。其实NVIDIA和AMD双方并不是不想做双核心,而是由于R580、G80、R600、GTX200这几颗GPU实在太庞大,功耗发热难以控制,一块显卡上植入两颗GPU的话供电与散热都很难解决。
GTX200核心是一颗拥有14亿晶体管的怪兽,显存位宽高达512Bit,而竞争对手的RV770的仅有9.56亿晶体管,显存位宽仅有256Bit,想要在一块显卡上集成两颗GTX200,难度可想而知!为了达成这项不可能完成的任务,NVIDIA对显卡的布线与PCB设计作了很多更改:
● 忍痛割掉两颗显存,将所有14颗显存移到正面
GTX200的显存位宽是512Bit,总共需要16颗16M×32Bit的GDDR3颗粒才能组成1GB 512Bit的规格,由于显存颗粒实在太多,因此在设计GTX280/GTX260的PCB时,NVIDIA在正反两面各放了8颗,这样有利于PCB走线,但背面的显存需要额外的散热片照顾。
对于GTX200来说,由于显存位宽太高根本无法在一张PCB上集成所有的GPU与显存,最好的解决方案还是由两张PCB组合而成。但如果还是保持正反两面均布显存的设计的话,背面的显存散热就会带来不少麻烦,显存颗粒以及散热片厚度就要占据不少空间,整个显卡的体积会变得臃肿不堪,超出双槽的范围,这样不利于组建多卡系统。
55nm新版GTX260显存分布图:14颗都在正面(没有空焊)
(GTX295显卡的单张PCB也是这种设计)
所以,NVIDIA对PCB设计作了相应的调整,将所有的显存颗粒都放在正面,但只有14颗而不是16颗,也就是说NVIDIA放弃了512Bit位宽,直接采用448Bit,因为整个PCB已经很难再容量下更多的显存以及数据线了。
在优异显卡上阉割显存位宽,这种情况还是第一次出现,相信也是不得已而为之。GTX295是双448Bit设计,但核心规格没有任何删减,流处理器是完整的240×2=480个!
● 沿用9800GX2的专利散热器和结构
有了9800GX2的经验,GTX295的结构沿用之前的设计就行了,通过拆解图可以看出,虽然两块显卡的核心大小、元件分布、供电设计完全不同,但整体结构是差不多的。两块PCB相对而立,中间是一个结构非常复杂的双面散热器,可以同时照顾两颗GPU、28颗显存、NVIO芯片、PCIE桥接芯片、以及供电模块的散热。
为了让夹在中间的涡轮风扇有充足的风量,两块PCB的末端都作了镂空设计,整体结构的复杂度令人叹为观止,精巧的设计巧夺天工!
一颗GTX200核心很恐怖了,那双核心版本岂不与怪兽无异?最初笔者就是这么想像的,但看到GTX295显卡实物的之时,笔者还以为这就是一块普通55nm版GTX280,因为和以往的GTX280相比,它的体形一点也不夸张:
GTX295的输出接口与9800GX2完全相同,除了传统的双Dual-Link DVI之外,还加入了使用率日益广泛的HDMI接口,此外还有两个状态指示灯,可以显示GTX295的电源连接与工作情况。
虽然55nm能够缩小GTX200的核心面积,但14亿晶体管与9.56亿的RV770相比的确不在同一数量级,NVIDIA能够将GTX295的体积控制的如此“标准”,的确十分难能可贵:
GTX280、GTX295、HD4870X2三款显卡的体积完全相同
但为了严格控制功耗与发热,GTX295的默认频率设定得很低,核心/流处理器/显存分别为576/1242/1998MHz,甚至比65nm版GTX280还要低一些,再加上显存容量与位宽有所精简,因此GTX295的理论性能要比GTX280 SLI差。
据了解,55nm GTX200核心的真正实力,将会在单核心的GTX285身上得到完全释放。GTX285的核心/Shader/显存频率分别为648/1476/1242MHz,相比于GTX280的602/1296/1107MHz有明显提升,尤其是Shader频率的提升幅度要超过核心频率,而且显存将会是1GB/512Bit的配置,不会有任何缩水。
● 优异显卡规格对比:
通过规格表可以看出,虽然GTX295使用了55nm工艺的GTX200核心,但单核心规格反而不如65nm的GTX280,核心/流处理器/显存频率整体较低,此外显存容量和位宽也有所损失。之所以这样做主要是为了控制功耗及发热,最终GTX295将TDP控制在了300W以内,理论值仅比HD4870X2高一点。
作为目前最优异的显卡,自然得搭配最优异的平台来测试,因此我们选择了Intel最强的nehalem核心Core i7 Extreme 965搭配3GB DDR3-1333内存,对比显卡包括上代单卡之王HD4870X2以及单核心之王GTX280,驱动为NVIDIA和AMD的最新版本。
● 测试平台配置
PCPOP.COM评测室 | |
硬件系统配置 | |
Core i7 Extreme Edition 965 | |
主 板 |
MSI X58 Platinum |
显 卡 |
|
内 存 |
CORSAIR TR3X3G1333C9 DDR3-1333(9-9-9-20 1T) 3x1G |
硬 盘 |
西部数据 velociraptor 300G 10000RPM 16MB |
电 源 |
海盗船 HX 1000W |
软件系统配置 | |
操作系统 |
Windows vista Unimate 32 Bit SP1 |
DirectX |
10.1 |
显示驱动 |
NVIDIA Forceware 180.84 WHQL(GTX280) NVIDIA Forceware 神秘版本(GTX295) ATI Catalyst 8.12WHQL(HD4870X2) |
● 测试项目
对双核显卡来说,一般负载已经不是其展现实力的舞台,唯有惊人分辨率2560X1600下才能匹配,为此,此次测试使用30寸显示器,并开启4AA16AF等设置检测显卡性能。
由于时间有限,此次测试的游戏并不多,除了理论测试软件3DMarkVantage之外,游戏选择了鼎鼎大名的显卡杀手《孤岛危机》以及《孤岛惊魂2》,还有风靡全球的《使命召唤5》,更多的测试将会在GTX295正式发布之日为大家献上。
● DX9游戏测试:《使命召唤5》
作为《使命召唤》系列的最新作,《使命召唤5》依然使用了DX9的API,不过却加入了很多新的特效,而我们之前也做过特效对比,详情请点这里查看(《使命召唤 5》画质大比拼及美图欣赏)。而作为著名的FPS类游戏,依然使用了Infinity Ward制作的游戏引擎,也大量使用了Normal Map、Specular Map等特效,实现了环境光照。
《使命召唤5:世界战争》用的是从COD2改良而来4代引擎,但增添了某些特色,比如单机模式下有一套全新的指挥系统,玩家借此可向AI队友发布战术命令;游戏支持(部分)场景破坏特性,战斗中可烧毁建筑或植被,视掩体强度来决定子弹射穿程度,悬挂盟军战俘尸体的绳索可被打断等;多人模式下新增了武器,比如火焰喷射器,可熔化对手的皮肤或点燃木制结构的建筑。
虽然COD5的引擎对双核心显卡做了优化,但GTX295与4870X2这两款双核心显卡的效率并不是很高,1920分辨率下GTX280都能胜过4870X2,但2560分辨率下被反超,GTX295则力挽狂澜,超出4870X2达18帧。
● 经典游戏正统续作《FarCry2》
经典之作FarCry曾是首款DX9游戏、首款通过补丁支持DX9C、HDR+AA的游戏,FarCry的成功除了画面极致华丽之外,其游戏中真实的武器操作感觉和明快的画面风格也受到了很多玩家的肯定。在此之后,FarCry的开发商Crytek着手制作Crysis并与EA合作发行,于是FarCry的正统续作FarCry2就由育碧独立制作发行,游戏内容也从热带孤岛转移到了广袤无际的非洲大草原。
FarCry2整个游戏世界面积达到50平方公里,玩家可以自由在其中驰骋,而游戏的结局也是开放的。游戏中的环境可以动态变化,玩家甚至能体验到一年四季、动态天气效果、24小时日夜循环等效果,这也是其不同于其他游戏的亮点。
测试方法:FarCry2自带非常专业灵活的测试程序,自动加载地图并且换场景,充分展示该游戏高精度纹理贴图、火焰、爆炸、广袤的场景、草丛和树木等。
画面设置:FarCry的要求比Crysis低很多,中端显卡都能够特效全开最高流畅运行,此次选择了1920分辨率和2560分辨率:
FarCry2是一款正式支持DX10.1的游戏,HD4000系列显卡跑起来效率都很高,我们可以看到HD4870X2领先于GTX280不是一点半点。不过GTX295拥有两颗GTX280核心(虽然显存有损失),相比GTX280提升达70-80%,一举反超HD4870X2。
● DX10游戏性能测试:《孤岛危机》
Crysis(孤岛危机)无疑是现阶段对电脑配置要求最高的PC游戏大作。Crysis的游戏画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏。
画面设置:游戏版本为V1.2,开启最强DX10效果(Very High),即便是许多高端显卡也只能在低分辨率看幻灯片,所以我们选择了1920×1200,分别开启最强DX10效果(Very High)和最强DX9效果(High)。
测试方法:Crysis内置了CPU和GPU两个测试程序,我们使用GPU测试程序,这个程序会自动切换地图内的全岛风景,得到稳定的平均FPS值。
Crysis开VeryHigh再加4AA,此设置的要求如同显卡的梦魇,GTX280已经力不从心,只有依靠多路系统才能取得流畅的FPS。此时游戏需要的数据处理量较大,GTX295虽然力压HD4870X2,但优势并不大。
2560分辨率下,游戏的数据处理量更加BT,GTX295和HD4870的成绩连25帧的基本要求都满足不了,不过我们可以看到GTX295相对于GTX280的性能提升还是很可观的,这种分辨率下也只有三路四路系统才能跑得动。
由于此次时间仓促,对于几款最新的游戏未能加入测试,尤其是最近几款DX10新作。但少数几项测试,我们也能从中看到GTX295的性能。通过NVIDIA内部资料来看,GTX295在12款主流游戏大作中领先HD4870X2达26%,荣登单卡之王!
此外,NVIDIA显卡能够支持PhysX物理引擎,马上将会有几款同时支持DX10与PhysX的重量级大作发布,在这些游戏中,开启PhysX后N卡将会获得巨幅性能提升。尤其对于双核心的GTX295来说,核心渲染能力处于过剩状态,两颗核心相辅相成可以做到物理效果与DX10性能两不误。下面就来看看NVIDIA官方公布的测试结果:
从测试成绩看,GTX295大幅领先HD4870X2,虽然不排除PhysX的优化,但差距这么大,还要得益于拥有完整2x240流处理器的GTX295双核心。
性能虽然很重要,但在全球倡导节能的今天,能耗比的数值更让人关心。从功耗测试看,得益于55nm工艺进步,GTX295比HD4870X2功耗更低,而两者间的性能差距,对比之下能耗比的优势十分明显。
GTX295的不期而至,从中我们能够看到NVIDIA图形帝国反击的决心。此前NVIDIA被HD4800系列低价上市打个措手不及,不得已只能通过杀价来维持市占率。中端市场,被HD4850、HD4870钳制,而高端市场被HD4870X2夺走了“单卡之王”的称号。虽然当时发烧友迫切希望NVIDIA推出双芯GTX280领衔市场,但受限于工艺发热等原因,迟迟不见踪迹。而现在,随着55nm工艺的成熟,那个熟悉的绿巨人NVIDIA又回来了,工艺进步带来的热量大幅下降,将发烧友的梦想——双芯GTX280成为了现实。
GTX280X2假想图,按当时功耗计算,需2000w电源,而现在....
虽然未知版本GTX295的测试成绩不多,驱动尚不完善,在此种情况下,GTX295仍旧给我们带来了希望。在所有项目中都能完胜对手,性能领先达20-30%。当然GTX295还有另一大优势,那就是两块GTX295组件Quad SLI系统,它能够取代三路GTX280系统,将图形性能提升到新的高度!
在工艺进步的今天,不知道未来会不会出现4核显卡
HD4870X2 CrossFire的效能很低
对于目前的双核心显卡来说,NVIDIA与AMD的效能都非常高,但当组建三路甚至四路系统后,制约因素就很多了,驱动优化至关重要。单卡来说HD4870X2性能大幅领先于GTX280,但HD4870X2 CrossFire的性能却惨不忍睹。
一块GTX295就相当于两块GTX280的性能,我们期待两块GTX295的表现
现今效能最高的显卡核心,经过几代完善的双芯设计方案,现在唯独欠缺的就是对多路驱动的支持。通过上代产品9800GX2与HD3870X2的较量我们可以看出,NVIDIA的Quad SLI效能要比AMD的CrossFire X高不少,现在AMD的HD4870X2交火驱动依然不如人意,我们希望NVIDIA能给大家一个满意的交待,释放出GTX295 Quad SLI的超强实力。<