专业显卡的8X宣言,新款Quadro4及W
作为最大的半导体公司,Intel凭借强大的号召力不仅让AGP成为业界最具影响力的图形接口标准,在推动AGP传输速率方面也具有很大的兴趣与热情。在我们似乎还没有来得及仔细享受AGP 4X时代带来的快感时,这驾以2倍作为跳跃基准的马车已经将AGP 8X随着滚滚风尘带到了我们面前。不过Intel这次在AGP 8X标准的支持方面落在了更为热情的竞争对手的后面,尽管显卡厂商积极响应,但Intel的相应芯片组产品还是颇有些姗姗来迟的架势。
AGP 8X目前的问题在于,它对于提高显卡在游戏性能方面的表现暂无显著效果,这让不少的消费者对这个标准本身颇为怀疑,加上由此带来的一些价格差异,更是让注重性价比的用户对此并不是十分热衷;另外能够支持这个标准的主板并不多,Intel前一段时间的缺席让众多的显卡厂商颇有些一厢情愿的感觉。
Intel首先在主要面对入门级工作站应用的E7205芯片组中提供了对AGP 8X支持,这是不是从某种意义上暗示了目前专业应用比游戏应用更需要这个标准,还是仅仅一种巧合呢?这使得我们更关心AGP 8X对于专业应用的性能到底有何影响,由于我们以前的文章已经有了娱乐级显卡的AGP 8X相关测试,所以对专业性能的关注也就吸引了我们这次测试的全部注意力。
通常将3D与游戏对等起来的用户可能很难想到AGP 8X另外一个颇具潜力的市场,以大量顶点数据传输为主要特征的专业3D应用将是AGP 8X大展身手的广阔天地。与游戏比起来,专业应用更多倾向顶点对模型的构筑,而不是依赖简化的模型通过贴图以进行模型的完善,更重要的是,一些直接向制造设备输出进行即时制造的工业应用软件需要极高的精度,结果是即便是实际顶点数量相同,所需要的存储空间也会由此增大不少。
在各种专业设计过程中,需要处理的顶点数据十分庞大,对模型的拖动以及修改对一般的机器而言都是十分困难的事情,因此使用多处理器的Unix或者NT工作站占据这个市场一点也不奇怪。就处理器与显卡之间的数据传输带宽来说,与一些使用Unix系统比如SUN的工作站两者之间2GB/s以上的带宽比起来,AGP 4X 1GB/s的带宽的确显得有些寒酸,从某种意义上来说它已经成了制约NT工作站性能提升的瓶颈,由此我们也看到了专业显卡从AGP 4X转向AGP 8X的必然趋势。
当然我们也不能认为只要支持AGP 8X,显卡的速度就会由此大幅提高,这样的期望不太现实。打个不算太贴切的比方,这如同一辆可以达到300公里时速的汽车,只能说是具备这样的潜力,如果道路条件或者驾驶水准不具备,在通常的应用中出现不能达到这一速度的情况并不奇怪。目前的AGP 8X只能算是提供了一条高速通道而已,还需要有能充分利用这个通道的设备才能发挥出应有的效果。<
尽管目前还有不少限制,但对于专业应用来说我们依然无法抗拒AGP 8X所带来的巨大潜力,随着Intel推出支持AGP 8X的E7205以及E7505工作站系列芯片组,加上相应主板甚至工作站产品的上市,支持AGP 8X的新款专业卡也陆续亮相,比如nVIDIA的新款Quadro4系列、ATi的FireGL X1系列以及3D Labs的新WildCat系列。
如同在娱乐卡领域力图保持先锋的劲头一样,nVIDIA在专业显卡领域对AGP 8X这一新标准的支持也颇为迅速,一系列支持AGP 8X的新款Quadro4显卡已经来到了我们的面前。Intel对AGP 8X的支持的确对专业显卡来说是一个良好的信号,如果说支持AGP 8X的娱乐级显卡推出还有点一窝蜂心态的表露外,那么专业显卡方面的AGP 8X支持无疑是冷静思考过后的产物。
Quadro4 980XGL是这个系列的最高端型号,按照nVIDIA的命名规则,980中8代表了对AGP 8X的支持,除了这个特性外,它与原来的Quadro4 900XGL相比几乎没有什么改动,甚至连nVIDIA非常注意的工作频率也没有随着新型号的诞生有什么改变。我们想知道nVIDIA仅通过AGP 8X支持就能让980XGL在性能上有比较显著的提高吗?尽管在上次测试几块E7205主板的时候,980XGL已经初步证明了自己的价值,但在这次特地针对它的测试中还是引起了我们的兴趣。
从板卡表面上看,980XGL与原来的900XGL在外形极为相似,但仔细观察可以发现它的供电模块进行了改动,虽然在元件数量上有所减少,但个体电容的明显增大让我们对980XGL有了新的认识,增强了厄流圈也从另外一个方面证实了电源模块得到了加强。除此之外我们并没有看到更为显著的变化,针对电源模块改进的电路的确吸引了我们大部分注意力(从板卡外观),考虑到AGP 8X传输信号的一些区别,注意AGP接口区域也让我们有所收获,与900XGL相比,980XGL的引出电路排布明显不同。我们无法考证芯片本身的具体区别,但从布线上的差异依然能够反映出一些支持AGP 4X与AGP 8X之间的不同。
除了980XGL外,Quadro4 380XGL也来到了我们评测室,作为nVIDIA新的入门级专业卡,它相对低廉的价格可能更会吸引大多数预算并不充裕的个人用户。另外,近期在国内上市的3D Labs WildCat VP560同样是针对入门级专业用户,所以我们特意把它也加入了这次测试,以和Quadro4 380XGL进行对比。至此,此次测试的3位主角全部登场,接下来我们将按品牌分别予以进一步介绍。<
作为当年第一个力推Quadro系列专业卡,并为Quadro系列的普及做出过巨大贡献的ELSA来说,它们的Quadro4 980XGL显卡相信一定会得到很多忠实用户的关注,这次送测的产品也是我们收到的第一块Quadro4 980XGL显卡。
ELSA的Quadro4 980XGL显卡核心的工作频率为300MHz,在PCB的正反面总共搭配了128MB的2.8纳秒DDR显存,运行频率为325MHz,可以提供10.4GB/秒的显存带宽。
在显示输出方面,ELSA Quadro4 980XGL提供了两个DVI 数字视频输出端口和一个3-针的Mini-DIN立体同步输出,其中DVI 数字视频输出通过DVI转D-sub显示转接头可以支持普通的D-SUB模拟视频输出,这样ELSA Quadro4 980XGL就可以方便的实现多种方案的双显示输出,而Mini-DIN 立体同步输出接口可以用来连接3D立体眼镜。<
丽台在重返专业卡市场后显得非常活跃,这次他们同时送来了Quadro4 980XGL和Quadro4 380XGL显卡,因为nVIDIA严格奉行专业系列显卡的公版设计策略,所以市面上的Quadro4系列除了标注的品牌不同外,显卡本身的外形方面并没有区别,丽台的Quadro4 980XGL也是如此,它与ELSA的Quadro4 980XGL显卡极为相似。
丽台Quadro4 980XGL显卡的核心工作频率同样为300MHz,它也搭配了128MB的SAMSUNG 2.8纳秒的DDR显存,运行频率为325MHz,可以提供10.4GB/秒的显存带宽。
丽台Quadro4 980XGL在显示输出方面提供了两个DVI 数字视频输出端口,通过随卡附送的两个DVI转D-sub显示转接头还可以支持普通的D-SUB模拟视频输出,由此实现多方案的双显示输出;它另外还提供了一个3-针的Mini-DIN立体同步输出,可以用来连接3D立体眼镜。<
丽台的Quadro4 380XGL也是严格遵循nVIDIA的公板标准,由于芯片本身的简约以及定位低端,Quadro4 380XGL无论在外形上还是在设计上都要比980XGL简略得多,尽管没有使用更长的PCB板,略显小巧的电源模块设计还是让这样的布置显得游刃有余。如果仅从传统的角度看,可能很难将这块显卡与那些体形巨大的前辈用专业卡这三个字联系起来。
丽台Quadro4 380XGL显卡的核心设计较为简单,加上工作频率仅为275MHz,因此只搭配了大个的散热片就足够了;它搭配了64MB的SAMSUNG 3.6纳秒的DDR显存,运行频率为250MHz,可以提供8GB/秒的显存带宽。
在显示输出方面,Quadro4 380XGL提供了一个DVI 数字视频输出端口和一个D-SUB模拟视频输出端口,它也可以实现多种方案的双显示输出,而且它还提供了S-Video视频输出,这样的配置显得更加的大众化,也符合其市场定位。
实际上380XGL最让一些专业用户欣喜不已的地方可能在于它的售价,根据厂商提供的消息,低成本的设计生产使得380XGL上市时的价格很有可能控制在2千元左右,这将是在主流专业性能条件下能够实现的最低价,十分具有吸引力,就看它的实际性能表现了。<
3D labs的显卡似乎只适合专业应用,无论以前的Permedia系列还是目前的Wildcat VP系列都是如此,尽管3D labs曾拥有以“P10”核心进军娱乐市场的雄心,可那些“专业”的娱乐显卡厂商过于强大,所以基于“P10”核心的显卡也只能退守在专业领域继续发光发热了。
今年问世的Wildcat VP系列定位在中低端,这也算是传统定位高端的野猫系列向中低端扩展了,Wildcat VP560是这个系列的最低端产品,它基于“P10”核心的简化版“P9”核心,板型也没有继承野猫的传统,显得简约不少,特别是电源安排甚至是风扇形式,居然呈现出了一些与Quadro4系列相似的地方,显得很有意思。
在显存配置上考虑到定位与成本因素,Wildcat VP560没有采用Wildcat VP系列引以为荣的256位显存接口,而是提供了128位显存接口,它配备了64MB 4纳秒的Hynix显存,依靠它拥有的虚拟显存技术面向中低端应用并不算是个大问题。
Wildcat VP560在显示输出方面提供了两个DVI 数字视频输出端口,其中DVI 数字视频输出通过DVI转D-sub显示转接头可以支持普通的D-SUB模拟视频输出,它也可以实现多种双显示输出方案。<
考虑到专业卡测试的特殊性以及AGP 8X的支持特性,我们以华硕使用E7205芯片组的P4G8X Deluxe主板为基础,搭配3.06GHz的P4处理器,并使用了总共1.5GB的DDR内存,这样的硬件配备应该可以基本发挥出参测显卡的实力了。
在测试软件方面,我们以SPEC的Viewperf7.0作为基准测试,它的成绩一向拥有十分重要的参考价值,另外当然也会进行基于实际软件的应用测试,我们使用了SPEC提供的apc测试包,用于包括UGS、Solidworks这样的CAD软件,另外还使用了3dsmax的Benchmark测试包以考察DCC方面的性能。
因为不同品牌的Quadro4 980XGL显卡本身及性能表现都是一样的,所以我们只以一块显卡的成绩作为代表,为了考察支持AGP 8X所取得的性能提升,我们加入了Quadro4 900XGL作为980XGL的对比,而380XGL则根据它的定位与定价与主要竞争对手野猫VP560进行对比测试。<
Viewperf 7.0来源于实际应用的一些集合,使用了包括3dsmax、DesignReview、Data Explorer、Lightscape等,是个包括了从DCC到CAD应用,比较有代表性的软件测试包。
3dsmax-01的测试模型来源于3ds max3.1的apc测试包,在测试过程中,Discreet的OpenGL附加驱动会随着程序的运行而自动加载。每个模型使用两个不同的光照模型以反映一系列3ds max用户的实际应用条件,其中的高复杂度模型使用了5个到7个位置光源,以反映高端用户的实际需求,反映中端用户需求的光照模型则只使用了2个位置光源。这个测试对系统的要求达到了一定的高度,最后的测试结果也表明了这一点,最快的成绩也只有大约17.74帧。
980XGL是这个测试的胜利者,但尽管拥有更高的顶点传输带宽,光源对处理器的要求使得980XGL与900XGL的差距小的几乎可以忽略。380XGL无疑是这个测试的亮点,以80%以上的差距将VP560远远甩到了后面,即便是与980XGL相比,也足以证明自己的价值。
Drv-08测试对应DesignReview这一软件,它选用了一个炼油厂模型,通过使用高维曲面函数表示的模型让这个测试与一般的测试稍有不同。为了充分利用动态的存储分配以及表面切割,并没有使用显示列表对显示内容进行排序,当然,这需要比较大的内存空间做后盾,对DesignReview而言,50MB以上的模型十分常见。这个测试包在光照模式下使用了367178个顶点,构成了42821个多边形,为了反映目前DesignReview的实际使用情况,还使用了顶点列表传输数据。
这一系列特性让980XGL受益匪浅,其成绩比900XGL快23%左右说明了一切,AGP 8X的优势在这个测试中十分突出,甚至超过了我们的预期,当然,这个成绩的取得也与Drv-08测试包本身的工作模式息息相关。380XGL表现同样出色,50%的性能优势让VP560显得颇为吃力。
Dx-07测试包通过将跟踪描述的一个矢量场可视化来进行测试。管子的宽度代表特定点矢量场速度大小,这个测试包使用的三角形数量并不多,3000个三角形面大约使用了30万个顶点,所有的测试假定使用一个光源并且对每个顶点颜色单独定义。
由于牵扯到消耗资源的光源模拟,因此AGP 8X在测试中起的作用并不大,光源模拟消耗了一些处理器资源,与900XGL相比,980XGL 10%左右的性能提升也在情理之中。在这个测试中,凭借更高的处理能力,VP560以微弱优势超过了380XGL。<
Light-05使用了Lightscape的Lightwave专业渲染软件测试包,使用了两个模块,一个使用了进程照明,模拟与视觉无关的在环境中穿行的散射光,包含十分细致但是效果显著的光线效果、间接照明、软阴影以及面与面之间的颜色揉和。另外一个模块使用光线跟踪给这个测试模块的特定视角增加镜面聚焦、反射、以及透明效果。这是一个十分消耗处理器资源的测试,最后的测试结果十分有趣,除了Wildcat VP560落后较多外,两个支持AGP 8X的显卡980xGL与380XGL齐头并进,380XGL甚至比900XGL还快些,由于在这个测试中处理器所起的作用要比显卡大得多,所以受处理器限制三块Quadro4显卡得分差距并不算很大,AGP 8X在这里还是找到了发挥所长的天地。
Proe-01对应的是Pro Engineer这个十分高端的CAD软件,除了模型需要众多的三角形构建外,对数据精度的要求更是变态。测试包使用了大约390万-590万个顶点,模型通过光照模式、隐线移除模式以及线框模式进行测试,其中线框模式还加入了对反锯齿的测试。在渲染的过程中,每一帧包含了超过100MB的状态以及顶点数据,对图形以及图形传输子系统要求非常高,最后的测试结果也非常清楚的表明了这一点,AGP 8X对这么大量的数据传输明显要比AGP 4X得心应手得多,980XGL与900XGL相比大约拥有20%左右的性能提升。380XGL也还不错,它以微弱优势超过了Wildcat VP560,即便是与900XGL相比其性能表现也值得称赞了。
UGS同样是个高端CAD类测试,这个测试包基于Unigraphics V17,测试中包括光照、透明光照、以及线框模式。在这个测试中,使用了显示列表用于图形数据传输,每种模式的每帧画面需要生成上千个各种容量的显示列表,因此对图形传输子系统要求很高,最后的测试结果清楚的表明了AGP 8X的优势,980XGL以20%左右的性能超过了900XGL,380XGL也不错,能够达到980XGL 50%左右的性能的确十分对得起它的定价和定位,它高出Wildcat VP560 25%左右,让Wildcat VP 560输得心服口服。<
虽然在SPEC Viewperf7.0的UGS-01测试包中已经测试了显卡的部分UGS性能,但是由于包含的项目毕竟不够丰富,最后的结果可能只能反映一方面的性能,还不能全面的体现显卡在实际使用中的具体表现。我们使用UGS的应用测试包的目的也在于此,通过对UGS更为细致、全面的测试,从而得到更为符合实际情况的测试结果。
测试包使用了一个发动机装配过程,整个装配大约拥有40万个顶点,进气管装配大约含有20万个顶点,在测试中我们发现,对目前的显卡而言,几十万个顶点并不是那么难于对付,可仍旧比较慢的速度对我们的耐心依然是一个十分好的考验。这个测试对系统要求比较高,尤其是内存,稍微有一点不稳定就可能使测试不能顺利进行下去,的确是典型的高端专业CAD软件的特色。
测试的过程相对来说十分漫长,最后的结果分为总体(Overall),图形(Graphics)、CPU综合得分(CPU Composite)、I/O综合得分(I/O Composite)。虽然除了图形得分几项也有稍微的差异,实际上那是基于系统的得分,差距十分轻微,最后的表格我们舍去了其他项目的得分,只提供图形得分对比。
由于测试的项目并不完全依赖大数据量的传输,AGP 8X的优势在传统的对GPU或者CPU高要求的应用中并不太明显,980XGL对900XGL而言实际性能提高3%左右也算合情合理了。至于380XGL,则继续保持着对VP560的相当优势,35%左右的性能差距还需要VP560继续努力。<
Solidworks测试包基于SolidWorks 2001Plus,通过模拟一个Solidworks用户来测试图形系统性能,在测试的过程中,使用了不同的CAD/CAM模型,其中最大的一个拥有225万个多边形。最后的测试结果同样分为四个子项目,分别是:整体得分(Overall)、图形得分(Graphics)、CPU强度测试得分(CPU Intensive)、I/O强度测试得分(I/O Intensive)。从我们最后得到的结果看出,关于处理器以及I/O方面的测试测试成绩差异极小,因此我们也舍弃了这几个方面得分,只列出图形系统得分。
从理论上说,AGP 8X支持应会让225万个多边形的顶点数据传输从中获益,但是最后的结果并没有大幅度的提高,980XGL与900XGL之间的差异出现了与UGS测试中的类似性,在这种大数据流应用中能够获得整体6%左右的性能提升,980XGL也算合格了。有趣的是,从图形一项得分来看,380XGL居然具备能够与900XGL抗衡的实力,两者之间差异不大让我们颇为诧异,实在难以想象380XGL居然表现这么好,而Wildcat VP560的再次落后并没有让我们奇怪。<
在3ds Max 5的实际测试中,考虑到3ds Max能够同时提供对DirectX 8以及OpenGL的支持,我们也根据显卡的支持能力以及速度,对VP560和980XGL分别在两个API下作了对比。
从最后的测试结果看,在默认的OpenGL条件下,980XGL的得分与900XGL几乎一样,其差距基本可以归于测试误差,380XGL继续保持对VP560的领先优势。实际上3ds Max测试包中所用到的模型并不太复杂,也就是说,在这种情况下无法利用到AGP 8X提供的高带宽,并且测试更多倾向于简单模型的移动以及光源的实时处理,处理器的处理能力直接限制了最后得分。<
最后我们顺便来谈谈nVIDIA的Cg插件,实际上对于3ds max5.0,它对于nVIDIA的Cg插件的引入更让人关心。nVIDIA在Cg插件中提供了许多符合DirectX标准文件格式的效果器,作为一个DCC作者能够通过对内置效果器的直接调用,轻易实现非常绚丽的效果,而不需要在3ds max中去进行特别的调整,十分方便。更让人高兴的是,这些效果调整是通过实时实现,能够马上看到自己期望的效果,如果你对效果不满意,并且具有一定的编程能力的话,完全可以将标准的效果器编成满足自己要求的效果器。如果仅仅停留在此的话,那就意味着CgFX插件的灵活度还不够,幸好nVIDIA比我们想得更为充分,可以自由调用所有符合标准的效果器极大扩充了创造空间,这意味着你能够将其他人实现的效果轻易借用,达到提高效率和水准的目的。
CgFX插件能够通过效果器模板的选择直接与3ds max实现互动,操作起来就如同3ds max软件本身的一个模块一样,没有任何操作上的隔阂。CgFX提供了十分丰富的效果插件,包括各向异性、凹凸贴图、塑料、金属、皮肤等等,种类繁多,并且十分易用。
随这个软件包,nVIDIA也提供了一些预先做好的模板,以供对CgFX插件不熟悉的用户进行模仿。举例来说,我们可以打开一个模板中外星人模型,然后在3ds max的Rendering中选择Material Editor,这时可以发现已经提供一些预设好的材质,在Viewport Manager选项中找到CgFX选项,勾选右侧的Enabled从而实现材质与CgFX标准的关联。
这还不是所有设定的结束,而仅仅是进行调整的开始,在接下来的Viewport Shader-CgFX编辑窗口中的左下角,有一个Connection Editor选项,这就是打开所有.fx效果器的开关,选择之后会跳出一个关联窗口,点击CgFX Shader的标准文件,选择File,所有nVIDIA效果器将通过窗口呈现,如果你愿意,可以选择你想实现的各种效果。在这个窗口下,还能够调整环境光、散射光等等颜色,从而得到不同的表现,如果对材质也不满意,可以点击默认的材质在nVIDIA提供的标准材质中进行选择。笔者给外星人头选择的是LambSkin_ps11_tex.fx效果器,眼睛和外星人的金属饰物选择的是metalP.fx效果器,至于外星人的身体,选择了SimpleTexture.fx效果器,并选择了一个比较有趣的材质,最后的结果如图,当然还有许多其他选择能够实现很多种组合。
有些读者可能会对此不解,认为这与最终用户有什么关系呢?因为有了这样方便的创作工具,游戏编写人员将能够很容易实现对高级效果的支持,这将极大的有利于最新技术的推广。我们最后得到的将不仅仅是有支持最新技术的硬件,更重要的是我们还将拥有更多能够发挥硬件潜能的大量软件,这不正是我们购买新硬件的根本目的所在!
总的来说Cg带给我们很大的震撼,这个插件从某种意义上比nVIDIA提供的硬件产品更让人心动,如果说硬件只提供了一个能够实现特殊效果的平台的话,Cg的确是提供了实现无限复杂效果的有力武器,硬件毕竟会受到架构以及一些技术限制,软件却能够随着时间的推移让有创意的思维大放异彩。Cg已经推出一段时间,但是由于种种原因我们还没有看到它的普遍应用,提供3ds max上的插件是一个良好的信号,在我们测试的时候,也听到了nVIDIA将这个技术引入Maya的消息,看来Cg被业界知名软件接受的程度比我们想象的要迅速得多!<
专业测试从来都是一个费心费力的过程,但这次的测试结果还是让我们十分欣慰,Quadro4 980XGL凭借对于AGP 8X的支持,仅仅凭借传输率瓶颈得到突破便能在一些测试项目中取得20%左右的性能提升,特别是在使用了大量顶点数据以及大量显示列表的测试中,它表现出了相当的性能优势,甚至在一些实际应用测试中,它也能够取得6%左右的性能提升。你也许认为这些提升还不够大,但是不要忘了这仅仅是提高传输率所实现的性能提升,这也意味着未来速度更快的专业显卡将获益匪浅,与当时AGP 2X转向AGP 4X比起来,AGP 8X 具有更为实际的意义,也打破了很多人心中的AGP 8X无用观念。
很明显,Quadro4 980XGL将取代900XGL继续捍卫nVIDIA在专业领域的地位,凭借良好的兼容性以及业界对这个系列的广泛支持,它在GeForce FX的专业版本出世之前都将是十分有诱惑力的选择,特别是对于那些对速度和品质要求很高的用户,Quadro4 980XGL的确是个优秀的选择。
PCPOP编辑选择:Quadro4 380XGL显示卡
Quadro4 380XGL明显超出了我们的预期,想不到它居然能够有如此表现。380XGL虽然缺乏一些像Pixel Shader支持这类诱人的新特性,但在支持OpenGL 2.0标准的软件还没有推出之前,它对于目前以OpenGL为主的专业应用来说已经基本够用了。最重要的是,在获得良好的性能,380XGL并不会让你破费太多,2千多元的价格绝对称得上物超所值。鉴于Quadro4 380XGL优异的性价比,我们决定授予它编辑选择奖!
至于wildcat VP560,作为“野猫”系列的最低端产品,3千多元的售价毫无疑问是“野猫”历史上最为便宜的显卡,做为一个低端产品,它与380XGL比起来性能确实处于劣势,“野猫”这一品牌对它来说,拥有的贵族象征意义可能比实际的性能意义大得多。不过我们也不能过多地仅从性能上来要求这块显卡,毕竟它还有着对一些图形新特性的支持,随着OpenGL2.0的推出,它还将有更大的发挥空间。<