SPEC VPF12做裁判!五款专业显卡评测
泡泡网显卡频道12月31日 随着现代科研、工业对专业显卡的依赖程度升温,AMD对专业绘图市场的重视程度也达到了空前的高度。随着科研力量的加大,前几代GPU产品在OpenGL和驱动程序方面的BUG被逐渐排除,专业制图软件的支持度也有所改善,AMD专业显卡逐渐获得市场的认可,尤其是当核心过度到GCN架构以后,FirePro W系列专业显卡以其过硬的品质和极高的性价比在市场上赢得了一席之地。
而随着前段时间数款新产品的发布,新一代的W9100/8100等升级版目前也已经到齐,蓝宝石AMD FirePro W系列专业显卡在高中低端市场的布局已经完成,从3万多到几千块价位都有货悉数上架。
专业显卡为何卖的那么贵呢?很多朋友想知道专业显卡和消费级的普通显卡究竟有不同,是不是专业显卡的性能要比普通显卡高的多?其实不是的!正所谓术业有专攻,在游戏方面,再“专业”的显卡也并无任何优势,有些专业显卡甚至不能用来玩游戏。面对动辄几万的售价,也应该少有人为了玩游戏去买它。专业卡之所以专业,是因为它有很多普通显卡不能比拟的特质和功能。
★ 数据纠正显存(ECC)和专业软件认证
专业显卡由于针对专业3D设计软件做过优化,数据纠正显存(ECC)能够实现错误检查和纠正技术(ECC)的显存,这些能提高系统计算可靠性所以在显示上更为准确,由于游戏显卡,没有专业软件认证,所以无法良好的支持专业3D设计软件,在模型的显示上,难免会出现贴图错误。而AMD专业绘图卡皆通过专业软件认证,可发挥认证软件的完整功能应用于下列工作:
工程与绘图设计软件 (CAD/CAE/AEC)、数字内容创作 (DCC) 与数字多媒体认证、地理信息系统(GIS) 与可视化、生命科学、石油煤气探勘等。
★ 实时渲染大幅提高工作效率
其次,专业显卡还能极大的减轻在制作过程中CPU的负荷,譬如对一个复杂模型进行移动操作,游戏显卡就会出现跳帧、不流畅,造成无法精确移动,可能就会移动很多次后,仍然无法移动到准确的位置。然而显示是否错误、运行是否流畅、稳定,都会极大的影响制作的效率,甚至影响制作者的心情。
由于各家显卡的不同,以及显卡驱动的不同,这个显卡渲染结果和真实的最终渲染结果是有区别的,区别有多大,则取决于显卡的驱动对3Ds MAX的优化,以及是否是专业显卡。专业的显卡以及针对专业3D设计软件的驱动优化,能够让这个显示效果尽可能的接近最终渲染效果。也就能让制作者无需最终渲染就能大概的了解到最终成品的效果是怎样的,极大的方便了制作者的调整工作,减少工作效率。
不同的专业软件对专业卡的要求也不同,例如MAYA就需要overlay,如果不支持的话,操作速度会慢不少,而其他的专业软件如果用overlay倒不会提高速度反而会可能下降 ;此外,具备硬件线框抗锯齿的专业卡跑CAD/CAM软件的时候,也明显比要一般的游戏卡快上不少。面对如此多的特殊需求,专业卡的驱动程序需要专门的优化才能达到非常好的的兼容性和速度 ,绝大部分的游戏软件都很少会用到这类特性,并且性能瓶颈多数卡在像素阶段而不是像专业软件多数卡在几何处理阶段上。
★ GeometryBoost 强化几何运算处理技术
GeometryBoost 强化几何运算处理技术, 它是透过增加额外的硬件处理单元,可以在每个时钟周期中处理更多的数据,在实际操作后, 您会发现新款绘图卡在处理几何的表现上是难以置信的快速,在CAD或者DCC软件可以更流畅的处理复杂的模型。
★ 帧锁定(Framelock,帧锁相)
帧锁定(Framelock,帧锁相)是一种使显示像素的扫描与同步源实现同步的过程。能够借助硬件使每个显示屏上的帧实现同步,同时还能在多个显示屏上刷新画面。如果应用在多台显示器上显示,帧锁相系统有助于保持画面的连贯性,从而生成虚拟幕布。
FrameLock 当若干系统连接在一起时,同步信号在网络中从主系统馈送到其他系统,显示帧彼此之间保持同步。通过这帧同步可以使一套或多套系统与同一时钟源同步。Framelock 技术能够对同步显示刷新和多系统显示的缓冲交换起作用,能够和genlock一起使用。
★ 同步锁定(Genlock,同步锁相)
同步锁定(Genlock,同步锁相)可以使一套系统或多套系统与同一同步源实现同步。使视频的刷新和外部视频源保持一致,当提供了一个适当的信号后,图形卡就会把它的显示刷新率和这个信号锁定。
Genlock一般采用BNC接头。这让显卡可以接收外部的参考信号,例如电视墙画面的同步化,所有画面的闪烁跳动都达成一致.
★ 10bit色高精度显示
在消费级市场,10bit色显示意义并不大,但对于需要高精度图像显示的场合,比如X光底片分析、胶片质量CG渲染等,其价值是无法用常规数据来衡量的。
提供更完整的不压缩每个RGB像素10-bit图像输出,用于医疗、军事等级的显示器更为细致拟真的色彩,让专业人员准确判断影像中的信息,当然这些需配合10bit专业显示器才能看出效果。如果显示设备可以支持的话,只要在驱动里面将选项打勾,并重启电脑即可。
但是,我们得明白一点,无论怎样的优化,都没办法让显卡渲染的结果和CPU渲染的最终成品完全一致。从某种意义上来说,显卡渲染的图像其实是一种残次品,显卡所支持的OPENGL函数,特别是游戏显卡支持的OPENGL函数是缩水的简化版本,用显卡渲染是一种为了速度而降低质量的、无奈的处理办法。
本次测试的显卡分别是蓝宝石AMD FirePro W9100、W8100、W5100、W4100和W2100。FirePro W9100是目前专业显卡领域的旗舰级产品,它采用了和桌面上R9 290系列一样的“夏威夷”核心,2816个流处理器,176个纹理单元,64个ROP单元。为了追求极致的稳定,FirePro W9100核心频率略低于桌面版本,但即便如此仍旧可提供5.24TFlops单精度浮点性能、2.62TFlops双精度浮点性能,不但双精度效率达到了单精度的1/2,还是第一个双精度破2TFlops的专业卡。
FirePro W9100采用了惊人的16GB GDDR5显存,512-bit位宽、5GB有效频率,带宽达到了320GB/s并支持ECC。为了做到如此海量显存,AMD使用了十六颗8Gb颗粒。热设计功耗为275W,只比上代W9000高了1W。
FirePro W9100官方建议零售价和上代W9000完全相同,可以说是加量不加价,比竞争对手的NVIDIA Quadro K6000便宜了足足1000美元。
输出接口是一个三针立体mini DIN(用于HD3D立体)、六个miniDP 1.2,最多六屏输出,单屏分辨率最高4096×2160,也就是能上六个4K屏。
FirePro W8100
FirePro W8100是继旗舰W9100之后第二款采用2代GCN架构的专业显卡。它配备了2560个渲染单元和8GB 512bit显存规格,拥有高达 4.2TFLOPS的单精度浮点运算能力,超过2TFLOPS双精度计算性能更是惊人,被业界誉为新一代4K工作站的黄金搭档。蓝宝AMD FirePro W8100专业显卡已全面上架,价格仅为15290元,是HPC工作站一个很好的选择。
作为最新一代FirePro专业显卡,蓝宝石W8100专业显卡采用了28nm GCN架构GPU核心,总计2560渲染单元,核心频率824MHz。是继旗舰品蓝宝石W9100之后又一在2万元内“怪兽级”专业显卡。
在显存方面,W8100专业显卡采用了8GB的高速GDDR5显存,提供512bit的显存位宽和320GB/s显存带宽,可以帮助用户实现动态编辑4K视频、添加多种特效和调色。另外,用户也可以借助海量显存加载大规模组件和数据集,并实时对它们进行处理。
蓝宝石W8100专业显卡利用OpenCL技术加速Premiere Pro CC中的40多种特效,可以迅速而流畅地完成编辑高清、4K甚至更高分辨率的视频,不用再浪费时间等待渲染完成。另外,该显卡同样支持OpenCL跨平台技术,支持多达四个GPU。
一些工作量较小的客户可能并不需要优异专业显卡的强劲性能,那么中端或者入门级专业显卡就是最好的选择。
W5100作为上代W5000的取代者,首度使用了 Bonaire GPU,配备了768SP,性能比W5000更高。搭载了4GB GDDR5显存,拥有4个Mini DP输出,轻松搞定高分辨率和多屏显示。
W4100是继W600之后首次使用了Cape Verde核心,定位于入门级,但即使如此W4100仍然搭载2GB GDDR5显存,4个Mini DP,能同时支持4个4K显示器,最大功耗仅为50W,支持AMD Zerocore 节电技术和PowerTune 动能技术,通过该两项技术,有效地对功耗和性能做出控制手段,在低负载的情况下使整机功耗最大降低95%,对于需要从事多屏并对功耗有严格控制的用户来说,W4100是最理想选择。
入门级的型号为W2100,使用了OLAND核心,搭载2GB显存,可以提供403.2GFLOPS的计算性能,支持AMD Zerocore 节电技术和PowerTune 动能技术,提供完整的30bit 处理及传送,外观采用主动式散热方案,其半高卡设计完美兼容各类型机箱服务器等,虽然性能不强但最大功耗仅为26W,适合对多屏应用强度不大的偏平面CAD及简单3D CAD的用户使用。
测试说明和平台介绍
此次测试的对象均属于专业显卡,测试时主要侧重于专业制图性能,所以传统的游戏并没有加入,而是使用了专业绘图测试的SPECViewperf 12软件。
SPEC(Standard Performance Evaluation Corporation,标准性能评测机构)是国际上对系统应用性能进行标准评测的权威组织。VPF 12 要求显示器的最低分辨率是 1920x1080,由于 VPF 12 是以窗口模式运行,因此桌面分辨率高于视窗对性能的影响并不大。
CATIA-04 场景测试集是由 Dassault Systemes(达索系统)公司在 CATIA V6 R2012 上生成的图形负载轨迹记录,模型的规模从 5.1 百万到 21 百万个顶点(分别是赛车、喷气式飞机、运动型多功能车等等。
测试的项目都是 CATIA V6 R2012 提供支持的图形特性,包括线框图、抗锯齿、着色图、轮廓线加强着色图、视野景深、环境光吸收着色等,合计有 14 个测试子场景,即 14 个小项目,这些小项目的测试结果的平均值就是上图中的 CATIA-04 测试结果。
从测试结果来看,大溪地核心的 W9100、W8100 的比较接近,最快的 W9100 成绩为 68.1fps,而最慢的 W2100 是 12.2fps。
Creo-01 测试集源自 PTC 公司的 Creo 2 软件生成的图形负载轨迹,有两个模型,规模分别是 2000 万顶点和 4800 万顶点。需要注意的是 Creo-01 并非是指 Creo 1.0,01 在这里只是表示该测试项目在 viewperf 历史上首次引入基于该系列软件的测试轨迹集。
测试包含了多个获 Creo 2 支持的渲染模式,例如线框图、抗锯齿、着色图、轮廓加强着色图、着色倒影图等。测试由 13 个不同模式的项目组成,这些项目的测试结果平均后就成了 Creo-01 的成绩。
从测试来看,W9100、W8100、W5100 的结果都比较接近。W4100基本上是 W9100 1/3 的性能水准。
Energy-01 测试集反映的是在地震、油气田中的典型实体渲染应用,类似于医疗成像中的核磁共振(MRI)、计算机层析成像(CT)或者地球物理学中对三维栅格的子表面影像切片进行调查。实体渲染可以实现对三维容积栅格的二维投影,便于后续的分析和判读。
该测试包含了七个测试子项目,其中五个是中分辨率三维栅格,两个是高分辨率,对显存和系统内存的容量需求极高。中分辨率的场景包含有 1GiB 数据集,而高分辨率的数据集高达 3.2GiB。例如,显卡的显存低于 4GiB 的话则无法完成高分辨率场景的渲染;如果系统内存低于 12GiB 并且关闭了交换文件的话在运行高分辨率测试的时候也会陷入失去响应的情况。
在 Energy-01 测试中蓝宝 AMD FirePro W9100 的平均帧率为 4.8fps,W5100及以下的都直接卡死了。
Maya-04 的测试集源自 Autodesk Maya 2013 生成的图形负载轨迹,模型规模是 72.75 万顶点,是由 AMD 提供的电力厂场景。
这个测试包含了6个测试子项目,分别是着色、屏幕空间蔽塞着色、屏幕空间蔽塞着色多采样抗锯齿、屏幕空间蔽塞着色多采样抗锯齿 + 浮点渲染对象、屏幕空间蔽塞着色多采样抗锯齿 + 浮点渲染对象 + 权重平均式半透明、线框图。
蓝宝 AMD FirePro W9100 在该测试获得了 67 .6fps 的平均值,比 W8100 快不少。W2100 则只有14.3fps。
Medical-01 有些类似于 Energy-01,也是属于实体渲染的测试项目,不过在这里更多数据集都是由医学扫描仪(MRI 或者 CT)获得。
测试的对象有两个,分别是四维的心脏(80 MiB)和甲壳虫(650MiB),需要硬件支持三维纹理和相应的三线性过滤。
这个测试比较偏重纹理处理和显存带宽的压力,从测试结果来看 W9100 有接近 43.4fps 的水准,运行很流畅,而 W5100 是 11.3 fps,可以满足互动操作的需求。
Showcasr-01 测试集源自 Autodesk 公司 Showcase 2013 生成的图形负荷轨迹。
场景中的模型规模是 800 万顶点,这个测试是 SPECviewperf 首次引入的 DirectX 渲染测试项目,测试的子项目有四项,分别是:自投影阴影着色、自投影阴影着色+投射阴影、着色、投射阴影着色。
在这个测试中 W9100 获得了 67.1 fps,W5100 是 23.1,基本上反映了显卡核心的真实性能。
SNX-02 测试集源自 Siemens PLM 公司 NX 8.0生成的图形负载轨迹。
SNX-02包含了两个模型,模型的规模分别是 715 万顶点和 8.45 万顶点,每个模型跑五种渲染模式,共计有 10 个子项目。
在这测试中,W8100 和 W9100 的测试结果相当不错,而 W4100 也达到了 30.9 fps ,从互动操作的角度而言这是一个已经非常理想的帧率。
SW-03 的测试集源自达索系统公司 Solidworks 2013 SP1 的图形负荷轨迹,三个模型(小轿车、拉力赛赛车、特斯拉塔)的规模范围从 210 万顶点到 21000 万顶点。
测试的内容包括了程序所支持的各种渲染模式,例如着色图、边缘着色图、环境光吸收、着色器应用以及环境映射,共计 11 个测试项目。
W5100、W8100、W9100 的测试结果都比较接近。W4100、W2100 的测试结果分别是 35 和24.3fps,也算是非常不错的表现了。
测试总结:
SPECviewperf 和普通测试软件相比最明显的区别就是测试对象都是从现实应用中抓出来的实际负荷、场景、模型,它反映的是纯图形处理下的显卡性能。真实应用中还涉及不少互动操作,这是SPECviewperf 12的一个槽点,只是把模型转来转去并不能完全模拟真实的应用场景,涉及更复杂操作的处理需要使用 SPECapc 旗下的测试包才行。
虽然测完整个流程至少需要一个多小时,但和 SPECapc 的测试相比,SPECviewperf 12 已经是大大简化了测试过程,因为不同的 SPECapc 都需要安装对应的专业软件以及进行复杂的配置,例如 NX 系列和 Solidworks 系列,而 SPECviewperf 12非常智能,只要点击benchmark然后静待测试结果即可,有点像3Dmark的感觉。
全新一代FirePro Wx100系列专业显卡受到了业内人士的广泛关注,而中低端的W5100、W4100、 W2100也已正式上架,中国区的媒体价分别为4099元、1390元和1680元,这对于专业显卡来说已经是非常便宜的售价了。 FirePro Wx100系列不仅全部支持4K超高清分辨率,而且均大幅增加了显存规格并配备了先进的GCN架构,图形和计算性能较之上代V系列有了明显提升,而高端的W9100 16GB的显存使得它在面对4K甚至8K分辨率的图像处理也是游刃有余,性价比方面蓝宝石FirePro系列专业显卡无疑是业界良心。当然也不是完全没有槽点,测试的时候,中低端显卡出现过假死现象,稳定性和软件丰富程度方面,AMD还有提升的空间。■<