当蓝宝AMD FirePro遇上SPECViewperf 12
在一台图形工作站中专业显卡的地位往往和 CPU 等同甚至更重要,因为在可视化互动操作中,大部分的处理都是由显卡来完成,显卡的性能、功能强大与否直接影响了生产力的高低,因此选择图形工作站必不可少的是对搭配的专业显卡进行评估。
对显卡评估的最常见工具是 Futuremark 公司的 3DMark,现在的专业显卡和游戏卡大都是基于同代微架构的,因此也能毫无问题地运行 3DMark。3DMark 针对的是游戏应用,虽然图形工作站应用中游戏开发也是重要的一部分,但毕竟不是全部,最关键的问题是 3DMark 是面向对象并非开发、设计人员而是游戏玩家,而且几乎没有一款真实的游戏采用 3DMark 的渲染引擎,如果不是基于真实应用而开发的测试工具那么它的参考价值无疑是要大打折扣的。
在真实应用测试方面目前业界公认最可信的就是 SPEC.org 机构推出的各种测试工具,例如 SPEC CPU9X/200X 系列是各个处理器开发公司、学术机构、商业公司都采用的 CPU 性能评估工具。
SPEC 成立于 1988 年,现在的全称是 Standard Performance Evaluation Corporation(系统性能评估公司),最初是由几家重视真实性能的工作站厂商一起发起成立的,希望透过这个机构开发出真实、可信的性能测试工具。到如今 SPEC 的会员已经超过了 60 家公司,每个季度都会发布数百个不同系统性能科目的测试结果。
针对不同的应用,SPEC 下设多个子机构,而负责工作站系统性能设计、开发的则是“The Graphics and Workstation Performance Group (图形与工作站性能小组,简称 GWPG)”。
GWPC 目前有三个主要的项目小组,分别是 SPECapc、SPECgpc、SPECwpc,其中 SPECgpc 的成立时间最早,它的前身 SPECopc 成立于 1993 年,早期的工具 GLperf 主要针对的是 OpenGL 图元级性能,例如像素填充率、三角形吞吐率、纹理填充率等相对底层的测试,到了。到了 2007 年,SPECgpc 决定将图形性能测试的对象扩展到所有 API,因为此时已经开始有一些应用逐渐转向 DirectX,例如 3dmax 等。
在去年 12 月,SPEC 发布了最新的 SPECviewperf 12 ,这是一个庞大到比较独特的图形性能测试包,未展开之前的容量大约是 3GiB,展开后需要占用数十 GiB 的空间,这说明它的是的数据规模极为庞大。此外,SPECviewperf 12 还首次引入了 DirectX 的测试项目,这在以前也是从未有过的(虽然 07 年的时候已经说要关注其他图形 API)。
SPECviewperf 更新对于工作站特别是专业卡来说自然是要面临一次新的挑战,它们在这个版本中会有何表现对于经常和工作站打交道的专业人士来说是一件值得关注的事情,我们这次选择了来自 AMD 的 蓝宝 AMD FirePro V3900 到 蓝宝 AMD FirePro W9000 的全系列专业卡进行测试,测试结果到底如何大家不妨一睹为快吧。
参测产品——蓝宝 AMD FirePro W9000/W8000
蓝宝 AMD FirePro W9000、蓝宝 AMD FirePro W8000 都采用了 AMD Tahiti GPU 的工作站专用版,从外观上看两者非常相似,采用了外吹式的双槽散热器设计,不过 W9000 能提供了 6 个迷你 DP(DisplayPort) 输出,而 W8000 则是四个标准 DP 输出。
两片显卡的 GPU 虽然其实都是同一微架构,但是具体的型号并不一样。蓝宝 AMD FirePro W9000 采用最优异的 Tahiti XT,3D 内核是 975MHz,拥有 2048 个 PE(处理元);像素/纹理填充率高达 31.2GPixl/s 和 124.8GTexl/s;单精度/双精度计算能力接近 4TFLOPS/1TFLOPS;配备 384-bit GDDR5 内存总线,内存容量为 6GiB,带宽高达 264GiB/s。
蓝宝 AMD FirePro W8000 采用的是 Tahiti Pro,3D 内核是 900MHz,配备 1792 个 PE;像素/纹理填充率分别是是 28.8GP/s 和 100.8GT/s;内存总线是 256-bit GDDR5,带宽 176GiB/s,容量 4GiB;单精度/双精度计算能力分别是 3.2TFLOPS 和 0.8TFLOPS。
在定位上,两款产品都是目前 AMD 优异的专业卡,而 蓝宝 AMD FirePro W9000 无疑是其中的最高端型号,针对的都是散热、供电条件相对充裕、对性能有极高要求的图形/计算工作站、服务器等应用。
参测产品——蓝宝 AMD FirePro W7000/W5000
蓝宝 AMD FirePro W7000 和 蓝宝 AMD FirePro W5000 采用的 GPU 代号是 Pitcairn(皮特凯恩群岛),和 Tahiti 都属于 GCN(Graphics Core Next)微架构,支持 DX11.1、OpenGL 4.3(部分支持 4.4)、OpenCL 1.2 等最新的图形、通用计算界面,但是缺乏 ECC 支持。虽然两者都是单槽设计,但是在外观上的差别,例如 蓝宝 AMD FirePro W7000 提供了四头输出,卡体尺寸更长,需要 PCIE 外部供电。
蓝宝 AMD FirePro W7000 采用 Pitcairn XT GPU,3D 内核是 950MHz,单精度/双精度性能是 2.4TFLOPS/0.15TFOPS,相对于 Tahiti 来说主要差别体现在双精度计算上;内存带宽 153.6GiB;散热设计是小于 150 瓦,相较而言更高端的 W8000/W9000 散热设计是 189 瓦 和 274 瓦。
蓝宝 AMD FirePro W7000 是针对图形性能要求较高的工作站专业卡:中等的身材、相对合理的供电散热设计,主流型制的机箱都能安装,具备极高的专业图形性能和较大的本地显存。
蓝宝 AMD FirePro W5000 采用 Pitcairn Pro GPU,和 W7000 特性一样,不过频率规格、内核规模都较 W7000 有所降低,它的 3D 内核是 825MHz,能提供 1.2TFLOPS/79.2GFLOPS 单/双精度峰值计算性能,像素/纹理填充率分别是 26.4GP/s 和 39.6GT/s;内存总线位宽和 W7000 一样都是 256-bit 但是频率略降低(800MHz),内存带宽是 102.4GiB/s,内存容量是 2GiB。
当然,这些规格上的变化带来的好处是设计散热显著下降:低于 75 瓦,卡体长度显著减少,散热器可以做得更简单。
在输出能力方面,W5000 提供了三头输出:两个标准 DP加一个双通道 DVI-I,显卡上还有一些扩展接口,例如上图中的三孔式立体输出端子。
参测产品——蓝宝 AMD FirePro V4900/V3900
蓝宝 AMD FirePro V4900、蓝宝 AMD FirePro V3900 是 AMD 当前的主流级或者说入门级专业卡产品,采用的 GPU 是 Turks,属于 GCN 的上一代微架构,支持 OpenGL 4.2、DX11.0、OCL 1.2 等业界图形/计算界面。
蓝宝 AMD FirePro V4900 的 3D 内核是 800MHz,单精度性能是 0.77TFLOPS,缺乏硬件双精度计算能力,像素/纹理填充率分别是 6.4GP/s 和 19.2GT/s;配备 128-bit GDDR5 内存,带宽为 64GiB/s;提供了两个标准 DP 和一个双通道 DVI-I 输出。
蓝宝 AMD FirePro V4900 配备的 Turks GPU 属于 40nm 制程,因此耗电方面相对 W5000 并没有明显的优势,最大设计功耗和 W5000 类似都是小于 75 瓦。
蓝宝 AMD FirePro V3900 规格上比 蓝宝 AMD FirePro V4900 更低一些,单精度性能是 0.64TFLOPS,像素/纹理填充率分别是 5.2GP/s 和 15.6GT/s;配备 128-bit GDDR3 内存,带宽为 28.8GiB/s,配备 1GiB 容量内存;提供了 1 个标准 DP 和 1 个双通道 DVI-I 输出。
蓝宝 AMD FirePro V3900 属于半高卡型制,只要更换挡板就能在半高机箱中使用,设计功耗为小于 50 瓦,适合入门级工作站、商务台式机使用。
测试平台介绍
系统配置:
Viewperf V12 需要 40GB 的空余存储空间,不过它获取的成绩都是渲染过程中的加权平均帧率,我们采用单个 SSD 作为存储基本上不会对性能有影响。
驱动程序中我们将垂直同步设置为强制关闭,Tessellation 设置为应用程序自选(不过 VPF 12 其实并没有使用该技术)。
VPF 12 要求显示器的最低分辨率是 1920x1080,我们的显示器是 DELL 3007,分辨率设置在 2560x1600,由于 VPF 12 是以窗口模式运行,因此桌面分辨率高于视窗对性能的影响并不大。
测试结果——CATIA-04
CATIA-04 场景测试集是由 Dassault Systemes(达索系统)公司在 CATIA V6 R2012 上生成的图形负载轨迹记录,模型的规模从 5.1 百万到 21 百万个顶点(分别是赛车、喷气式飞机、运动型多功能车。
测试的项目都是 CATIA V6 R2012 提供支持的图形特性,包括线框图、抗锯齿、着色图、轮廓线加强着色图、视野景深、环境光吸收着色等,合计有 14 个测试子场景,即 14 个小项目,这些小项目的测试结果的平均值就是上图中的 CATIA-04 测试结果。
从测试结果来看,GCN 体系的 W7000、W8000 的比较接近,最快的 W9000 成绩为 56.8fps,而最慢的 V3900 是 13.3fps,W5000 大约是 W9000 的 64%。
测试结果——Creo-01
Creo-01 测试集源自 PTC 公司的 Creo 2 软件生成的图形负载轨迹,有两个模型,规模分别是 2000 万顶点和 4800 万顶点。需要注意的是 Creo-01 并非是指 Creo 1.0,01 在这里只是表示该测试项目在 viewperf 历史上首次引入基于该系列软件的测试轨迹集。
测试包含了多个获 Creo 2 支持的渲染模式,例如线框图、抗锯齿、着色图、轮廓加强着色图、着色倒影图等。测试由 13 个不同模式的项目组成,这些项目的测试结果平均后就成了 Creo-01 的成绩。
从测试来看,W7000、W8000、W9000 的结果都比较接近,W7000 甚至比 W8000 快 1 fps,而 W5000 也有不错的表现。V4000、V3900 基本上是 W9000 1/3 的性能水准。
测试结果——Energy-01
Energy-01 测试集反映的是在地震、油气田中的典型实体渲染应用,类似于医疗成像中的核磁共振(MRI)、计算机层析成像(CT)或者地球物理学中对三维栅格的子表面影像切片进行调查。实体渲染可以实现对三维容积栅格的二维投影,便于后续的分析和判读。
该测试包含了七个测试子项目,其中五个是中分辨率三维栅格,两个是高分辨率,对显存和系统内存的容量需求极高。中分辨率的场景包含有 1GiB 数据集,而高分辨率的数据集高达 3.2GiB。
例如,显卡的显存低于 4GiB 的话则无法完成高分辨率场景的渲染;如果系统内存低于 12GiB 并且关闭了交换文件的话在运行高分辨率测试的时候也会陷入失去响应的情况。
在 Energy-01 测试中蓝宝 AMD FirePro W9000 的平均帧率为 4.7fps,其实在中分辨率场景中 W9000 的测试结果分别是 17.6、17.2、8.3、4.1、7.1,只是在高分辨率场景中帧率跌到 0.92、0.94 从而把平均帧率拉低了。
蓝宝 AMD FirePro V4900、V3900 只有 1GiB 显存,无法运行因此帧率跌掉了 0.1 fps 的水平(计算平均值的时候高分辨率场景判定为 0.01 fps),W5000 只有 2GiB 显存,平均帧率是 0.5fps。
从测试结果来看,大显存显卡在容积渲染中的确有用武之地。
测试结果——Maya-04
Maya-04 的测试集源自 Autodesk Maya 2013 生成的图形负载轨迹,模型规模是 72.75 万顶点,是由 AMD 提供的电力厂场景。
这个测试包含了 6 个 测试子项目,分别是着色、屏幕空间蔽塞着色、屏幕空间蔽塞着色多采样抗锯齿、屏幕空间蔽塞着色多采样抗锯齿 + 浮点渲染对象、屏幕空间蔽塞着色多采样抗锯齿 + 浮点渲染对象 + 权重平均式半透明、线框图。
蓝宝 AMD FirePro W9000 在该测试获得了 57 fps 的平均值,比 W8000 快 13%。W5000 比 V4900 快 1.9 倍,说明在这个项目中 GCN 架构的确拥有明显的优势。
测试结果——Medical-01
Medical-01 有些类似于 Energy-01,也是属于实体渲染的测试项目,不过在这里更多数据集都是由医学扫描仪(MRI 或者 CT)获得。测试的对象有两个,分别是一个四维的心脏(80 MiB)和一只甲壳虫(650MiB),需要硬件支持三维纹理和相应的三线性过滤。
这个测试比较偏重纹理处理和显存带宽的压力,从测试结果来看 W9000 有接近 30fps 的水准,运行很流畅,而 W5000 是 11.2 fps,可以满足互动操作的需求。
测试结果——Shwocase-01
Showcasr-01 测试集源自 Autodesk 公司 Showcase 2013 生成的图形负荷轨迹,场景中的模型规模是 800 万顶点,这个测试是 SPECviewperf 首次引入的 DirectX 渲染测试项目,测试的子项目有四项,分别是:自投影阴影着色、自投影阴影着色+投射阴影、着色、投射阴影着色。
在这个测试中 W9000 获得了 46.8 fps,W5000 是 23.3,而最低阶的 V3900 是 8.3 fps,基本上反映了各卡纹理方面为主的性能。
测试结果——SNX-02
SNX-02 测试集源自 Siemens PLM 公司 NX 8.0生成的图形负载轨迹,包含了两个模型,模型的规模分别是 715 万顶点和 8.45 万顶点,每个模型跑五种渲染模式,共计有 10 个子项目。
在这测试中,W8000 和 W7000 的测试结果相当,而 V4900 也达到了 20.2 fps 从互动操作的角度而言这是一个已经比较理想的帧率。
测试结果——SW-03
SW-03 的测试集源自达索系统公司 Solidworks 2013 SP1 的图形负荷轨迹,三个模型(小轿车、拉力赛赛车、特斯拉塔)的规模范围从 210 万顶点到 21000 万顶点。
测试的内容包括了程序所支持的各种渲染模式,例如着色图、边缘着色图、环境光吸收、着色器应用以及环境映射,共计 11 个测试项目。
W7000、W8000、W9000 的测试结果都比较接近,达到 54 fps ~ 56 fps。V4900、V3900 的测试结果分别是 25.4 和 21.3,也算是不错的表现了。
测试总结
新一代的专业应用已经普遍采用了可编程着色器、硬件三维纹理等非常先进的图形渲染技术,这些技术的应用对显卡的性能、特性提出了更高的要求,传统的测试工具偏重几何图元级的测试已经不能满足要求。
SPECviewperf 12 在这方面实现了巨大的飞跃,更新了大量的测试集,还首次引入了 DirectX 测试项目,更能全面反映当前工作站应用下的专业显卡实际使用状况。
SPECviewperf 和普通测试软件相比最明显的区别就是测试对象都是从现实应用中抓出来的实际负荷、数据(场景、模型),它反映的是纯图形处理下的显卡性能,但是并不能完全反映出真实应用中的性能。
因为在真实应用中涉及不少互动操作,而 SPECviewperf 目前还没能在这方面有突破,只是把模型转来转去而已,涉及更复杂操作的处理需要使用 SPECapc 旗下的测试包才行。
和 SPECapc 的测试相比,SPECviewperf 12 大大简化了测试过程,因为不同的 SPECapc 都需要安装对应的专业软件以及进行复杂的配置(例如 NX 系列和 Solidworks 系列),甚至可能会出现各种的意外(例如 Lightwave 3D 比较容易出现测试结果记录不完整的现象),而 SPECviewperf 12 只要打开后点击一下按钮然后等上大约一小时就能获得所需的测试结果。
由蓝宝科技提供的 AMD 全线产品在这次测试中都经受了考验,除了 V4900 和 V3900 在 Energy-01 个别测试中由于卡载显存不能满足 4GiB 要求外,都能稳定地完成测试,反映了 AMD 目前在专业卡驱动方面已经很成熟、可靠,值得信赖。