NVIDIA游戏动力源泉!三重威力全攻略
“The Power of 3”(即三重威力)是NVIDIA在显示卡领域提出的数字体验技术。它包含最新的Shader Model 3.0、HDR (High Dynamic Range,高动态范围光照)和NVIDIA SLI技术(Scalable Link Interface)。通过“The Power of 3”, 用户可以在最高分辨率和特效全开的情况下,获得决佳的数字应用体验。
1、最先锋的图形接口Shader Model 3.0
作为DirectX 9.0c全新API的重要支撑部分,是图形处理技术的最新标准,作为新一代视觉处理的“灵魂”,Shader Model 3.0已成为整个娱乐产业的策源地和驱动力。统一了PC 游戏,也同时统一了游戏主机:包括Sony 的新一代旗舰 Playstation 3、Sega新一代游戏主机和Microsoft 的 XBox 360的视觉应用接口和标准。
2、高动态范围光照HDR
新的NVIDIA高精度动态范围渲染(HPDR, High Precision Dynamic Rendering),即HDR技术,基于电影Industrial Light & Magic OpenEXR标准,更进一步提升了静态和动态图像品质,实现光影和色彩更丰富表达。以达到更真实的视觉传导,冲击人眼对视觉感触的极限。
3、多GPU并行渲染SLI
NVIDIA SLI技术所带来的多显卡并行处理技术,不仅仅是显卡性能的翻倍提升,更重要的是它在毫不妥协的性能基础上,为高分辨率、高清晰的“画布”着上最动人的景像。
Shader Model版本的不断更新,在PC游戏的发展历史上起到了非常关键的作用。因此显卡的图形核心所支持的Shader Model版本高低,长期以来一直被人们当作衡量芯片价值的重要指标之一。特别是微软发布支持Shader Model 3.0标准的DirectX 9.0c之后,更是在显卡图形芯片领域掀起了新一轮的更新换代大潮。
与过去的DirectX 9.0b和Shader Model 2.0相比较,新版DirectX 9.0c最大的改进,便是引入了对Shader Model 3.0的全面支持。举例来说,DirectX 9.0b的Shader Model 2.0所支持的Vertex Shader最大指令数仅为256个,Pixel Shader最大指令数更是只有96个。而在最新的Shader Model 3.0中,Vertex Shader和Pixel Shader的最大指令数都大幅上升至65535个,全新的动态程序流控制、 位移贴图、多渲染目标(MRT)、次表面散射 Subsurface scattering、柔和阴影 Soft shadows、环境和地面阴影 Environmental and ground shadows、全局照明 (Global illumination)等新技术特性,使得GeForce6 及 GeForce7 GPU立刻为新一代游戏以及具备无比真实感、幻想般的复杂的数字世界和逼真的角色在影视品质的环境中活动提供强大动力。
1、Shader Model 3.0是最新DirectX 9.0c的标准
作为Microsoft DirectX 9.0c API的重要组成部分,Shader Model 3.0由Pixel Shader 3.0和Vertex Shader 3.0两个着色语言规范组成。
2、Shader Model 3.0可以实现更多的炫目效果
通过Shader Model 3.0,游戏设计师能够比过去更加高速地实现各种复杂的超现实3D效果。
3、Shader Model 3.0可以带来更高的游戏性能
Shader Model 3.0可以用更少的绘图指令批量处理大量复杂的数据,从而大大减轻GPU 及CPU的负担,让整个系统更有效率地工作,大幅度提高游戏性能和画面帧数。
4、Shader Model 3.0意味着更强的可编程能力
Pixel Shader 3.0和Vertex Shader 3.0为游戏开发者,分别提供了无限长的像素程序,以及无限长的顶点程序,将GPU的可编程能力带到了一个全新的境界,全面提升了程序开发者的开发效率,为更复杂的效果和更高的游戏性能提供可实现基础。
5、Shader Model 3.0可以给程序员更强的程序流控制能力
与Shader Model 2.0相比,支持分支跳转的Shader Model 3.0可以简单地实现过去Shader Model 2.0难以甚至无法完成的效果,赋予了程序员更强的程序流控制能力。
6、Shader Model 3.0意味着未来游戏的发展方向
随着大量支持DirectX 9.0c和Shader Model 3.0的游戏不断涌现,DirectX 9.0c API也早已成为新游戏的基本开发标准。毋庸质疑的是,未来还将会有越来越多的游戏支持Shader Model 3.0,因为它代表着未来游戏的发展方向。
HDR即“High-Dynamic Range”,高动态范围光照的简称。我们知道,电脑能够显示的颜色包括红、绿、蓝、Alpha共4个通道,每个通道拥有8bit、也就是256种颜色,每存储一种颜色需要4个8bit即32bit的空间。
在这种图像描述模型中,画面中的每个像素色彩和亮度值都是由整数来表示。但是在处理图片时,这种精度依然无法代表人肉眼可以看到的真实世界,难以满足实际使用的要求。并且随着进一步的图形处理运算,颜色部分还会产生细微的变化,经过反复多次运算的积累后,还会产生色彩细节丢失问题,无法真实再现自然的光照情况。
与采用8位纹理格式(24/32位颜色每像素)的“传统渲染”(LDR, Low Dynamic Range)模式相比,HDR可以支持电影业常用的fp16/fp32纹理格式(每像素采用64/128位浮点数),并支持fp16格式的混合和滤波操作。LDR只能表现出256:1的动态范围(每种颜色的两度范围),而人眼能够感知的亮度范围是1014:1,因此传统的8位整数格式难以表现出真实世界的光照情况。而NVIDIA HDR技术采用fp16的纹理格式,能够支持1012:1以上的动态范围,因此可以表现出非常逼真的光照效果。
◎ 为什么需要HDR
为了解决这一问题,NVIDIA从GeForce 6开始引入了HDR高动态范围光照技术,采用4个16bit或4个32bit,达到64bit或128bit带宽的色彩光照像素浮点格式。顾名思义,这种全新的渲染方式对于三维空间的光线表现有着明显的改善作用。其主旨就在于将组成画面的每个像素的色彩、亮度等光照参数,以更为精确的形式表达和存储,使其更接近于实际的物理环境。简单来说,让色彩和光照灰度更加层次丰富,过渡饱满不失真。做到“亮的地方真正地亮,暗的地方真正地暗”。
《帝国时代3》开启HDR前后效果对比
◎ HDR技术分析及其重要性
结合NVIDIA HDR技术,高动态范围光照就能够高效、漂亮地执行。渲染任务可以分为为三个环节——光传递、光调影射、色彩及伽玛纠正。HDR可以将画面中的每个像素的色彩和亮度值用实际物理参数或是线性函数来表示,而不再像过去那样只能限定用整数。这样支持HDR技术的GPU就可以将大量的色彩数据以原有精度(或近似原有精度)保存起来,尽可能地避免了色彩失真情况。由于在实际应用中,电脑无法达到无限的取值范围,所以NVIDIA采用了由Industrial Light & Magic开发,基于工业光魔(ILM)的标准16位OpenEXR格式——用1个bit位来标志“指数”,5bit来存放指数的值,10bit存放色度坐标(u,v)的尾数。其动态范围从6.14×10-5到6.41×104,在显卡中处理分为3个步骤:
1.将画面用高光照动态范围渲染,并储存每个象素的亮度特性,而着色器、纹理过滤以及缓存操作都支持浮点格式;
2.将HDR高动态画面转成RGBA或sRGB等低动态范围的画面;
3.经过色彩和伽玛校正后传送到显示设备。人类眼睛对光的相应呈对数关系。事实上,人类的眼睛对较低光度的光更敏感,能看到暗处细节要比更高光照强度处更丰富。伽马纠正的目的就是为了让显示器能正确地再现人类眼睛的这种视觉效果。
通过HDR技术,游戏开发人员可以轻松地利用先进的着色、混合、过滤和纹理功能,创造彩虹色、动作模糊和柔和阴影等准确的效果。在最新的优异3D游戏中,HDR高动态范围光照技术的效果表现相当地明显,可以呈现出非常细微的光线变化,帮助用户获得最真实的光影体验。开发人员依然能在优先考虑内存空间利用率的时候使用16位模式, 但是现在他们在更广阔的实时渲染应用范围上能够达成更高品质的画面。用户会赏识并乐意于看到更丰富、更绚丽的画面体验,游戏开发人员能以此抛离其竞争对手。
而这种画面质量的改善,是简单地提升“显卡频率”所无法做到的,这也让人们充分认识到了各项渲染技术的重要性。
SLI的前世可以追溯到1998年,当时叱咤风云的3dfx率先将SLI(Scan Line Interleave)技术引用到其第二代3D图形卡产品——Voodoo 2身上,用“SLI交错互连技术”让两块Voodoo 2显卡连接起来并行运作,以获得近乎翻倍的图形性能。
当时的SLI技术让渲染工作被平均分担,将一幅渲染的画面分为一条条扫描帧线(Scanline),由一个显卡负责渲染画面的奇数帧线部分,另一块显卡渲染偶数帧线部分,也就是说每块显卡只需要完成1/2的工作量,然后将同时渲染完毕的帧线进行合并后写入到帧缓冲中,然后在显示器屏幕上呈现出一个完整的渲染画面。于是,理论上的翻倍图形性能就出来了。
跟以前3dfx的SLI技术完全不同的是,2004年6月29日NVIDIA发布的SLI(Scalable Link Interface)更确切的是指“SLI Multi-GPU”,意味着多GPU并行渲染技术。该技术还被引入了当时最新发布的GeForce 6800/Quadro FX4000系列高端显卡上。目前这项技术在NVIDIA显卡当中已经非常普及,包括GeForce 7800GTX、7800GT、6800GT、6800、6600GT、6600、6600LE在内的高中低端PCI-E显卡均提供了对SLI技术的支持。
如前所述,NVIDIA SLI的全称为“Scalable Link Interface”。它是通过一种特殊的接口连接方式,在一块支持双PCI Express×16显卡插槽的主板上,同时使用两块相同的NVIDIA GeForce6 或GeForce7的PCI-E显卡,以实现系统图形性能的大幅提升。与3dfx不同的是,NVIDIA SLI有着AFR(Alternate Frame Rendering,交替渲染)和SFR(Split Frame Rendering,分屏渲染)两种实现模式。其中AFR交替渲染模式将连续的画面分为奇数帧和偶数帧两部分,由一块显卡处理所有偶数帧,另一块显卡处理所有奇数帧;而SFR分屏渲染模式则同3dfx SLI类似,也是把一个单帧的着色渲染工作分配给两块GPU。但却是把画面分成上下两部分,并由动态负载平衡技术为两块GPU智能地动态分配工作量,以达到最大限度的性能提升。
值得一提的是,ForceWare驱动程序平时并不确定使用AFR还是SFR,因此NVIDIA为多个流行游戏创建了profile配置文件 (现在已超过100个游戏的profile配置文件),以决定在每个游戏中它们默认使用哪一种渲染模式。一般来说,只要帧之间没有依赖关系,NVIDIA的驱动程序就默认为AFR模式;而当帧之间存在依赖关系而导致不能使用AFR时,就会转用SFR模式。然而,对一些还未有官方游戏profile配置文件的游戏,NVIDIA容许用户自行设定游戏profile配置文件,令这些游戏也可以被SLI技术实现高性能以及高特效品质。
也许有人会以为,NVIDIA的SLI与年代久远的3dfx SLI一脉相承,其实不然。仔细分析就不难发现,NVIDIA SLI要显得更加成熟,性能也更加优秀。首先,在物理构造方面,选择PCB卡连接可充分保证信号通讯的质量与速度;其次,在数字信号传输方面,也摆脱了Voodoo 2时代(模拟传输方式)因信号干扰而导致画面不同步的弊端;再者,在工作方式及分工方面,NVIDIA SLI没有采用Voodoo 2时机械的隔行分配方式,而是通过动态负载平衡技术,根据画面的复杂情况将工作量平均分配给两块显卡,从而实现了效能的最优化。
想象一下,一颗NVIDIA GeForce6或 GeForce7图形芯片(GPU)就能带给您难以置信的卓越性能,那么,两颗呢?……
通过nForce4 SLI主板、两颗GeForce 6/7系列GPU和NVIDIA SLI技术,您就能够大幅提升系统的游戏性能——包括100多种热门游戏在内的主流应用性能几乎可以达到单GPU系统的两倍!根据测试,双显卡SLI后的性能最高可以达到单显卡的187%左右,个别应用中甚至可以达到190%!如此巨大的性能提升,足以让任何玩家为之心动。
也许已经有不少游戏玩家在为系统性能的翻番而激动不已,但是更令他们惊喜的还在后面——因为NVIDIA SLI为我们带来的不仅仅是游戏速度的提升,还包括了更加出色的画质。通过全新的全屏抗锯齿SLI AA (SLI Anti-Aliasing, SLI全屏抗锯齿) 技术,玩家们可以享受到比以往任何时候都更加出色的画面效果。
SLI AA(SLI全屏抗锯齿)是随着最新版本的ForceWare问世后,加上GeForce7系列的发布,为SLI技术添加的新功能。它可以通过偏移合成两个GPU的4X FSAA(多重采样),实现翻倍的全屏抗锯齿效果。也就是说,通过两片显卡的4X、8X和16X FSAA取样,NVIDIA SLI平台能够实现8X、16X甚至是32X(仅限于Quadro SLI)的FSAA全屏抗锯齿模式。显然通过这种技术,游戏画面质量可以获得质的提高,用户能够享受到极为出色的画面效果。更让玩家惊喜的是,SLI AA还可以同时支持OpenGL和D3D游戏,能够让更多的玩家率先体现近乎完美的画质。