泡泡网显卡频道 PCPOP首页      /      显卡     /      新闻    /    正文

NVIDIA发动“1216超标量狂潮”冲击波

    似乎一有计算机产品,就有主频概念就行影相随。然而以“频率至上”的研发思路已经开始受到越来越多的怀疑,甚至原本一直坚定主频发展策略的Intel也在Pentium M和双核心技术上修正了自己的错误,毫无疑问,主频不再是决定产品性能的关键。作为图形芯片厂商中的北斗泰山,NVIDIA以“品质、效率”为先,新一代产品凭借多项新技术已经将整个市场从频率需求转向新技术需求。从8月15日起,NVIDIA公司及其中国地区总代理骏兆电子公司在中国大陆及香港地区推动了“1216超标量狂潮”促销活动,为市场注入了高性能“质价比”新消费观念,拥有12条像素流水线的GeForce6800 PCI-E和拥有16条像素流水线的GeForce 6800GT PCI-E进行,不仅由于都拥有超过12条以上的像素流水的“超标量”核心架构,以带来高端性能应用,也同时具备了Shader Model 3.0、HDR、SLI等“杀手级”的特效品质效果技术。联合国内各大品牌包括:翔升、七彩虹、影驰、富彩、Inno3D、金鹰、铭暄、昂达、XFX、盈通共同推动高端“性能及品质”应用的大众化。对GeForce 6800GT PCI-E由原价3499元调降到2799元的建议零售价,对GeForce6800 PCI-E由原价的2299元调降到1799元的建议零售价,折扣高达25%以上。进一步拉高了中国地区众多发烧友对高端性能品质应用的需求。

    GeForce 6800系列PCI-E产品所带来的创新技术及消费观念的演变,对于用户来说:这就是实实在在的实惠。活动请进入骏兆电子公司官方网站:http://www.atlsemi.com/了解详情。

    像素填充率激增:超标量流水线

    谈到3D加速卡,最常用的一个词就是像素填充率。各大厂商在介绍和推广产品时,像素填充率总是作为一个重要指标而大肆宣扬。从GeForce时代开始,像素填充率就成为显卡速度提升的必经途径。笼统来说,提高像素率由于GPU的核心频率以及渲染流水线的数量决定,其中后者的作用更为明显。

    屏幕中的一个三维物体是由成千上万个三角形或多边形组合而成。当一个屏幕上的三维物体运动时,要显示原来被遮部分,抹去现在被遮部分,还要针对光线角度不同用多种色彩填充多边形。根据这一工作显卡,3D显卡在工作时离不开极高的像素填充率作为保障,否则就会出现被遮部分来不及抹去的现象,也就是大家常见的“丢帧”现象。更为重要的是,一旦使用了各种3D特效或者抗锯齿算法,3D显卡对像素填充率的需求会进一步扩大。

    毫不夸张地说,未来显卡发展的焦点仍在于像素填充率!当像素填充率提高之时,显卡的各项功能才会发挥出真正的威力。决定显卡像素填充率的因素在于核心频率与渲染管线数目。

    如今主流显卡的渲染管线数目为4-8条,少数高端产品达到12条甚至更高。渲染管线数目的加倍意味着像素填充率成倍提高,这甚至成为厂商技术竞争的焦点。不过集成过多的渲染管线数目并不是容易的事情,这会消耗大量的晶体管。目前显示核心的晶体管集成度已经远远超越了CPU。

    Geforce 6800GT PCI-E所采用的NV45核心具备16条渲染管线,足足比上一代的Geforce FX5950U翻了一倍。根据资料显示,NV45核心总共有2.22亿个晶体管,而其中大约有2/3用于16条渲染流水线!在全屏抗锯齿、各项异性过滤、PixelShader以及VertexShader等技术出现之前,像素填充率几乎就完全代表了一款显卡的性能。更为重要的是,无论是哪项用于提高画质的技术,它对像素填充率的依赖只会增加而不会减少。凭借着16条渲染流水线的优势,Geforce 6800GT PCI-E表现出令人生畏的性能优势,相对于Geforce FX5950U的性能提升非常明显。而最新发布的GeForce 7800GTX 更是拥有24条渲染管线,此时并不需要很高的核心频率就能达到惊人的像素填充率。

    以目前的制作工艺来看,实现90纳米之后很难再次进行突破,这也就意味着今后显卡提升核心频率将会十分困难,受到了物理性能的限制。但是决定像素填充率的因素不仅仅是核心频率,NVIDIA使用的超标量流水线很好地解决了这一难题,这也是未来显卡的发展方向,从而顺利摆脱对主频的依赖。显然,GeForce6800系列拥有极好效率的核心架构设计,特别是像素流水线的数量,成为定位市场的“法则”,在“1216超标量狂潮”中两款产品都拥有12条以上的流水线,无疑具备强大的动态渲染速度,将自身定位于目前的高端应用显卡行列,当然,仅仅拥有12条以上流水线以上并不代表就一定是高端显卡,因为,如果仅仅是渲染速度不断加快,而不在品质特效上做功夫,只能走向频率至上的一味“傻快”,因此,除了拥有12条以上流水线,还必须拥有Shader Model 3.0、HDR、SLI等全新一代的高峰品质特效应用技术,而这些最富技术价值的最新应用,“1216超标量狂潮”中的Geforce 6800GT PCI-E、Geforce 6800PCI-E都提供完美支持。

    画质的终极突破:Shader Model 3.0引领潮流

    很多用户都知道:当3D游戏的分辨率提升时,画面效果也会大幅度提升。然而这仅仅是在分辨率较低的情况下,如果分辨率已经达到更高的水准,而在纹理填充以及光线计算方面的技术没有改进,那么我们所达到的将仅仅是“更加接近圆弧的曲线段”,期待中的光影效果等3D特效永远不会出现,更不用奢望达到电影级的渲染效果。

    为了革命性地改善画质,就必须摆脱为了提高分辨率而不惜提高频率的产品研发思路,开发新的画质技术更为重要,而Shader Model 3.0便是NVIDIA近期的主要成果。尽管我们对现有DirectX API的应用效率感到难以满意,但是有一点是不可否认的:这种情况正在慢慢改善,今后的显卡与3D游戏将会与DirectX API靠得更近。如果在一年以前,面对中高档显卡时,我们还可以以“DirectX 9.0C游戏仍不是主流”作为不去考虑的理由,那么现在这个理由明显过于苍白。时至今日,PC游戏市场涌现出大量DirectX9C游戏:古墓丽影六、变形金刚、Will Rock、Max Payne2和波斯王子时间之沙等等。很明显,DirectX 9.0C API已成为今后新开发游戏的基本标准。

    对于用户而言,把握DirectX API的发展趋势十分重要。如今只能支持DirectX7的Geforce4 MX系列甚至不能运行最新的使用Shader API的3D游戏,因为Pixel Shader与Vertex Shader成为3D显卡最基本的素质,更是新老一代产品之间的分水岭。不仅如此,Shader功能还需要讲究最终的画质效果、应用效率以及业界支持度。

    Far Cry 1.2让Shader Model 3.0如鱼得水

    NVIDIA已经率先发展到Shader Model 3.0。当前支持Shader Model 3.0的游戏非常多,其中包括游戏玩家所熟悉的《Lord of the Rings:Battle for the middle earth》、《Vampire: Bloodlines》、《Far Cry trough Patch.》等等,当然还有大名鼎鼎的Half Life 2。ATi系列显卡在Far Cry 1.1版采用的Shader Model 2.0时,具有较佳的画质和效能表现,但之后Far Cry在推出1.2版时所采用的Shader Model 3.0,就变成只有NVIDIA的GeForce 6和7800系列独家支持。Far Cry 1.2版正式发表后,马上被世界各地的玩家发现,以ATi的X800系列执行游戏时,经常会发生严重的贴图错误,这让原本已经在Shader Model 3.0上居于劣势的ATi阵营更是雪上加霜,而NVIDIA显卡将会逐渐占据越来越明显的优势。

    光影特效与全屏抗锯齿:NVIDIA走在前沿

    电脑上能够显示的颜色目前是红、绿、蓝、Alpha等4个通道,每个通道8bit,也就是每个通道上2^8=256种颜色,存储一种颜色就需要4个8bit的空间,是32bit的空间。可是实际处理图片的精度依然不能满足要求,随着进一步图形处理运算,颜色部分就会产生变化,那么这么就很难保证以后依然是标准的1/256了,累计下去必然会有非证书的颜色存在,再经过多次运算以后自然就行成了色彩细节丢失问题,譬如无法再现真实自然的光照情况。

    HDR渲染出的光影效果

    为了解决这一问题,NVIDIA从GeForce6时代开始引入了HDR技术,这种全新的渲染方式对于3D物体的光线表现有着很明显的作用。此时GPU必须具备浮点精度的着色、混合、滤波以及贴图功能。出于保证速度的目的,GPU还不得不把这些色彩数据以原有精度(或近似原有精度)存储起来。因为只有这样,浮点数据的对数特性能够被保存起来,如果中间处理的结果仍以每像素256bit存储,那么GPU所具备的一切浮点颜色处理都等于是白费。在开启HDR效果之后,GeForce6系列产品的表现就已经令人惊讶,这是简单提升显卡频率所无法做到的,让我们充分认识到各项渲染技术的重要性,其实际作用在优异3D游戏中表现地十分明显,帮助用户获得最真实的光影体验。

    GeForce6在Far Cry中的HDR效果展示

    不仅仅是光影效果,用户还渴望从另一个角度看到更为精细的纹理。由于显卡工作原理的关系,所有的3D取样物体边缘在放大之后都会发现明显的锯齿。虽说提高分辨率可以有效解决该问题,但是对于速度的损耗实在太明显。为此,业界出来了一种全屏抗锯齿,它比提高分辨率的效果更加明显,而且对于速度的损失也相对较小。不过话虽如此,全屏抗锯齿依然对显卡性能有着严峻的考验。全屏抗锯齿技术最主要的作用就是能够通过芯片内部的特别处理电路或者软件的转换,来使在目前主流显示器上游戏画面中的3D物体和场景的失真的象素尽量减到最低的程度,以此来达到平滑的效果。

    GeForce6的CineFX 3.0引擎对全屏抗锯齿算法作出了改进,此时不仅支持高倍率的抗锯齿模式,而且对于速度的损失也降到很低的程度。而GeForce 7800系列更是实现了技术上的突破,CineFX 4.0引擎的整体抗锯齿表现又有了进一步提升。正是因为有了这些抗锯齿技术的支持,用户可以不再依赖以更高的频率来实现高分辨率,这种发展方向已经得到业界的广泛好评。

    压倒性优势:SLI大放异彩

    显卡产品线的竞争总是全方位的,此时比拼的不仅仅是高端产品,还包括中低端产品。目前NVIDIA已经在中高端产品中全面实现了SLI技术,配合NVIDIA的nForce4 SLI芯片组将会带给用户惊人的速度体验。如同CPU因为遭遇频率提升瓶颈而开始更多尝试双核心技术一样,NVIDIA的SLI技术也可以解决主频难以提升的问题,轻松带给用户近乎翻倍的速度表现。

    NVIDIA SLI 技术采用一种“高速数字连接机制”来实现双卡互连,两块显卡的相互通讯则基于图形核心内建的专利通讯协议。与3DFX的隔行分别渲染方式不同,并行处理技术中最为关键是NVIDIA的动态负载平衡技术。当年所有的板卡都因为并行模式下的负载平衡问题而出现无法突破的障碍和技术缺陷, NVIDIA SLI的动态负载平衡分配将会有多种模式,在默认情况下驱动程序会选择效率最高的一种方式自动完成后来的性能分配。数据通过PCI Express总线到达主GPU,那所有的GPU-to-GPU通信就通过NVIDIA的视频桥来处理了。视频桥是直接连接GPU的总线,被用于从一个GPU的帧缓存器直接向另一个传送数据。MIO能够以最高10GB/s传送数据,由于PCI Express总线延迟问题和带宽约束,这就是为什么选择MIO来直接沟通GPU之间通信的原因。

    NVIDIA的动态负载平衡技术在维持着色渲染中的对称上,扮演了一个重要的角色,当然,动态负载平衡技术包含在NVIDIA支持SLI的驱动程序之内,可以随着最新的应用程序和游戏提供不断更新的硬件配置文件和渲染着色方式。随着驱动程序的更新以提供更新更好的支持,这也是为什么企业和用户选择NVIDIA产品的重要原因。动态负载平衡技术考虑工作量并作出两个关键决定:1)决定渲染着色方法,2)根据渲染着色方法,决定两个GPU之间的工作量分担。实际上NVIDIA的SLI系统有三种工作模式:首先第一种就是:兼容模式(compatible Mode),只有主显卡参与工作,整体系统图形性能是单显卡成绩。但副显卡可以多提供2个显示器连接,对于多屏幕游戏和工作具有实际意义;第二种:分屏渲染模式(Split Frame Rendering——SFR): 是把一个单帧的着色渲染工作分配到两个GPU当中。并又驱动程序智能地动态分配工作量,以达到步调协调并取得性能提升。第三种:交替渲染模式(Alternate Frame Rendering——AFR):一块显卡处理所有偶数帧,另一块显卡则处理所有奇数帧,编译的程序分为两部分,以共同合作同帧画面,同样取得性能提升。驱动程序平时并不确定使用AFR还是SFR,NVIDIA为100多个流行游戏中的大多数并为每一个创建了配置文件,决定在每个游戏中它们默认应该使用AFR还是SFR模式。只要帧之间没有依赖关系,NVIDIA的驱动程序就默认为AFR;例如在某些使用慢动作特效的游戏中,游戏本身并不清除帧缓存器,会紧接着前一个帧对下一个帧着色,把两个帧混合在一起来获得慢动作效果,在这种情况下有一个帧对帧的依赖,AFR就不能用了。如果AFR不能用,那么就用SFR,但现在驱动程序必须确定每个帧的多大部分被发送给GPU 1和GPU 2。因为驱动程序能够依靠两个速度严格相同的GPU,所以它可以对负荷的分配作出有根据的推测。这个有根据的推测是通过存储了每个GPU在已结束几个帧中的负荷历史表来得出的。基于存储在这个历史表中的结果,NVIDIA的驱动程序会作出一个预测,决定对后面帧的着色应该怎样在两个GPU之间分配,从而调整负荷系数。这就像CPU中的分支预报器。

    GeForce6800PCI-E和GeForce6800GT PCI-E都能完美支持NVIDIA SLi的技术。加上nForce4 SLI芯片组不断降价,打造廉价高性能的SLI平台已经不是遥不可及的事情。

    新型的显卡用户消费决策

    通过以上高性能特效品质技术的介绍之后,我们通过消费者的观念来分析“1216超标量狂潮”中的两大主角为用户带来的“质价比”,以帮助了解用户的购买决策比较过程。以下是决定产品的重要属性评估表:可以看出产品的性能大项目中频率的属性重要性已经不算很重要,相反,核心架构的效率已经品质特效的重要性已经提到了高度水平。

显卡

GeForce 6800 Std

同类竞争产品

重要属性

特征

权数

得分

满意分数

特征

权数

得分

满意分数

性能

频率

(MHz)

325

10

70

700

~ 400

10

80

800

超频性

幅度较高

10

80

800

幅度较好

10

80

800

核心架构

超标量新架构

15

100

1500

旧架构

15

60

900

象素

流水线

12

15

80

1200

12

15

80

1200

顶点数

5

10

70

700

6

10

80

800

特效品质

Shader Model 3.0

支持

20

100

2000

不支持

20

50

1000

HDR

支持

15

100

1500

不支持

15

50

750

PureVideo视频处理引擎

支持

10

80

800

不支持

10

70

700

SLIGPU渲染技术

支持

15

100

1500

不支持

15

50

750

原生PCI-E总线

原生

15

100

1500

15

60

450

总分

12200

8150

购买方程式系数

12200/1800元(价格供参考)=6.78

8150/1700元(价格供参考)=4.79

    (说明: 权数:0~20,0 代表非常不重要;20 代表非常重要;
    得分:满分 100,分数越高,满意度越高;
    满意分数 = 权数 × 得分)

    从最终的购买系数来看,GeForce6800PCI-E相比较同类其它产品而言,要高出42%的选择系数值。可以看出,用户对一味的“性价比”追求正向“质价比”过渡,恰如当今的数码单反相机的选购一样,快门速度果然很重要,但同等重要或者更重要的是:图像成像质量等一些内容丰富的品质需求。反言之,你现在还原意花费千元去选购一片不支持Shader Model 3.0、HDR、SLI等全新应用体验的PCI-E显卡吗?

    时至今日,频率至上的研发思路已经被抛弃,真正从3D特效、画面精细度、产品质价比等多方面改进才是正确的解决之道。

0人已赞

关注我们

泡泡网

手机扫码关注