泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

PCIE X1都够用?显卡到底需要多少带宽

    泡泡网显卡频道9月5日 电影《功夫》里的终极BOSS火云邪神说过一句话:“天下武功,无坚不破,唯快不破”,功夫再高也怕被人瞬间秒杀。这说明无论是防守还是进攻,速度都是决定性因素,对速度有着极度需求的还有电脑上的系统总线。系统总线是是用来连接处理器与其他部件的一束信号线, 通过系统总线架起了处理器与其他部件之间进行信息传递的通道。

    它的历史悠久,三十年前个人电脑刚刚问世的时候就开始存在,但是相比PC部件中的CPU、显卡1-2年就要换一代的发展速度,系统总线的发展可谓龟速,自从IBM于1982主导制定了ISA标准以来,目前只有ISA、92年发布的PCI和2001年发布的PCI Express三种标准规范,基本上每隔10年才更换一次架构,目前的主流是PCI-E 2.0。

多少带宽才够用 谈PCI-E显卡接口速度

    PCI-E总线在显卡上应用的如此成功,以至于一提到PCI-E,很多人第一个想到的就是显卡,实际上PCI-E更多地是作为系统总线存在的,不仅是显卡的数据要通过它,就连我们使用最多的USB、SATA等其他接口的数据最终都是通过PCI-E总线才能与CPU链接。

多少带宽才够用 谈PCI-E显卡接口速度

    正因为此,主板上PCI-E通道数量的多少往往成为衡量主板性能等级的重要指标之一,别看有些主板提供了三条或者四条显卡插槽,但是由于芯片组或CPU提供的PCI-E通道不足,实际使用中会有很大局限。

    目前PCI-E的主流标准是2.0,下一代PCI-E 3.0标准也公布了很久了,只是相关的硬件还没有完全到位,只有CPU、主板和显卡同时支持之后我们才能享受到PCI-E 3.0带来的快感。

    单位换算:“位(bit)”和“字节(byte)”的关系大家都知道了,理论上1byte=8bit,1GB=8Gb,1GBps=8Gbps,还有一个单位是Transfer/s(缩写T/s),这是一个速率单位,在AMD的HT和Intel的QPI介绍中很常见,1T/s与1bps/s可以看作是等价的,即1B=8b=8T/s。

● 需要注意的是,在一些新的技术标准中,为了防止数据在高速传输中出错而加入了校验码,比如PCI-E 2.0、USB 3.0和SATA 3.0中采用的是8/10编码,每10位编码中只有8位是真实数据,这时单位换算就不再是1:8而是1:10了,USB 3.0的5Gbps速度实际上是理论500MB/s而非理论625MB/s,SATA 6Gbps的理论速度则是600MB/s而非750MB/s。

● 带宽计算:PCI-E的带宽计算与显存带宽(B/s)=运行频率(MHz)*数据倍率*显存位宽(bit)?相类似,只是前者公式略微复杂一些,串行PCI-E带宽(B/s)=PCIE时钟频率*每周期数据位(bit)*总线通道数*编码方式?,以最常见的PCI-E 2.0 x16插槽为例,其时钟频率为5GHz(通过基准频率和PLL锁相环得到),每周期可传输2bit数据,16条通道,8/10编码,其传输总带宽=5000*2*16*8?0?=16GB/s。

    首先,向大家简单讲解一下PCI-E接口的针脚定义。从显卡金手指部分的走线上可以非常清楚的分辨出单个通道的线路。如下图所示,显卡正面,每个红色箭头指向一个PCI-E通道。黑色圆圈内为显示核心的PCI-E第十三根通道连接显卡第十三根PCI-E通道金手指的PCB走线,正面每通道只有两根走线是数据所用,与GPU连接,其余为地线。相同的,每根PCI-E通道都可以通过此方法来分辨出来。

多少带宽才够用 谈PCI-E显卡接口速度

    我们通过用胶带覆盖显卡PCI-E接口金手指的方法来屏蔽,由于PCI-E每个通道彼此互相独立,并且支持通道数量向下兼容(如果x16设备插在x1槽上,则自动降为x1)。

多少带宽才够用 谈PCI-E显卡接口速度

    其中数据分通道传输模式即PCI-E总线的x1、x2、x4、x8、x12、x16和x32多通道连接,x1单向传输带宽即可达到250MB/s,双向传输带宽更能够达到500MB/s。目前我们所用的PCI-E显卡就是基于分通道传输模式的x16通道连接。

注意:PCI-E通道只支持 x1、x4、x8、x16、x32模式,如果屏蔽了16根中的1根是无法达到PCI-E x15模式的,系统会将之降级为PCI-E x8模式。因此,想玩非主流的同学会有所失望。

    为了充分体验出PCI-E接口不同通道数的性能差距,我们选用了当前最高端但核心显卡某品牌GTX580来做测试用卡,平台配置如下图所示。

多少带宽才够用 谈PCI-E显卡接口速度

    关于为什么用GTX580会比较准确的问题的解释。GTX580有512个CUDA核心,拥有相当强大的计算性能,因此对带宽的要求会很高。

    测试项目介绍:3D Mark Vantage、3D Mark 11、ComputeMark 2.1、IghashGPU、Cyber LinkMediaShow 6.5、《街霸4》、《鹰击长空》、《尘埃2》、《地铁2033》。其中3D Mark Vantage和3D Mark 11是测试各模式下显卡的理论3D性能,ComputeMark 2.1测试显卡的DirectCompute通用计算性能,IghashGPU测试显卡CUDA的暴力破解密码能力,CyberLink MediaShow 6.5测试CUDA视频转码性能,游戏则是用来测试实际3D性能用的,为了测试出最真实的性能成绩,所有游戏分辨率为1920x1200,特效均开到最高并且开启4xAA和16xAF。


● DX10理论性能测试:3DMark Vantage

    3DMark Vantage已于2008年4月28日发布,是业界第一套专门基于微软DX10 API打造的综合性基准测试工具,并能全面发挥多路显卡、多核心处理器的优势,能在当前和未来一段时间内满足PC系统游戏性能测试需求。和3DMark05的DX9专用性质类似,3DMark Vantage是专门为DX10显卡量身打造的,而且只能运行在Windows Vista SP1操作系统下。它包括两个图形测试项目、两个处理器测试项目、六个特性测试项目。

多少带宽才够用 谈PCI-E显卡接口速度

多少带宽才够用 谈PCI-E显卡接口速度

● DX11理论性能测试:3DMark 11

    PC游戏随去年Windows 7的发布进入DirectX 11时代,然而众多“参赛选手”DX11显卡早已磨拳擦掌准备上阵厮杀,我们却迟迟没有一个权威性的基准测试软件,来衡量游戏显卡DX11性能的高低。终于,DX11时代的3DMark在今天来到了我们面前。

多少带宽才够用 谈PCI-E显卡接口速度

多少带宽才够用 谈PCI-E显卡接口速度

    我们通过图表可以更为清晰的得到PCI-E接口在各个模式下的总体性能。对于3D Mark Vantage来说,x1模式下,PCI-E接口成了系统性能的最大瓶颈,相比x4模式低了约3000分,当PCI-E通道数达到了x4,性能就比较稳定了,与x8、x16差距不是很明显,这主要是由于3D Mark对GPU的要求是第一位的,对于PCI-E通道带宽需求并不明显。相同的,3D Mark 11也是如此。

● 超级街霸4:

    《超级街头霸王4:Super Street Fighter IV》是继《街头霸王IV》后CAPCOM推出的“街霸”最新作,如名所示,本作在《街头霸王IV》的系统基础上追加众多新要素,T.Hawk等过去作品的登场角色将在本作中出现,除此之外还加入如“茱莉(ジュリ)”等新角色。

多少带宽才够用 谈PCI-E显卡接口速度

多少带宽才够用 谈PCI-E显卡接口速度

    实际游戏测试中对于GPU要求不高的《街头霸王4》显现出了PCI-E高带宽下的优势,从PCI-E x1到PCI-E x16模式,性能提升了接近一倍。每提升PCI-E接口的一个档次,性能也随之提升一个档次,直到PCI-E x8提升为PCI-E x16性能提升率才略有下降。

● 鹰击长空:

    《HAWX》的故事背景设定在2012年,私人企业武装力量日趋强大,世界正处在分崩离析陷入大战的边缘。玩家可以驾驶超过50种战机在高空中打击敌方力量。除了单人游戏外,游戏还将支持4人协同的编队模式,以及最高16人的对战模式。

多少带宽才够用 谈PCI-E显卡接口速度

多少带宽才够用 谈PCI-E显卡接口速度

    在对GPU性能需求略有提升的《鹰击长空》中,PCI-E x1与其他模式差距依然很大。直到提升到x8模式,性能得到显著的提升,当提升到x16模式的时候,性能与x8模式的差距基本上不是很明显。

● 尘埃2:

    良好的赛车稳定性、制动性和简单的赛道设计大大降低游戏难度,即使是赛车菜鸟也可以容易上手;比赛结束后的重播功能让玩家可以自由选择视角和控制播放进度,加上出色的画面、良好的驾驶手感、杰出的单人游戏设定、在各种跑道上的不同操控感觉,极具临场感的《科林麦克雷:尘埃2》绝对适合所有喜爱赛车游戏的玩家。

多少带宽才够用 谈PCI-E显卡接口速度

多少带宽才够用 谈PCI-E显卡接口速度

    在《尘埃2》测试中,PCI-E x1模式依然与其他模式有很大差距,x4、x8、x16各模式下性能差距也很明显。

● 地铁2033:

    《地铁2033》题材基于俄罗斯最畅销小说Dmitry Glukhovsky。由乌克兰4A游戏工作室开发,采用4A游戏引擎,而且PC版支持nvidia的PhysX物理特效。 2013年,由于大面积的核泄漏,导致几乎所有的人类都被消灭,而且地面已经被污染无法生存,极少数幸存者存活在莫斯科的深度地下避难所里(俄罗斯的地铁站在建造之初就有防空防炸防核防辐射的设计)人类文明进入了新的黑暗时代。直至2033年,整整一代人出生并在地下成长,他们长期被困在“地铁站”的城市。

多少带宽才够用 谈PCI-E显卡接口速度

   多少带宽才够用 谈PCI-E显卡接口速度

    《地铁2033》是目前对GPU性能要求最高的游戏之一,PCI-E x1模式依然是性能瓶颈,当提升到x4模式的时候性能与提升到x8、x16的差距微乎其微,都是很卡。

GPU加密解密测试:

    GPU破解RAR密码,这是一个相当有趣的小工具,能够让你用 GPU 暴力破解密码。

多少带宽才够用 谈PCI-E显卡接口速度

多少带宽才够用 谈PCI-E显卡接口速度

    GPU CUDA解密貌似对PCI-E带宽非常非常非常不敏感,不管是x1、x4、x8还是、x16模式,解密的速度都是一样的。

DirectCompute理论测试:

    微软在DX11中引入了通用计算接口标准DirectCompute,并在渲染架构中新增了Compute Shader,都是为了发挥GPU的并行计算优势,将其应用范围从单纯的图形渲染拓展到更多计算领域,因此通用计算性能的高低将在今后成为衡量显卡整体性能的一部分。

    ComputeMark由捷克硬件和游戏网站CzechGamer.com的Robert Varga开发完成,技术上基于Jan Vlietinck的Fluid3D Demo,号称是“第一个百分之百的DX11 Compute Shader基准测试工具”,一般情况下能够调动99%的GPU资源,CPU占用率只有0-1%,因此在考察GPU通用计算性能的同时,也能考验显卡的稳定性,对超频亦有所帮助,另外测试的时候还可以自行选择运行时间(单位秒)。

多少带宽才够用 谈PCI-E显卡接口速度

    ComputeMark要求纯粹的DX11环境才能运行,包括Windows 7 32/64位操作系统、DX11 API和DX11显卡。

多少带宽才够用 谈PCI-E显卡接口速度

    DirectCompute通用计算ComputeMark测试得出的成绩显示出GPU对于PCI-E带宽非常不敏感,PCI-E x1就足够发挥出全部性能了。

GPU视频转码测试:

    MediaShow Espresso是第一款同时支持CUDA与Stream加速的视频转换软件,除此之外它还对Intel?Core i7处理器的超线程及SSE4指令集做了优化,因此无论纯CPU转码还是GPU加速,其速度比传统软件都要快。

多少带宽才够用 谈PCI-E显卡接口速度

多少带宽才够用 谈PCI-E显卡接口速度

    在视频转码测试中,PCI-E x1的带宽明显不足,与其他模式下的成绩有很大差距,当通道数x4模式以上时,性能的提升已经不是很明显,每提升一个模式,可以获得2s的性能提升。

● 全文总结

    就目前的GPU性能来看,PCI-E x16 2.0的带宽对于单芯单卡已经足够用,目前的瓶颈是GPU的性能。

    对于游戏来说,GPU可能需要更高的接口带宽,游戏的FPS越高,GPU就需要频繁的与CPU互换数据,此时就需要很高的带宽支持。而如果FPS很低的话,对于接口带宽要求就很低了。

    由于时间的限制编辑并没有做双卡及多卡的测试,相信多卡模式下对PCI-E带宽的要求会非常高。单卡下GTX580都如此,甚至编辑觉得一些低端显卡完全都用不上x16的高带宽。眼看着PCI-E 3.0即将来到我们的身边,将为我们带来32GB/s的传输速率,当然这是为下一代高端显卡准备的。

    不过对于通用计算来说,显然CPU与GPU之间的数据交换远不如游戏中那么频繁,对于接口带宽的要求很低,很多时候PCI-E X1都够用了。■

    扩展阅读带宽不是问题!物理子卡实际应用测试》<

5人已赞

关注我们

泡泡网

手机扫码关注