泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

DX11性价比之王!GTX460双雄权威评测

第二章/第二节 GF104流处理器效率的改进

每组SM中特殊功能单元数量从4个增至8个:

    GF100每个SM内部还拥有额外的四个SFU(Special Function Units,特殊功能单元),可用于执行抽象的指令,例如正弦、余弦、倒数和平方根,图形插值指令也在SFU上执行。

    GF104每个SM内部CUDA核心数量增加50%之后,NVIDIA并没有让SFU数量也增加50%,而是像纹理单元那样,直接翻倍,从4个增至8个。

DX11性价比之王!GTX460

SFU和Dispatch Unit数量加倍

    每个SFU在一个时钟周期内针对每个线程均可执行一条指令,一个Warp(32个线程)的执行时间可超过八个时钟周期。SFU流水线从分派单元中分离出来,让分派单元能够在SFU处于占用状态时分发给其他执行单元。复杂的程序着色器在特殊功能专用硬件上的运行优势尤为明显。

每组SM中指令分配单元从2个增至4个:

    CUDA核心数量增加50%之后,并行线程调度器的负担显然将会更重,如果指令不能分配到每一个CUDA核心,那将会造成资源闲置,使得运算能力不如预期。NVIDIA意识到了这一点,于是直接将指令分配单元的数量加倍,由2个变为4个。

图为GF100核心的Warp调度器和指令分配模式

    现在,GF104的SM可对48个为一组的并行线程(又叫做Warp)进行调度。每个SM拥有两个Warp调度器以及四个指令分派单元,这样每个Warp周期可以并发执行两条指令,每个SM一次可以执行四条指令。

0人已赞
第1页:Fermi家族再添新丁!NV发布全新重磅产品第2页:图形架构设计思路:小修小补与重新设计第3页:高端产品设计思路:小核心与大核心之战第4页:中端产品设计思路:一刀两半与优化设计第5页:改进流处理器架构:CUDA增50%纹理增100%第6页:优化流处理器效率:特殊功能和指令分配第7页:删除无用功能单元:显存ECC和双精度第8页:经典G92核心再世!GTX460保留实力第9页:特色功能之战:GTX460支持音频源码输出第10页:特色功能之战:3D Vision雄霸天下第11页:特色功能之战:双卡三屏对抗Eyefinity第12页:特色功能之战:AMD无法染指的物理加速第13页:特色功能之战:CUDA遥遥领先于Stream第14页:NVIDIA公版GTX460 1GB显卡实物拆解第15页:NVIDIA公版GTX460 768MB显卡实物拆解第16页:首批GTX460显卡:索泰1GB和768MB第17页:首批GTX460显卡:七彩虹非公版1GB第18页:首批GTX460显卡:影驰非公版1GB第19页:首批GTX460显卡:翔升非公版1GB第20页:首批GTX460显卡:映众微星旌宇768MB公版第21页:测试平台:Core i7 875 + P55第22页:DX9C理论:《3DMark06》第23页:DX9C游戏:《使命召唤6:现代战争2》第24页:DX9C游戏:《星际争霸2:自由之翼》第25页:DX9C游戏:《极品飞车13:变速》第26页:DX9C游戏:《蝙蝠侠:阿卡姆疯人院》第27页:DX10理论:《3DMark Vantage》第28页:DX10游戏:《孤岛危机:弹头》第29页:DX10游戏:《冲突世界:苏联进攻》第30页:DX10.1游戏:《孤岛惊魂2》第31页:DX10.1游戏:《鹰击长空》第32页:DX11理论:《Heaven Benchmark 2.0》第33页:DX11游戏:《BattleForge》第34页:DX11游戏:《尘埃2》第35页:DX11游戏:《潜行者》第36页:DX11游戏:《异型大战铁血战士》第37页:DX11游戏:《战地:叛逆联队2》第38页:DX11游戏:《地铁2033》第39页:DX11演示:《石巨人》第40页:附加测试:GTX460待机功耗低于HD5770第41页:附加测试:GTX460最高仅66度第42页:附加测试:CUDA性能之蛋白质折叠第43页:附加测试:CUDA性能之视频转码第44页:附加测试:GTX460高频版大战HD5850第45页:成绩汇总:GTX460 1GB比768MB强多少第46页:成绩汇总:GTX460比GTX465强多少第47页:成绩汇总:GTX460 1GB PK HD5830第48页:成绩汇总:GTX460 768MB PK HD5830第49页:全文总结:千元显卡市场重新洗牌

关注我们

泡泡网

手机扫码关注