火力全开超TITAN！GTX780GHz首发评测-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 评测 / 正文

火力全开超TITAN！GTX780GHz首发评测

2013年10月30日 00:00作者：蒋尚文编辑：蒋尚文文章出处：泡泡网原创

原来的一个困难是，GPU始终要优化调度来自多个数据流的工作负载。Fermi 结构支持从单独数据流的16路并发内核启动，但最终数据流都复用相同的硬件工作队列。这允许虚假的数据流内依赖，要求在单独数据流内的其他内核可以执行之前就完成一个数据流内依靠的内核。虽然在某种程度上这可以通过使用广度优先启动顺序缓解，但是随着程序的复杂性的增加，这可以成为越来越难以有效地管理。

Kepler GK110 使用新 Hyper‐Q 特征改进了这一功能。Hyper‐Q 允许 32 个并发，硬件管理的连接（对比 Fermi 的单一连接），增加了主机和 GPU 中 CUDA Work Distributor （CWD）逻辑之间的连接总数（工作队列)。Hyper‐Q 是一种灵活的解决方案，允许来自多个 CUDA 流、多个消息传递接口（MPI）进程，甚至是进程内多个线程的单独连接。以前遇到跨任务虚假串行化任务的应用程序，限制了 GPU 的利用率，而现在无需改变任何现有代码，性能就能得到 32 倍的大幅度提升。

Hyper‐Q 允许CPU和GPU之间更多的并发连接

每个 CUDA 流在其自己硬件工作队列管理，优化流间的依赖关系，一个流中的运算将不再阻止其他流，使得流能够同时执行，无需特别定制的启动顺序，消除了可能的虚假依赖。Hyper‐Q 在基于 MPI 的并行计算机系统中使用会有明显的优势。通常在多核 CPU 系统上运行时创建传统基于 MPI‐的算法，分配给每个 MPI 进程的工作量会相应地调整。这可能会导致单个MPI 进程没有足够的工作完全占据 GPU。虽然一直以来多个 MPI 进程都可以共享 GPU，但是这些进程可能会成为虚假依赖的瓶颈。Hyper‐Q 避免了这些虚假的依赖，大大提高了 MPI 进程间共享 GPU 的效率。

Hyper‐Q 与 CUDA 流一起工作：左侧显示 Fermi 模式，仅 (C,P) 和 (R,X) 可以同时运行，因为单个硬件工作队列导致的流内依赖。Kepler Hyper‐Q 模式允许所有流使用单独的工作队列同时运行。

0人已赞

第1页：火力全开很猛!新版GTX780GHz首发评测第2页：GK110 Kepler框图和理论性能第3页：GK110核心流式多处理器(SMX)架构第4页：GK110核心新编码和指令优化第5页：Kepler 内存子系统：L1、L2、ECC 第6页：智能细化运算：Dynamic Parallelism 第7页：CPU/GPU之间并发连接：Hyper‐Q 第8页：智能Grid调度和GPUDirect神经反射第9页：各大显卡厂商GTX780GHz曝光第10页：测试说明和平台介绍第11页：最新3D性能基准：《3DMARK》第12页：DX11基准测试：《3DMark11》第13页：DX11基准测试：《Unigine Valley》第14页：DX11游戏：《孤岛危机3》第15页：DX11游戏：《古墓丽影9》第16页：DX11游戏：《战地3》第17页：DX11游戏：《地铁 2033》第18页：DX11测试：《石巨人》第19页：DX11游戏：《异形大战铁血战士》第20页：智能游戏设置：GeForce Experlence 第21页：GTX 780空闲、满载整机功耗测试第22页：总结和点评：NVIDIA的良心显卡

火力全开超TITAN！GTX780GHz首发评测

关注我们