台北电脑展2011!通用计算时代已来临
CUDA构架产品并不是单一的硬件或软件产品,而是一整套解决方案。目前市面上已经部署了超过一亿颗支持CUDA的GPU,数以千计的软件开发人员正在使用免费的CUDA软件工具来为各种应用程序加速。在编程方面,目前CUDA最新的版本为CUDA 4.0。
● CUDA 4.0版本3大重要改进
GPU Direct2.0技术——支持一台服务器或工作站内多GPU之间的点对点通信。这让多GPU编程更加轻松并且能够提升应用程序性能。
统一虚拟寻址(UVA)——能够为主系统内存和显卡显存提供一个合并的存储器地址空间,让并行编程变得更快、更容易。
Thrust C++模板高性能基元库——能够提供一系列强大的开源C++并行算法和数据结构,这些内容能够让C++开发人员的编程工作变得轻松。与使用标准模板库(STL)以及线程构件(TBB)时相比,通过利用Thrust,并行排序等例程的速度可提升5至100倍。
Acer展出采用Tesla构架的机架式服务器
● CUDA 4.0架构版本其它特性与功能:
MPI与CUDA应用程序相结合,当应用程序发出MPI收发调用指令时,例如OpenMPI等改编的MPI软件可通过Infiniband与显卡显存自动收发数据。
GPU多线程共享,多个CPU主线程能够在一颗GPU上共享运行环境,从而使多线程应用程序共享一颗GPU变得更加轻松。
单CPU线程共享多GPU,一个CPU主线程可以访问系统内的所有GPU。 开发人员能够轻而易举地协调多颗GPU上的工作负荷,满足应用程序中“halo”交换等任务的需要。
全新的NPP图像与计算机视觉库,其中大量图像变换操作让开发人员能够快速开发出成像以及计算机视觉应用程序。