游戏外的竞争!NVATI通用计算技术分析
首款专门作流处理/并行计算的GPU产品并不是NVIDIA的Tesla,而是ATI的FireStream,早在2006年,ATI就发布了基于R580核心的流处理加速卡,48个像素渲染单元成为流处理器的雏形:
可惜的是,在第一代DX10显卡较量中的失败,让AMD浪费了太多的时间与机会。G80核心成为高性能及并行计算的代名词,专门针对并行计算设计的Tesla也暂露头脚。
当然AMD的脚步也没有停止,FireStream产品线伴随着GPU的升级而更新,AMD的GPU架构天生就拥有很强的浮点运算能力,尤其是双精度浮点运算能力!
单精度浮点运算,A卡并没有比N卡高太多,但要知道在对精度要求很高的科学研究和勘探方面,单精度是没有价值的,所有计算都需要双精度64Bit。A卡的双精度运算是单精度的1/5,而N卡的双精度运算只有单精度的1/8。
核心为4片GPU的1U服务器,Tesla S1070=Tesla C1060×4
除了单GPU核心的产品之外,NVIDIA还有专门设计的多GPU Tesla Personal SuperComputer运算系统,AMD也有类似的运算加速系统:
Aprius CA8000允许在机架内部插上最多八块FireStream 9270流处理加速卡,从而提供将近10TFlops的单精度浮点运算能力,以及1.9TFlops的双精度浮点运算能力。当然AMD的机架体积也要比NVIDIA的1U机架大很多,双方的外观和结构虽然相差很多,但基本原理是一致的,都是类似于外置显卡的解决方案。
不过,A卡SIMD架构的效率一直让人担心,目前上没有能够直接对比双方实际浮点运算性能的软件,但根据Folding@home的民间数据来看,HD4870不如GTX260,而GTX260与9800GTX+是差不多的,看来双方在并行计算方面都还有继续优化提升的空间。