泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

低端卡也猖狂!GT220玩转CUDA软件指南

    泡泡网显卡频道10月28日 半个月前,NVIDIA正式发布了其新一代低端显卡产品GT220/GT210这两款产品,其中的GT220由于具备了高规格、高性能以及诸多NVIDIA最新技术,受到了广大消费者的关注。关于GT220显卡的游戏性能,我们从《灭杀老卡!NVIDIA新架构40nmGT220首测》这篇文章的实测中可以看到。

    我们之前已经对GT220的游戏性能以及高清特性做了相应的文章,但并没有太多的介绍GT220另一大特性——CUDA通用计算架构。实际上,GT220在通用计算方面也相对于前一代的低端产品9500、9600系列产品有很大的改进。本文,我们主要就是要介绍一下GT220在通用计算方面的改进,并且对目前常用的一些CUDA软件进行实测介绍,如何使用GT220玩转CUDA。

● 第二代统一架构 更加适合通用计算

    在G80以前,显卡(GPU)的规格主要用管线(Shader,着色器)来形容,分为像素管线(Pixel Shader)和顶点管线(Vertex Shader)。到了第一代DX10显卡G80时代,NVIDIA首次采用了“统一渲染架构”,将传统的管线统一起来,每个Shader既可以处理原本像素管线的工作,也可以处理顶点管线的工作,并且这些流处理器还可以通过NVIDIA的CUDA处理非图形运算。G8x以及G9x的核心都采用的是第一代统一渲染架构。

开创视觉计算帝国GTX280/260权威评测

    到了GTX200时代,NVIDIA引入了“第二代统一架构”,细心的朋友可以看出这一代架构特地在名称中去掉了“渲染”这两个字,NVIDIA也正是通过这样的方式来证明在这一代的产品中,“图形渲染”和“通用计算”已经具有等同的重要性,GPU已经不单单是为了图形渲染而生。

    GT220正是采用GTX200架构的产品,而且这是NVIDIA第一次将这种先进的架构普及到低端卡上。大家知道,GT220到来之前,低端市场主要是9600GSO、9500GT甚至9400GT等,而这些显卡都采用的是和G80一样的第一代统一渲染架构。虽然第一代统一渲染架构也能很好的处理通用计算,但NVIDIA认为该架构仍然有改进的潜力,于是改进后的GTX200核心出现了。GT220就是首款采用GTX200核心的低端显卡。

开创视觉计算帝国GTX280/260权威评测

    通过核心架构图可以看到,GTX200总共拥有十个流处理器阵列,每个阵列内部拥有8×3=24个流处理器,其中每8个为一组构成SIMT(单指令多任务架构),并共享16K指令缓存,三组SIMT共享一级缓存。这样的标量流处理器设计适合执行高度并行化指令,无论对于传统的图形渲染,还是物理加速运算、大规模数据处理都游刃有余。

开创视觉计算帝国GTX280/260权威评测

    除了这些之外,GTX200核心相对于G80/G9x核心来说,还具备有以下特性:

1. 每个SM可执行线程上限提升
2. 每个SM的指令寄存器翻倍:
3.纹理单元和光栅单元都得到进一步改进
4.几何着色性能增强

.....

    因此,第二代统一架构的主要含义,就是将图形处理架构和并行计算架构完美的结合起来,成为一颗真正意义上的通用处理器,超越图形处理器的概念!所以,在基于GTX200架构的产品中,如果你只看游戏性能的话,你只看到了该产品一半的功能。

    自进入DX10时代以来,在GPU内集成高清硬件解码单元已经成为了显卡的标配,不过这方面的技术在之前一直是AMD领先。到了GT220这一代,高清方面的功能终于不再比A卡落后了。不仅仅可以完美硬件解码H.264、VC-1等格式的高清视频,并且GPU内还集成了音频单元,可以直接通过显卡输出音频。

    我们使用TotalMedia Theatre这款软件简单的测试了一下GT220显卡在高清解码方面的能力。上图是未开启GPU硬件解码时(未使用GT220解码)播放高清的情况,我们可以看到CPU占用率为36%,而且极不稳定,遇到码率高的场景CPU占用率会急速上升。

    开启这款软件的硬件加速非常简单,直接通过设置菜单中的视频——启用硬件加速,便可以使用NVIDIA显卡进行硬件解码高清视频。下面是开启硬件解码加速(也就是使用GT220硬件解码)之后CPU占用率的变化情况。

    我们可以看到,当开启GT220的GPU硬件加速之后,CPU占用率马上降到了12%左右,并且非常稳定,并没有因为场景而导致CPU占用率出现了很大的波动。可以看出,GT220的高清解码性能确实非常不错。

    BadaBoom是NVIDIA联合Elemetal推出的一款视频转码软件,也是业内最早对NVIDIA CUDA提供支持的软件,甚至可以说是专门为NVIDIA的CUDA技术开发出的一款商业软件。通过这款软件,用户可以非常方便的利用NVIDIA GPU的计算能力为主流的设备转换视频,比如iphone、ipod touch、黑莓、youtube等等。

    BadaBOOM的界面简单,不需要像其他软件一样首先要进行复杂的设置,而是选择需要压制的视频和需要生成的格式即可。中间的滚动条可以设定转换品质。不过,请记得的首先给NVIDIA的显卡安装最新的驱动程序,这样才能更好的发挥GPU的各种功能。

    当然,如果你有一些比较特殊的要求,也可以点击界面上的“高级”按钮进入高级选项设置界面,其中可以设置解码器、编码器、分辨率以及音频设置等等。

    根据笔者的测试,使用标准版GT220显卡将NVIDIA长度为1分50秒的720P高清视频转换成iPhone格式的mp4视频,一共只花费了32秒。而且,如果视频更长的话,性能提升的比例会更高。

相关评测:PSP/iPhone片友必看!GPU视频编码测试

下载:Badaboom Media Converter

    暴风转码是暴风网际公司推出的一款视频转码软件,其全中文化的界面以及几乎支持所有视频格式的特性受到了国人的喜爱。从1.0正式版开始,暴风转码就加入了CUDA技术,使得这款软件转码的效率大幅度提升。

    使用暴风转码首先需要在设置中开启CUDA编码加速功能,很多新用户可能找不到“设置”按钮在哪儿,其实软件界面右上角最小化按钮左边的倒三角中就是这款软件的主菜单,其中就有“设置”这个项目。这样做主要是为了使整个界面看起来更加简洁。

    暴风转码不仅仅对源视频格式几乎全部支持,而且输出的目标视频也同样如此,软件预设可以给各大品牌的手机、MP4播放器以及其他设备转码,同样用户还可以完全自定义,将视频转换成自己喜欢的格式、分辨率等。

    笔者测试了使用GT220显卡将前一页中我们提到的NVIDIA动画片转换成诺基亚N9x系列手机所支持的格式,从截图中我们看出,仅仅19秒的时间就完成了这个视频的转换,效率之高令人咂舌。

    vReveal是来自MotionDSP公司推出的一款视频增强、修复软件,这款软件号称采用了《犯罪现场调查》级别的超分辨率技术(super-resolution),该技术的原型是执法和情报部门所采用的法庭专用应用程序。该技术的算法原理其实也很简单,就是通过分析连续多个视频帧来重建单一帧画面的细节,直至完整对整个视频的修复和增强。

    很显然,这款软件同样支持NVIDIA CUDA技术。软件的几大功能就是提升视频的分辨率、清晰度、抗抖动、抗噪点等等功能。

    使用这款软件同样需要开启NVIDIA GPU加速功能,不过如果软件检测到系统使用的是NVIDIA显卡,同时安装好了驱动程序,会自动启用CUDA相关加速功能。

    根据我们的测试,即使同时开启这款软件中的所有功能,GT220显卡也完全可以流畅的实时计算并生成图像,可以看出48个流处理器的GT220在通用计算方面的性能还是非常不错的。

下载:vReveal


    以上我们仅仅列出了一些比较常用的CUDA视频应用软件,其实目前支持CUDA加速的软件已经非常多,并且已经渗透到各行各业,没有办法做一一的介绍。总之,和上一代的低端显卡相比,GT220拥有48个流处理器,CUDA加速完全没有瓶颈。即使相对于同为48个流处理器的9600GSO来说,GT220采用的GTX200架构仍然可以获得更好的表现。

    AIC索泰显卡旗下一款GT220-1GD2激战版已经到达卖场,报价499元,感兴趣的可以关注一下。

    这款索泰GT220-1GD2激战版采用GT220显示核心,基于40nm制造工艺。内建48个Streaming Processor处理单元。特效方面,该显卡支持DirectX 10.1与Shader Moder 4.1的技术。

    供电方面,索泰GT220-1GD2激战版拥有核心两相+显存一相独立供电,全部采用全封闭磁屏铁素体电感、FP电容以及8pin贴片超低内阻MOS管,保证了显卡稳定运行。

    显存方面,索泰GT220-1GD2激战版搭载了三星GDDR2显存颗粒,组成了1024MB/128bit的显存规格,显卡默认核心/SP/显存频率为625/1000/1360MHz。

    索泰GT220-1GD2激战版提供了HDMI 1.3a(HDCP、7.1声道数字音频输出)+DVI+VGA输出接口设计,满足大部分用户的使用需要。

● 映众GT220至尊海量版 599元

  映众(Inno3D)Geforce GT220至尊海量版为映众惯用的绿色PCB设计,采用NVIDIA公版P681 PCB。该卡基于GT216核心,核心编号为GT216-300-A2。规格方面拥有48个流处理器,显存方面位宽为128Bit,从规格上来看GT220除了在制程上要优于9500GT外,在流处理器和频率上也高于9500GT。

    供电部分,由于核心采用40nm工艺制程,其对于供电的要求并不高,因此显卡配备的1+1相供电已经足以满足GT220的供电需求。可以看到,映众(Inno3D)Geforce GT220至尊海量版采用的是全固体电容用料,寿命更长,稳定性也更强!显存部分提供了独立的一相供电,能够明显提升显存的使用稳定性,超频能力。

    显存部分,映众(Inno3D)Geforce GT220至尊海量版采用的是三星SDDR3显存颗粒,一共八颗组成了1GB/128Bit的规格。核心显存频率为公版的625/1580MHz,还有相当大的超频空间。

  制程的改进使GT216-300-A2核心功耗与发热量大减,而映众(Inno3D)Geforce GT220至尊海量版还是采用散热性能非常出色的鳍片式散热器对核心进行散热,在静音与散热方面也可以取得较好的平衡。

  视频输出方面采用了非常实用的DVI+HDMI+VGA组合。值得注意的是,GT220首次核心集成了音频单元,可以轻松实现HDMI音/画一线输出,对于HTPC玩家来言,HDMI接口更是为欣赏高清提供了最大的方便。

  目前这款映众(Inno3D)Geforce GT220至尊海量版的报价为599元,在现有的GT220中来看,价格不算便宜。但一分钱一分货,该卡配置强大,从做工用料来看,这款映众(Inno3D)Geforce GT220至尊海量版的表现还是相当不错的。近期想要购买主流级显卡的用户而言,不妨关注下。

    来自红魔耕昇显卡旗下的GT220红缨版上市,现在仅售499元。GT220采用40nm工艺制造,在和9系列显卡同性能的情况下,功耗只有9系列显卡的30%。

    显卡核心代号GT216,提供48个流处理器,输出接口包括VGA、DVI、HDMI和DisplayPort。GeForce GT 220支持DirectX 10.1、OpenGL 3.0、PureVideo、PhysX、CUDA、PCI-E 2.0等技术,通过了Windows Vista认证,并支持Windows 7各项新特性。

    散热方面,由于该显卡功耗不高,散热器只是采用普通的铝热挤压工艺制成的散热片,再搭配一个低噪音风扇,完全可以达到良好的散热效果。

    供电方面,产品采用2+1相封闭式供电,配合使用全固态电容,有效提升了产品的品质,产品超频潜力也得到了提升。

    显存方面,采用GT216核心,核心频率、Shader频率分别为650MHz、1414MHz,板载512M 128bit DDR3存,显存频率为1800MHz。

    接口部分,显卡提供了HDMI、D-Sub和DVI-I接口,NVIDIA本次在GT220显卡上集成了Audio解码单元,高清用户观看HDMI影视采用显卡直接连接液晶电视,就可以实现视频和音频同步输出的功能。

    铭瑄显卡旗下的GT220变形金刚版正式上市,并打出了499元的报价。铭瑄“变形金刚”系列已经在市场上传承了几代显卡。其以不俗的散热和优异的性价比打动了很多朋友。

  

    它在显存方面则采用奇梦达的1.0ns GDDR3显存,组成512M/128bit的显存规格,默认显存频率为1800MHz,核心频率/流处理器频率为625/1800MHz。

    从我们之前的测试结果来看,对于主流的DX9游戏,这款铭瑄GT220变形金刚高清版都能达到流畅运行的标准,而DX10和DX10.1游戏则相对有些吃力。不过从市场定位来看,这款显卡主要面向日常办公和高清用户,除了CUDA解码与编码、PhysX等原有功能外,显卡还加入了对DX10.1的支持以及Flash硬件加速功能。所以抛开纯粹的游戏性能不谈,丰富的功能以及较低功耗和高清播放方面的优势,才是这款显卡的卖点所在。■

0人已赞

关注我们