专访NVIDIA黄仁勋,将GeForce 6推广
GeForce 6800 Ultra发布了。伴随详细深入的性能测试的陆续公布,有关它性能的种种争论也终于尘埃落定。在见识了这款有史以来最为强劲的3D图形核心的真正实力之后,人们的好奇心自然就会转移到另一个层面:我们什么时候能够在市场上看到基于GeForce 6图形核心的显卡产品?
2004年4月22日,在GeForce 6800 Ultra中国发布会第二天的媒体专访中,NVIDIA公司创始人、CEO黄仁勋先生告诉我们:今年之内,基于GeForce 6系列图形核心的全系列显卡产品将横扫中国市场!
此外,在此次媒体专访中,黄仁勋先生还就NVIDIA的市场策略、PCI-E规格、芯片组以及竞争对手的最新动向等问题发表了自己的看法。
专访一开始,黄仁勋先生首先向我们再次强调了GeForce 6系列所拥有的3大重大技术突破,其中的一些甚至在整个图形加速技术的发展史上也将具有“里程碑”式的意义。
● Shader Model 3.0
对应微软DirectX 9.0c的规格,GeForce 6系列的Shader Model全面升级到3.0(Pixel Shader 3.0和Vertex Shader 3.0)。关于Shader Model 3.0的深入技术分析请看【这里】。
黄仁勋先生以Pixel Shader 3.0为例进行了分析,并着重强调了其中两点技术改进。
Pixel Shader 3.0首次取消了对程序长度的限制。
这不仅意味着程序员可以根据需要,编写任意长度的像素着色程序以实现任何复杂的光影效果,同时更意味着对像素渲染程序处理效率的大幅度提升——在上一个版本,也就是2.0版的Pixel Shader中,每个程序的代码长度最多只能有96条。
黄仁勋先生说,假如Piexl Shader存在每周期处理64条指令的限制,而应用程序包含256条像素着色程序代码,图形核心就只能将这些代码以64条为单位拆分成4组,用4个周期来进行处理——这种处理过程也就是平时测试软件中常见的“Multi Pass”。
处理周期的增加,无疑会延长指令处理的时间,由此导致效率降低。而对于能够处理无限条像素着色指令的GeForce 6系列图形核心来说,256条指令完全能够用单一周期(也就是“Single Pass”)完成。周期一旦缩短,效率自然大为提高。
CineFX 3.0引擎将像素着色精度提高到了32位。
GeForce 6800 Ultra具备32bit浮点像素处理能力,这是NVIDIA此次发布新品的又一个重要技术亮点。这里黄仁勋先生以发布会上《虚幻III》的演示为例进行了说明。他指出,《虚幻III》的画面之所以看起来格外真实,其中很重要的一点是对灰阶的处理较以前有了很大的进步。
更宽泛的灰阶范围能够使亮的地方更亮、暗的地方更暗,并且可以表现出更为丰富的亮与暗的层次。在此之前,3D世界中物体的阴影就是一团漆黑。而现在,有了更多的灰阶,暗处的细节也会变得清晰,这意味着我们将能够看到阴影中的物体,甚至“阴影中物体的阴影”——就像现实世界里的情况一样。
至于32位的浮点精度到底能够实现多少灰阶,黄仁勋先生指出,目前广泛采用的R/G/B显示方式,每种颜色也只不过支持到8位精度,每种颜色有256级灰阶。因此32位浮点精度理论上可以表现无限多的灰阶——此时显卡输出的画面精度已经不是问题,反倒是显示器对灰阶的表现能力会成为人们享受新视觉体验的瓶颈。
● 超标量架构与更多流水线
与以往的图形核心相比,GeForce 6最具有革命性的改进在于引入了超标量(SuperScalar)流水线的结构——从Pentium开始,这项技术被广泛应用于微处理器,并且成为CPU发展史上的里程碑式的技术革新之一。
和处理器所采用的超标量技术一样,GeForce 6系列的超标量流水线可以并行处理两组指令操作。和传统的图形核心相比,基于超标量架构的GeForce 6 GPU拥有至少两倍于过去的处理能力,处理指令操作的效率得到大幅度提高。
此外,目前最高端的GeForce 6800 Ultra GPU拥有多达16条像素渲染管线,高端的GeForce 6800标准版GPU也拥有12条像素渲染管线。这和之前高端GPU普遍采用的8流水线设计相比,GeForce 6系列图形核心无疑拥有更加强大的处理能力和数据吞吐量,这也是推动GeForce 6800性能飙升的重要因素。<
● 强劲的可编程视频处理引擎(Video Processing Engine,VPE)
尽管类似的概念从最初的GeForce 256 GPU就已经存在,但是在发展初期,HDPV(High-Definition Video Processor,高清晰度视频处理器)的作用始终停留在高清晰度电视(HDTV)的解码方面。
Adobe鼎立支持的特效功能
这项功能在GeForce 6800 Ultra集成的VPE上得到了进一步加强,对高清晰度视频的反交错处理将能够实现24fps的逐行扫描显示和70fps的隔行扫描显示,能够让用户在PC上享受到真正电影级的视频效果。
除了对高清晰度视频解码的硬件支持外,GeForce 6800 Ultra的VPE还首次内置了对视频编码的硬件支持,能够实现MPEG-2(标清和高清分辨率)、MPEG-4(DivX)以及WMV9(标清和高清分辨率)的硬件编码和硬件解码。
在GeForce 6800 Ultra发布时,著名的图形和影像编辑软件供应商Adobe公司就已经表示将在未来的视频编辑软件(如After Effect)中提供对GeForce 6800 Ultra的支持,充分利用其可编程性和硬件加速能力来提高视频特效后期处理以及非线性编辑方面的效率。
好技术更要尽快普及
在介绍完GeForce 6800 Ultra的主要技术革新之后,黄仁勋先生指出,这些技术不仅出现在GeForce 6800 Ultra这款优异产品上,更将会运用于全系列GeForce 6图形核心,在6个月内从高端迅速切入中、低端市场。
黄先生信心十足地表示,今年之内NVIDIA的GeForce 6系列将覆盖包括优异、高端、主流和入门级在内的整个独立型显卡市场——也就是说,最晚到今年年底,中国的消费者一定能够在市场上买到基于GeForce 6图形核心、具备上述革命性技术的显卡产品。
● 性能翻倍,这只是革新的开始
黄仁勋先生着重指出,综观过往的图形核心发展史,像GeForce 6800 Ultra这样,新一代图形核心的首款产品达到乃至超过上一代图形核心顶尖型号两倍性能的情况当属很少有,这也是NVIDIA在3D图形技术发展史上创造的又一个No.1。
但这还仅仅是一个开端,两年之后的NV4x图形核心更会比现在快很多——对于到底快多少黄仁勋先生没有具体说明,但NV3x系列从前到后性能提升不大的情况相信一定会有彻底的改观。在性能提升方面,驱动程序的开发和优化也是功不可没,对此黄仁勋先生显得非常自信——大约6个月以后,第二版for GeForce 6系列图形核心的驱动程序将会带来性能的大幅度提升,让GeForce 6系列的用户享受免费升级的快感。
● 在商言商,不讳言追求利润
自信之余,黄仁勋先生也实事求是地承认,NV3x所经历的种种波折为NVIDIA带来了严重的毛利率下滑。在NV2x的时代,NVIDIA图形芯片的毛利率在40%左右,而到NV3x时降低到了30%左右,这次,NVIDIA对NV4x的毛利率恢复40%的水平同样充满信心。<
● 所谓“原生PCI-E”,只是在内部集成桥接芯片
随着Intel支持PCI Express的芯片组i915(Grantsdale)发布日期临近,大家对PCI-E的关注程度自然也越来越高。而在对PCI Express支持的实现上,NVIDIA的HSI桥接方案和竞争对手的“原生PCI-E”方案的优劣之争也始终没有平息。
HSI到底是否会影响PCI-E接口的性能?黄仁勋先生的回答毫不犹豫:“不会”。
由于GeForce 6系列已经具备了完善的PCI-E解决方案,因此HSI将主要应用于NV3x系列图形核心。就NV3x+HSI的组合而言,PCI Express接口能够为NV3x图形核心提供的带宽要超过AGP 8×的2.1GB/s,能够达到相当于AGP 12×乃至AGP 16×的水平。
而NV3x本质上仍然是基于AGP 8×图形接口的芯片,由于核心的限制,通过HSI转换成PCI Express不仅不会降低性能,反而会因为接口带宽的增加而对性能有所提升——只不过这种提升的幅度会比较有限,算不上是一种飞跃。在NVIDIA的规划中,真正的PCI Express接口的图形核心将是GeForce 6系列。
目前市场上所谓“原生PCI-E”解决方案,黄仁勋先生一针见血地指出,其实也不过是在芯片内部集成了类似HSI的转换芯片,其作用和外接HSI完全一样。
尽管在芯片内部进行集成可以减少延迟,但是这一方面会增加芯片的复杂程度和针脚数量,另一方面也会降低芯片接口选择的灵活性。在黄仁勋看来,就目前尚无芯片组正式支持PCI-E的现状而言,“原生PCI-E”的解决方案目前实用性不高,而当PCI-E真正开始普及时,NVIDIA的GeForce 6系列早已准备就绪了推出真正的原生PIC-E。
因此,现阶段NVIDIA的图形核心将全面通过HSI来实现对PCI-E的支持,同样,未来的PCI-E结构图形核心也将通过HSI实现对AGP接口的兼容。通过HSI,NVIDIA的各种图形核心将能够在AGP和PCI-E之间自由切换,为用户提供更多选择和搭配的自由。
● PCI-E普及大势所趋,桥接方案兼顾普罗大众
从宏观的角度看来,黄仁勋先生认为,尽管PCI-E目前还停留在概念和少量样品的阶段,但PCI-E的普及乃是大势所趋,NVIDIA也会通过GeForce 6的全新架构及时跟上PCI-E普及的脚步。至于PCI-E从概念走向真正普及的时间,黄仁勋先生认为大约会在一年半以后,也就是2005年的下半年。
并且还应注意到,PCI-E接口的普及会遵循“自上而下”的过程,也就是说高端产品会率先导入,然后再向低端产品延伸——初期来看,纯粹PCI-E接口的产品价格会比较高昂,从这个角度来说,NVIDIA的HSI桥接方案对于主流和低端市场意义就更大。
对于PC图形领域,PCI-E的普及已经不是“会不会”的问题,而是“什么时候”的问题。黄仁勋先生表示,目前正是PCI-E布局的时期,NVIDIA将会专注于PCI-E接口的研发和布局,GeForce 6系列领先对手一年已经为NVIDIA的PCI-E布局打下了很好的基础。<
● 多元化深入发展,芯片组业务持续升温
作为NVIDIA发展迅速的新兴业务,PC芯片组的情况也是我们关注的重点。尤其在今年,Intel和AMD的处理器竞争将全面上升到架构的高度,作为AMD阵营数一数二的芯片组厂商,NVIDIA的一举一动都会直接或者间接影响整个CPU领域的竞争态势。
对此黄仁勋先生并没有丝毫的隐瞒。他表示,今年NVIDIA的芯片组业务有3大焦点:
◎ 首先是持续进行先进技术的研发和应用,确保芯片组的技术领先和性能优势。
◎ 其次是开拓高端的服务器芯片组业务,主要集中在Opteron平台。
最新的nForce3 250Gb就是NVIDIA在这个领域进行的初步尝试。其千兆以太网、硬件防火墙和新颖的RAID功能都是NVIDIA技术优势的集中体现。
◎ 最后,NVIDIA还将向笔记本电脑所采用的移动芯片组领域进军,主要集中在移动型Athlon 64处理器平台——结合NVIDIA在移动图形核心领域的优势,在这方面有所突破也在情理之中。
至于Intel和AMD阵营选择的问题,黄仁勋先生表示,NVIDIA仍将专注于AMD平台,并且会在x86-64架构上投入更多精力——当然,和大多数外交辞令一样,黄仁勋先生也不排除和Intel进行合作的可能。
● 整合芯片组暂缓发展,专注于高性能领域
多少让我们感到有些意外的,是NVIDIA将在今年暂停整合芯片组的研发。对此黄仁勋先生解释道,在NVIDIA看来,随着3D游戏和高清晰度视频等应用的蓬勃发展,消费者对高性能独立型显卡的需求日益强烈,因此GeForce 6系列会是NVIDIA今年在图形芯片方面的重心所在。
此外,PCI Express的普及也处于布局的关键时期,NVIDIA将专注于PCI Express产品的布局和推动,以便在这个接口规范更新换代的转折时期占据比较有利的竞争地位。对于其他一些图形芯片业者仍然持续投入整合芯片组业务,黄仁勋先生表示,这种做法会分散厂商的研发力量,造成焦点的模糊,因而是错误的。至于曾经引起一些轰动和不少争议的MCP中的APU(音频处理单元,Audio Processing Unit),黄仁勋先生表示将会视研发进度和市场需求考虑是否重新加入。
● 不懈追求性价比,为中国特色的市场供货
在被问到NVIDIA的中国市场策略时,黄仁勋先生表示,GeForce FX 5200可以作为NVIDIA在中国市场的策略的集中体现。根据NVIDIA的观察,中国消费者总是希望用最少的钱获得最多、最新的功能。
因此,能够以低廉的价格提供对DirectX 9.0 API完整支持的GeForce FX 5200图形核心在短时间内取得了巨大的成功,并且使NVIDIA在短短一年的时间里将DirectX 9.0规格从最高端市场普及到低端,打破了以往用DirectX 9.0、DirectX 8.0和DirectX 7.0区格高、中、低端市场的传统做法。
在GeForce 6系列中,NVIDIA将这一策略发扬光大,全系列图形核心在功能特性方面完全相同,仅以性能和价格进行区分。虽然黄仁勋先生没有进一步说明,但我们认为,用以区分GeForce 6图形核心的手段,不外乎就是核心/显存频率的不同、显存种类和位宽的不同以及核心内部流水线数量的不同。预计在未来几个月内,NVIDIA将根据市场需求陆续发布GeForce 6图形核心的中、低端型号,在中国市场掀起GeForce 6的普及风暴。
● 中国的需求启发国际产业导向
作为对上述观点的补充,黄仁勋先生以即将成为未来家用PC主流形态的媒体中心(Media Center)为例进行了更多的阐述。尽管Media Center这个概念由微软所大力倡导,但黄仁勋先生看到的最早的Media Center的原型是在中国——在4年以前的联想。当时欧美家庭还根本没有出现这种需求,但是中国的家庭用户就要求家用PC有尽可能多的功能,其中很重要的部分就是多媒体影音娱乐的功能,这恰恰就是Media Center设计的初衷。
正是由于受到中国市场的启发,NVIDIA才在随后的几年里和微软密切合作,通过完善GPU的多媒体娱乐功能(比如集成视频处理器)推动Media Center的发展。如今,全球90%以上的Media Center PC基于NVIDIA的芯片组和GPU,但这还远远不够。黄仁勋先生非常自信地承诺,在5年之内,全球99%的用户将从基于NV4x图形核心的Media Center PC获得最好的影像享受。<
● GPU助力CPU,彻底提升玩家应用体验
伴随GPU频率的提升、流水线结构的完善和着色器功能/性能的增强,它和CPU之间的界限正在变得模糊。就目前的情况来看,尽管GPU的时钟频率和CPU相比还有明显的差距,但是由于可编程Shader的出现,其SIMD特性本质上相当于CPU的SSE/SSE2等等多媒体增强指令集,并且由于具备8条以上的流水线,因此在并行处理的能力方面甚至强于主流的CPU。
GeForce 6系列在导入超标量架构和更多流水线之后,其性能有了更大的飞跃,而视频处理引擎的导入也为GPU功能的拓展开辟了一条新的途径。在未来多媒体应用占据越来越重要地位的情况下,GPU的角色将更加多样化,甚至在一定程度上将分担CPU的工作。
黄仁勋先生对这个趋势表示了赞同。他认为,未来的GPU将很有可能发展成Co-Processor(协处理器)的形态,会有越来越多的功能,尤其是多媒体方面的功能加入。未来消费者购买独立型高性能显卡进行升级的理由将不再仅仅是为了游戏,GPU将为他们提供更多、更吸引人的功能,协助处理器进一步改善用户的体验。
● 技术研发投入巨大,NVIDIA必须持之以恒
众所周知,处理器是一个技术和资金门槛都很高的产业。黄仁勋先生告诉我们,当图形芯片产业发展到GPU时代以后,其技术和资金门槛之高,与CPU相比其实也不遑多让。以NVIDIA为例,过去3年里用于研发的投入大约10亿美元,而在今后的2~3年里,NVIDIA还将投入20亿美元用于研发。
黄仁勋先生透露,NVIDIA目前正在同时操作4代产品:NV3x系列已经是成熟产品,占据了市场的主流;NV4x正在推广,逐渐渗透到市场;NV5x则已经接近完成,将在NV4x之后推出;而NV6x也已经开始研发。正是有了如此缜密完善的研发推广步骤,NVIDIA才得以在过去5年之内保持技术领先和市场优势,并始终掌握图形芯片领域的主导权。
● 明日复明日,在退休前做好所有工作
专访的最后,媒体谈到了某加拿大图形芯片公司创始人最近宣布将辞去CEO职务,专职市场开拓和客户沟通,并表示“哪里业绩还不理想,他就会到哪里去,客户要见他,只要一通电话,他就会跳上飞机飞过去”。
对此黄仁勋的回答也非常犀利:“我不会等到退休之后再去对客户做出回应,现在只要客户有任何需求,我会在一秒钟之内赶到。”<