泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

原生与桥接PCIE芯片技术深入分析解析

    我们发现,在实际应用中原生方案并没有表现出过人的优势,性能上与采用HSI的桥接方案相当,并没有出现理论测试中那种成绩上的飞跃,也没有体现出PCI-Express的设计特点。这又是为什么呢?

    首先,在实际应用中有效的可利用的PCI-Express的带宽比理论带宽重要的多。PCI-Express的有效带宽计算公式如下:有效数据带宽 = 总线带宽 ×[请求大小/(请求大小+附加信息包详细程度)]× 效率。

    由于显卡具备输出端的工作特点,GPU在实际操作过程中的数据传输往往倾斜于上行,也就是从总线向GPU内部传输数据,这就使得PCI-Express×16巨大的下行数据传输能力在大多数时间成为了摆设。

    由于桥接+现有芯片的方案提供了4GB左右的数据传输能力,相对而言已经能够达到PCI-Express上行数据的传输能力,这就使得NVIDIA的产品在实际应用中并不会受到比ATI更多的来自数据传输的限制。

    其次,NVIDIA的GPU支持最大单次64byte的数据请求包,并能为这个请求附加20byte左右的附加信息包,更大的数据传输包以及附加信息包可以保证尽可能大的数据请求以及对更加完整的对请求的附加描述。

原生与桥接PCI-E芯片深入分析(好)

    尽管附加描述包的出现会占用一定的带宽,但是对于较大量的单次数据传输而言,详尽的请求附加描述可以保证尽可能正确有效的内容发送,其结果就是相应的应请求发送的单次数据完整适应度的增加。

    这种设计保证了数据传输通道可以被高效率的利用,使得HSI方案所提供的数据带宽能够被完全利用。相对的,ATI的GPU所支持的数据请求包的大小仅为32byte,这大大限制了ATI的GPU利用数据传输通道的能力。据称,ATI的GPU对于PCI-Express带宽的有效利用律仅仅达到了65%,即2.5GB/S。

    最后,由于在设计的时候充分考虑到了多余互连层带来得潜伏期的问题,NVIDIA的HSI芯片的设计潜伏期大大低于芯片组和PCI-Express的潜伏期。更高的响应速度可以使HSI先于芯片组和总线做出反应,不会影响到数据传输的过程。因此NVIDIA的产品中并没有出现明显的ATI所预言的添加互连层带来的数据传输周期延迟问题。

0人已赞

关注我们

泡泡网

手机扫码关注