首页 | 旧版 |中国计算机报 |中国电子报 |通信产业报 |计算机用户 |电脑教育报 |软件世界 |数字时代
高级检索
中计报首页 | 要      闻 | 中国信息化 | 网络与通信
技术与产品 | 导购与市场 | 地方专刊 | 周三刊(i周刊)
第12期 总第1683期
浏览往期
当前位置:首页>>赛迪媒体>中国计算机报>技术与产品
       
4-way巨兽现身
——NVIDIA Quad SLI性能揭秘
作者:郭际 

谈到多GPU并行系统,3Dfx算是第一个吃螃蟹的厂商。但3Dfx在被NVIDIA收购后,多GPU并行系统被NVIDIA优化后再次推出。SLI系统凭借着出众的性能在市场上受到了发烧友的追捧,NVIDIA又趁热打铁推出了Quad SLI。遗憾的是,Quad SLI因为驱动程序的不完善,逐渐被发烧友们所遗忘,直到GeForce 9800GX2的推出。

传统的双PCB双核

在设计上,GeForce 9800GX2延续了GeForce 7950GX2的设计,将两块PCB结合在一起,每块PCB上封装了一颗G92-450图形显示核心和独享的256bit 512MB GDDR3显存,两颗GPU的频率均为600MHz,shader频率1500MHz,显存频率2000MHz。和7950GX2不同的是,9800GX2的散热系统有所改进,两颗GPU共用一个夹在中间的散热器。GeForce 9800GX2采用了一颗型号为BR04的桥接芯片,提供了48条PCI Express Lanes。其中,BR04-300分别为两颗G92提供了16条PCIE 2.0 Lanes,剩余的16条PCIE 2.0通道将和主板上的PCIE 2.0接口进行数据交换。当然,两颗GPU之间不仅仅通过BR04-300芯片进行数据交换,GeForce 9800GX2还从内部将两颗GPU通过金手指连在一起,组成内部SLI系统。

由于使用了两颗G92图形显示核心,GeForce 9800GX2在供电部分进行了特别加强。NVIDIA首次在显卡上应用了8pin的外接电源接口,和6pin的电源接口相比,8pin外接电源口最大能够提供150W的负载。加上6pin的75W负载,GeForce 9800GX2的功耗可想而知。在NVIDIA官方提供的资料中,9800GX2的设计功耗为197W。

仅保留AFR模式

在GeForce 7950GX2推出时,NVIDIA为Quad SLI定义了两种渲染模式,分别为SFR和AFR。SFR模式就是将若干块显卡划分主从卡,渲染时将画面一分为二,主卡在进行渲染的同时,还要为从卡分配渲染任务,接收从卡的渲染结果并和自己的渲染结果组成完整画面。虽然SFR方式能够降低每一帧的渲染时间,但SFR模式涉及到驱动程序将如何为GPU分配工作任务,才能最大程度上利用GPU资源,这就为驱动程序的开发制造了难度,最终导致了GeForce 7950GX2在Windows Vista下的驱动难产,GeForce 7950GX2也退出了历史舞台。

在新一代的Quad SLI中,NVIDIA取消了SFR模式,只能使用AFR模式进行渲染——4颗GPU协同工作时,4颗GPU能够同时渲染4帧。相比于SFR模式,AFR模式的驱动程序开发难度相对较低,这也是新一代的Quad SLI只支持AFR的原因之一。

功耗的飞跃

不可否认,新一代的Quad SLI在性能上为用户带来了质的飞跃,但在功耗上的问题也越来越明显。GeForce 7950GX2组成Quad SLI后,只需要500W电源即可稳定工作。而GeForce 9800GX2组成的Quad SLI系统,官方提供的显卡功耗达到了400W——有趣的是,NVIDIA在官方PDF中对9800GX2 Quad SLI的电源建议中竟然没有标记任何一款800W以下的电源。

在对Quad SLI的测试中,我们吸取了CrossFire X测试烧毁电源的经验,直接安装了额定功率1200W的电源。测试成绩证明我们的选择是明智的,Quad SLI在满载时的平均功耗最高达到了582W,再一次刷新了显卡的功耗记录。

Quad SLI的应用价值更大

多GPU究竟有没有用?我们之前讨论过这个问题,但是针对Quad SLI的现状,我们认为其实际应用价值更大一些。首先,NVIDIA的“游戏之道”使更多的游戏针对Quad SLI图形渲染系统进行了优化,这也让发烧友们的投资得到了更多的回报;其次,Quad SLI在工作站中的应用也是令人期待的,4颗Quadro GPU的渲染能力,可以在短时间内制作出更加精美、细腻的画面;最后,NVIDIA目前正在推广高性能计算体系架构CUDA,4颗128个流处理器的G92组成的Quad SLI系统最多可以组成64组平行运算单元,其浮点运算能力远远超越了CPU。当CUDA进入桌面市场后,Quad SLI可能成为NVIDIA实现平台化的奠基石——两颗GPU进行CPU运算,两颗GPU进行图形渲染,NVIDIA使用已开发的PCI Express总线就能够完成平台化。

编辑点评:

在组成Quad SLI后,图形渲染系统的性能有了明显的提升。看来,只采用AFR渲染模式大大降低了驱动程序的开发难度,但问题是AFR无法缩短每帧本身的渲染速度,仅仅是视觉流畅度的改善,可能还会带来不必要的延迟——也许,取消SFR模式是实现Quad SLI必须有的牺牲吧。不知道NVIDIA何时才会在Quad SLI上应用Numa架构。

赛迪网JAVA专区,JAVA开发者乐园!
相关文章
· 显示实时信息的键盘(2008.04.03)
· 简洁实用的散热新兵(2008.04.03)
· 全面覆盖DVD格式(2008.04.03)
· 补丁管理实践的四个流程(2008.04.03)
· 数百万个补丁是怎么分发管理的(2008.04.03)
·特别专辑

专题:宏基总裁兰奇访华 欲成全球笔记本霸主全文
专题:微软宣布OOXML成ISO标准 中国投反对票全文


· 专题:留下陈彤赶走段永基 新浪吃下镇定剂?
· 专题:孙振耀重出山 挂帅"黑手机之父"联发科
· 专题:创业板十年酝酿终破茧 想说爱你不容易
· 专题:视频网站被叫停或警告 难逃悲情"命数"
· 专题:戴尔CEO访华 部署08年新战略叫板联想
· 专题:阿里巴巴筹措资金拟从雅虎回购股份
· 专题:谷歌施密特第4次访华 调整中国区策略
· 特别策划:3·15维权 谁的责任?
· 直播:微软2008企业应用平台与开发技术大会
· 专题:英特尔CEO对薄听证会 洗刷"垄断"恶名

·赛迪社区


·IT博客