
| 出版日期:2000-01-10 总期号:891 本年期号:03 |
|
gpu出击
从丽台nvidia geforce 256看第五代3d显卡新功能 王炳晨 3d世界新事不断,继s3率先发布了第五代3d显示芯片savage2000后,nvidia紧接着发布了geforce 256。这不但标志着pc领域最新一代的3d大战的爆发,更宣布了一个崭新的3d时代——gpu(graphics processing unit)时代的到来,它使我们pc用户首次有机会感受到图形工作站的3d效果。今天我们就借丽台geforce 256来向大家全面的展示一下它的风采,一起来体验geforce256的超强性能。 概 况 可能是为了尽早面市,丽台geforce 256采用了nvidia提供的公版设计,从选料到做工都很出色。比其前辈s320Ⅱ(tnt2)系列要好了很多,由于此卡全部采用贴片式器件,外观显得整齐、干净,的确体现了大家风范(只是布局并不十分紧凑,可能是由于公版设计的原因吧!)。板载的32mb显存选用的是etrontech 5ns的sdram显存,理论上可以工作在200mhz的频率下(如同高档的tnt2 ultra),但其实际工作频率只有166mhz,这就为广大超频爱好者留下了不小的“幻想”空间。 目前市场上的geforce256基本都配以sdr sdram,这主要是出于成本的考虑,当然丽台和其它一些geforce256厂商在近期也先后发布了ddr版的产品,性能要高出不少,价格自然也不会平庸,所以从性能价格比来说,sdr版本也许才是目前一般diy的最佳选择。丽台geforce256的核心频率为120mhz,完全遵守nvidia的规定,这里也还有油水可捞。我们得到的这款丽台geforce 256不但提供了常见的tv-out视频输出接口,还提供了dvi数字视频接口,以支持未来的数字平板显示器。当然丽台也有不带视频的版本供大家选择。
在驱动方面,丽台重新修订了公版驱动,并为其提供了丽台惯用的驱动控制界面,安装、设置十分简单。特别是内建的“speed runner”超频工具,可以线性调节核心和显存的工作频率,非常便于超频。 测试平台的选择 针对geforce 256内建了“t&l”的特点,我们为它选择了目前比较有代表性的3个测试平台,以便能在主频基本相同(整型能力基本一致),浮点能力差别较大的情况下,体现这块gpu的优势所在。 1. pentiumⅢ 500(主流配置)+intel se-bx2。 2. athlon 500 (浮点性能突出)+ giga 7ix。 3. amd k6-Ⅲ 475(105×4.5 浮点性能较差)+ asus p5a。 这里特别要指出,由于现在支持4×agp的主板还没有成为主流,更是因为我们无法在3个所选平台上同时找到能支持4×agp的主板(主要是k6平台,目前还没有芯片组厂商表示会为其提供4×agp的支持),为了便于对比,我们决定在2×agp下进行所有的测试。不过,这将使我们的测试不能表现出4×agp快写模式的优势,特请读者注意。 其它相同配置为:128mb kingmax pc133内存、ibm 13.5gb(7200rpm)硬盘、三菱 rdf22x显示器。对比显卡我们选择的是帝盟 viper 770 ultra(tnt2 ultra),bios:2.05.01、驱动:detonator 3.53,以及3d lab的入门级专业显卡oxygen vx1(无glint处理器),bios:2.12、驱动:0684r。测试对象丽台geforce 256的bios为:10.01.1999。软件平台我们选用的是英文windows98se(2222a)+dx7。显卡驱动我们选用的是nvidia最新的公版雷管驱动:detonator 3.53,但由于此驱动在athlon平台上不能稳定工作,所以我们在此平台上使用了nvidia专为athlon提供的雷管3.62,并加载了amd 750芯片组的445版agp补丁(注意:不加补丁性能会降低约30%)。此外,由于tnt2和我们测试用的asus p5a主板存在兼容问题,不能通过某些测试(特别是d3d测试),因而我们没能得到viper 770 u在k6-Ⅲ平台上的全部成绩,请读者谅解。 d3d测试工具 考虑到geforce 256显卡全面的3d性能,我们在测试工具的选择方面下了一番功夫。首先我们选择了常用的zd权威测试工具winbench99(1.1)和针对dx7而设计的3d winbench 2000(1.0)以及流行的d3d测试工具3dmark99 max,对此卡做基准d3d测试。这里由于文章篇幅所限,我们仅将有代表性的几项测试结果整理如下(见表1)。 在此测试中,我们看到丽台geforce 256的2d性能与tnt2 ultra相差不多,最大不过7%(k7平台上)。排除驱动程序等客观因素,它们基本处于同一水平,不过2d技术发展到今天这个地步,我们对它也没什么更高的要求了。 如前所述,由于这里没有利用到geforce 256的agp快写特性,可能会限制geforce 256的表现。而k6-Ⅲ在cpu mark和反映2d性能的business graphic mark上,都有上佳的表现,主要是由于我们在k6-Ⅲ 475中使用了105mhz的外频,高于其它平台标准的100mhz。3d winbench 2000测试的结果最能反映geforce 256真实的3d性能,在这项测试中,丽台geforce 256的确比tnt2 ultra高出了三成以上,即便是在浮点性能相对较弱的k6-Ⅲ 475上,丽台geforce 256的3d成绩仍然要高出tnt2 ultra(k7平台)30%以上。 在基于dx7的69项图像质量测试中,geforce 256的表现也非常突出,仅有凹凸贴图和两项抗锯齿功能不支持,比tnt2的4错/8不支持好了很多。而且其中抗锯齿功能在2.08以前的公版驱动中原本是可以打开的,但由于这对3d速度的影响过大,没有实用意义,因而nvidia在之后的驱动中去掉了它。看来只有等到明年voodoo 5出台以后,我们才有机会见到全屏抗锯齿的风采了。3dmark99 max的测试结果显示,在高分辨率下geforce 256的得分明显高于tnt2 ultra,尤其是在1600×1200×32位色、24位z-buffer下,geforce 256甚至比tnt2 ultra高了一倍还多,可见它强劲的d3d性能,这可还没用到t&l呢!3dmark 2000 pro是一套真正基于dx7的测试工具,但由于驱动的问题,geforce 256在其中出现明显的错误,使得我们无法得到正确的测试结果,十分遗憾! 游戏性能 作为主流市场,3d游戏是不可缺少的,但由于目前基于dx7开发的游戏还没有正式面市,因而我们没能找到一个适当的d3d游戏对丽台geforce 256进行测试。虽然nvidia专为geforce 256设计的几个demo能够很好地体现出它的各项特效,而且其逼真的效果,尤其是tree(偷偷告诉你个秘密,通过快捷键它能变成栩栩如生“摇钱树”呦!)的动态光照,bubble(水泡)的立方体环境映射,烟花爆破(particle)的粒子系统演示,的确令人叹为观止。但这种经特殊优化的demo对实际应用的意义很有限,因为短期内我们还很难见到能真正把这些特效完全发挥出来的游戏,毕竟游戏厂商不会将自己的产品限制在geforce 256上,和bump mapping一样,所以我们没有拿它们作为测试项目。为了能检验geforce 256在现有游戏中的表现,我们选择了经典d3d测试游戏turok Ⅱ和expendable(lite)。opengl游戏自然是选择最新的quake Ⅲ test(demo1.08),为了便于读者和以前的数据对比,我们也将提供quake Ⅱ(3.20)的成绩。在本次测试即将结束的时候,我们得到了quake Ⅲ最新的demo 1.09,它多边形的复杂程度明显提高,特别适合3d测试,所以我们也将其主要测试结果列出(见表2)。 在此测试中,我们可以清楚地看到,随着分辨率的提高,丽台geforce 256在3个不同平台上的表现逐渐接近,尤其是当分辨率超过800×600以后,3个平台测试结果的差距明显缩小。这主要是因为在低分辨率下,显示卡的像素填充率和多边形生成率都还远没有得到充分的利用,瓶颈在cpu的浮点运算能力上,所以会得到这样的结果。而超过了1024×768以上的分辨率,会逐渐发挥出显卡的3d能力,并逐步接近其极限能力。 在quakeⅢ test中,从1024×768 高品质模式开始,tnt2 ultra在3个平台的表现就已经十分接近了,说明这时已经接近tnt2的性能极限;而对于geforce 256,直到我们所能测试到的最高分辨率1600×1200,测试结果仍然有约10%的差距,表明geforce 256此时仍有一定的潜力。比较有意思的是,k6-Ⅲ平台上,geforce 256在高分辨率下的表现反而要略高于k7和pⅢ,这可能和我们在winbench 99中发现的k6-Ⅲ cpu mark(整型)突出有关,因为quakeⅢ测试的主要是多边形处理能力,而这正与cpu的整型能力有关。d3d游戏测试也得到了类似的结果,但geforce 256的优势就更加微弱了,这再次显示了在真正支持t&l的游戏出现之前,geforce 256的威力只有在1024×768以上的高分辨率下才能得以显示。 专业性能 专业测试对全面展示geforce 256的实力也是非常重要的,为此我们还特意选取了专业测试工具indy 3d 3.0(支持3d now!和sse)、tirtanium 1.7以及spec的基准测试工具specviewperf (6.1.1)和specglperf (3.1.2)。这里我们仅简单将其结果列于表3中。其中k7平台下,我们无法完成对geforce 256的indy 3d 3.0中多边形生成率的测试,且该软件在此时对像素填充率的测试也出现了明显的错误,问题应该是出在驱动程序或是测试软件方面。从此测试结果中我们可以看出,像素填充率基本不受cpu的影响,而多边形生成率和经多次过滤处理后的像素填充率则和cpu浮点能力关系密切,在k6-Ⅲ上的结果只有其它两个平台上的1/3左右,即便是geforce 256也是一样。这证明在像素渲染和多边形生成引擎方面,geforce 256并没有什么本质的改变,只是将管线数量扩充至原来的2倍。 总的说来,geforce 256在专业领域性能的提高是相当显著的,多数测试成绩都比tnt2 ultra有了成倍的增长,有些成绩甚至超过了用来作对比的入门级专业显卡vx1的成绩,表明geforce 256已经完全具备进军专业市场的实力了。当然,这个成绩跟opengl对t&l长久以来良好的支持也分不开。nvidia前不久又发布了一款专为专业opengl应用而进行了优化的geforce 256gl(quadro)3d芯片(可惜只供应elsa),以主攻专业市场,看来nvidia这回是要动真格的了! 超 频 前面我们对丽台geforce 256的超频能力进行了一些理论分析,它实际的超频能力又如何呢?由于geforce 256本身的复杂程度,我们建议不要对它的超频性能抱有过高的期望。在我们的测试中,其核心频率最高可以从默认的120mhz提升到130mhz,显存从166 mhz升到195mhz。在pⅢ 500平台下其 quakeⅢ 1.09和用specviewperf测得的像素填充率的成绩如表4所示。其中仍然是在高分辨率下,性能提升明显,最大甚至有30%之多。 小 结 在3d速度和3d特效方面,geforce256的确有了较大幅度的改进,这远比tnt2和tnt之间的差距要大得多。但由于目前所用的测试工具(尤其是d3d测试游戏)大都还不能很好地支持geforce256众多的新特性,因而我们只能在高分辨率下看到一些性能的提高。在3d画质方面,geforce256同样也受到目前软件的限制,从而没能表现出明显的优势,相信这些随着新一代3d游戏,特别是基于dx7游戏的逐渐上市而得到改变。另外,从兼容性方面来看丽台geforce256做得也非常好,除在k7平台上需要特殊的驱动以外,它可以很顺利地安装在我们测试的所有平台上,这也是其前任tnt2所无法比拟的。 通过对丽台geforce256的完全测试,我们不但对nvidia 的geforce256有了较为全面的了解,更借此窥视到了新一代3d显卡的发展趋势。拥有了强劲的geforce256核心,再结合丽台多年专业图形加速卡的研发实力,我们测试的这款丽台geforce256的确可以算是动力十足。无论是d3d还是opengl都表现得非常出色,对hdtv和dvd的支持,更是符合今后多媒体视频应用的要求,这将使它成为集娱乐和专业3d制图于一身的新一代高性能3d显卡的代表。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||