ccidnet????

出版日期:2000-01-10 总期号:891 本年期号:03

本期导读
要闻综合
电脑工作室
市场
硬件
软件
infotimes
gpu出击
从丽台nvidia geforce 256看第五代3d显卡新功能
王炳晨

  3d世界新事不断,继s3率先发布了第五代3d显示芯片savage2000后,nvidia紧接着发布了geforce 256。这不但标志着pc领域最新一代的3d大战的爆发,更宣布了一个崭新的3d时代——gpu(graphics processing unit)时代的到来,它使我们pc用户首次有机会感受到图形工作站的3d效果。今天我们就借丽台geforce 256来向大家全面的展示一下它的风采,一起来体验geforce256的超强性能。


  概 况


  可能是为了尽早面市,丽台geforce 256采用了nvidia提供的公版设计,从选料到做工都很出色。比其前辈s320Ⅱ(tnt2)系列要好了很多,由于此卡全部采用贴片式器件,外观显得整齐、干净,的确体现了大家风范(只是布局并不十分紧凑,可能是由于公版设计的原因吧!)。板载的32mb显存选用的是etrontech 5ns的sdram显存,理论上可以工作在200mhz的频率下(如同高档的tnt2 ultra),但其实际工作频率只有166mhz,这就为广大超频爱好者留下了不小的“幻想”空间。

  目前市场上的geforce256基本都配以sdr sdram,这主要是出于成本的考虑,当然丽台和其它一些geforce256厂商在近期也先后发布了ddr版的产品,性能要高出不少,价格自然也不会平庸,所以从性能价格比来说,sdr版本也许才是目前一般diy的最佳选择。丽台geforce256的核心频率为120mhz,完全遵守nvidia的规定,这里也还有油水可捞。我们得到的这款丽台geforce 256不但提供了常见的tv-out视频输出接口,还提供了dvi数字视频接口,以支持未来的数字平板显示器。当然丽台也有不带视频的版本供大家选择。


  在驱动方面,丽台重新修订了公版驱动,并为其提供了丽台惯用的驱动控制界面,安装、设置十分简单。特别是内建的“speed runner”超频工具,可以线性调节核心和显存的工作频率,非常便于超频。


  测试平台的选择


  针对geforce 256内建了“t&l”的特点,我们为它选择了目前比较有代表性的3个测试平台,以便能在主频基本相同(整型能力基本一致),浮点能力差别较大的情况下,体现这块gpu的优势所在。

  1. pentiumⅢ 500(主流配置)+intel se-bx2。

  2. athlon 500 (浮点性能突出)+ giga 7ix。

  3. amd k6-Ⅲ 475(105×4.5 浮点性能较差)+ asus p5a。

  这里特别要指出,由于现在支持4×agp的主板还没有成为主流,更是因为我们无法在3个所选平台上同时找到能支持4×agp的主板(主要是k6平台,目前还没有芯片组厂商表示会为其提供4×agp的支持),为了便于对比,我们决定在2×agp下进行所有的测试。不过,这将使我们的测试不能表现出4×agp快写模式的优势,特请读者注意。

  其它相同配置为:128mb kingmax pc133内存、ibm 13.5gb(7200rpm)硬盘、三菱 rdf22x显示器。对比显卡我们选择的是帝盟 viper 770 ultra(tnt2 ultra),bios:2.05.01、驱动:detonator 3.53,以及3d lab的入门级专业显卡oxygen vx1(无glint处理器),bios:2.12、驱动:0684r。测试对象丽台geforce 256的bios为:10.01.1999。软件平台我们选用的是英文windows98se(2222a)+dx7。显卡驱动我们选用的是nvidia最新的公版雷管驱动:detonator 3.53,但由于此驱动在athlon平台上不能稳定工作,所以我们在此平台上使用了nvidia专为athlon提供的雷管3.62,并加载了amd 750芯片组的445版agp补丁(注意:不加补丁性能会降低约30%)。此外,由于tnt2和我们测试用的asus p5a主板存在兼容问题,不能通过某些测试(特别是d3d测试),因而我们没能得到viper 770 u在k6-Ⅲ平台上的全部成绩,请读者谅解。


  d3d测试工具


  考虑到geforce 256显卡全面的3d性能,我们在测试工具的选择方面下了一番功夫。首先我们选择了常用的zd权威测试工具winbench99(1.1)和针对dx7而设计的3d winbench 2000(1.0)以及流行的d3d测试工具3dmark99 max,对此卡做基准d3d测试。这里由于文章篇幅所限,我们仅将有代表性的几项测试结果整理如下(见表1)。

  在此测试中,我们看到丽台geforce 256的2d性能与tnt2 ultra相差不多,最大不过7%(k7平台上)。排除驱动程序等客观因素,它们基本处于同一水平,不过2d技术发展到今天这个地步,我们对它也没什么更高的要求了。

  如前所述,由于这里没有利用到geforce 256的agp快写特性,可能会限制geforce 256的表现。而k6-Ⅲ在cpu mark和反映2d性能的business graphic mark上,都有上佳的表现,主要是由于我们在k6-Ⅲ 475中使用了105mhz的外频,高于其它平台标准的100mhz。3d winbench 2000测试的结果最能反映geforce 256真实的3d性能,在这项测试中,丽台geforce 256的确比tnt2 ultra高出了三成以上,即便是在浮点性能相对较弱的k6-Ⅲ 475上,丽台geforce 256的3d成绩仍然要高出tnt2 ultra(k7平台)30%以上。

  在基于dx7的69项图像质量测试中,geforce 256的表现也非常突出,仅有凹凸贴图和两项抗锯齿功能不支持,比tnt2的4错/8不支持好了很多。而且其中抗锯齿功能在2.08以前的公版驱动中原本是可以打开的,但由于这对3d速度的影响过大,没有实用意义,因而nvidia在之后的驱动中去掉了它。看来只有等到明年voodoo 5出台以后,我们才有机会见到全屏抗锯齿的风采了。3dmark99 max的测试结果显示,在高分辨率下geforce 256的得分明显高于tnt2 ultra,尤其是在1600×1200×32位色、24位z-buffer下,geforce 256甚至比tnt2 ultra高了一倍还多,可见它强劲的d3d性能,这可还没用到t&l呢!3dmark 2000 pro是一套真正基于dx7的测试工具,但由于驱动的问题,geforce 256在其中出现明显的错误,使得我们无法得到正确的测试结果,十分遗憾!


  游戏性能


  作为主流市场,3d游戏是不可缺少的,但由于目前基于dx7开发的游戏还没有正式面市,因而我们没能找到一个适当的d3d游戏对丽台geforce 256进行测试。虽然nvidia专为geforce 256设计的几个demo能够很好地体现出它的各项特效,而且其逼真的效果,尤其是tree(偷偷告诉你个秘密,通过快捷键它能变成栩栩如生“摇钱树”呦!)的动态光照,bubble(水泡)的立方体环境映射,烟花爆破(particle)的粒子系统演示,的确令人叹为观止。但这种经特殊优化的demo对实际应用的意义很有限,因为短期内我们还很难见到能真正把这些特效完全发挥出来的游戏,毕竟游戏厂商不会将自己的产品限制在geforce 256上,和bump mapping一样,所以我们没有拿它们作为测试项目。为了能检验geforce 256在现有游戏中的表现,我们选择了经典d3d测试游戏turok Ⅱ和expendable(lite)。opengl游戏自然是选择最新的quake Ⅲ test(demo1.08),为了便于读者和以前的数据对比,我们也将提供quake Ⅱ(3.20)的成绩。在本次测试即将结束的时候,我们得到了quake Ⅲ最新的demo 1.09,它多边形的复杂程度明显提高,特别适合3d测试,所以我们也将其主要测试结果列出(见表2)。

  在此测试中,我们可以清楚地看到,随着分辨率的提高,丽台geforce 256在3个不同平台上的表现逐渐接近,尤其是当分辨率超过800×600以后,3个平台测试结果的差距明显缩小。这主要是因为在低分辨率下,显示卡的像素填充率和多边形生成率都还远没有得到充分的利用,瓶颈在cpu的浮点运算能力上,所以会得到这样的结果。而超过了1024×768以上的分辨率,会逐渐发挥出显卡的3d能力,并逐步接近其极限能力。

  在quakeⅢ test中,从1024×768 高品质模式开始,tnt2 ultra在3个平台的表现就已经十分接近了,说明这时已经接近tnt2的性能极限;而对于geforce 256,直到我们所能测试到的最高分辨率1600×1200,测试结果仍然有约10%的差距,表明geforce 256此时仍有一定的潜力。比较有意思的是,k6-Ⅲ平台上,geforce 256在高分辨率下的表现反而要略高于k7和pⅢ,这可能和我们在winbench 99中发现的k6-Ⅲ cpu mark(整型)突出有关,因为quakeⅢ测试的主要是多边形处理能力,而这正与cpu的整型能力有关。d3d游戏测试也得到了类似的结果,但geforce 256的优势就更加微弱了,这再次显示了在真正支持t&l的游戏出现之前,geforce 256的威力只有在1024×768以上的高分辨率下才能得以显示。


  专业性能


  专业测试对全面展示geforce 256的实力也是非常重要的,为此我们还特意选取了专业测试工具indy 3d 3.0(支持3d now!和sse)、tirtanium 1.7以及spec的基准测试工具specviewperf (6.1.1)和specglperf (3.1.2)。这里我们仅简单将其结果列于表3中。其中k7平台下,我们无法完成对geforce 256的indy 3d 3.0中多边形生成率的测试,且该软件在此时对像素填充率的测试也出现了明显的错误,问题应该是出在驱动程序或是测试软件方面。从此测试结果中我们可以看出,像素填充率基本不受cpu的影响,而多边形生成率和经多次过滤处理后的像素填充率则和cpu浮点能力关系密切,在k6-Ⅲ上的结果只有其它两个平台上的1/3左右,即便是geforce 256也是一样。这证明在像素渲染和多边形生成引擎方面,geforce 256并没有什么本质的改变,只是将管线数量扩充至原来的2倍。

  总的说来,geforce 256在专业领域性能的提高是相当显著的,多数测试成绩都比tnt2 ultra有了成倍的增长,有些成绩甚至超过了用来作对比的入门级专业显卡vx1的成绩,表明geforce 256已经完全具备进军专业市场的实力了。当然,这个成绩跟opengl对t&l长久以来良好的支持也分不开。nvidia前不久又发布了一款专为专业opengl应用而进行了优化的geforce 256gl(quadro)3d芯片(可惜只供应elsa),以主攻专业市场,看来nvidia这回是要动真格的了!


  超 频


  前面我们对丽台geforce 256的超频能力进行了一些理论分析,它实际的超频能力又如何呢?由于geforce 256本身的复杂程度,我们建议不要对它的超频性能抱有过高的期望。在我们的测试中,其核心频率最高可以从默认的120mhz提升到130mhz,显存从166 mhz升到195mhz。在pⅢ 500平台下其 quakeⅢ 1.09和用specviewperf测得的像素填充率的成绩如表4所示。其中仍然是在高分辨率下,性能提升明显,最大甚至有30%之多。


  小 结


  在3d速度和3d特效方面,geforce256的确有了较大幅度的改进,这远比tnt2和tnt之间的差距要大得多。但由于目前所用的测试工具(尤其是d3d测试游戏)大都还不能很好地支持geforce256众多的新特性,因而我们只能在高分辨率下看到一些性能的提高。在3d画质方面,geforce256同样也受到目前软件的限制,从而没能表现出明显的优势,相信这些随着新一代3d游戏,特别是基于dx7游戏的逐渐上市而得到改变。另外,从兼容性方面来看丽台geforce256做得也非常好,除在k7平台上需要特殊的驱动以外,它可以很顺利地安装在我们测试的所有平台上,这也是其前任tnt2所无法比拟的。

  通过对丽台geforce256的完全测试,我们不但对nvidia 的geforce256有了较为全面的了解,更借此窥视到了新一代3d显卡的发展趋势。拥有了强劲的geforce256核心,再结合丽台多年专业图形加速卡的研发实力,我们测试的这款丽台geforce256的确可以算是动力十足。无论是d3d还是opengl都表现得非常出色,对hdtv和dvd的支持,更是符合今后多媒体视频应用的要求,这将使它成为集娱乐和专业3d制图于一身的新一代高性能3d显卡的代表。

表1 基准d3d测试结果

 

pⅢ 500

k7 500

k6Ⅲ 475

dm 770u

geforce 256

dm 770u

geforce 256

dm 770u

geforce 256

1. zd测试程序

winbench 99 (1.1) 1024×768×16位色

cpu mark 99

38.2

38.2

46.7

46.7

49.1

49.1

fpu mark 99

2510

2510

2710

2710

1570

1570

business graphic mark

189

198

214

230

217

215

2. zd测试程序

3d winbench 99 (1.2) 1024×768×16位色 16位z-buffer(基于dx6)

3d winmark

1020

1190

1060

1170

1040

t. & .l

67.7

67.3

69.8

70.1

51.1

3. zd测试程序

3d winbench 2000 (1.0) 1024×768×32位色 32位depth buffer(基于dx7)

3d mark (frame/s)

37.9

51.7

37.8

51.9

49.7


表2  游戏性能测试结果

        测试环境

测试项目

pⅢ 500+intel se-bx2

k7 500(ide124+agp445)
+giga ga-7ix(1.0)

k6Ⅲ 475 p5a(1007)

dm 770u (tnt2u)

lt geforce 256

dm 770u
(tnt2u)

geforce 256

dm 770u
(tnt2u)

geforce 256

测试程序

qⅢ test 1.08

640×480×high

64.1

81.7

70.6

84.3

46.3

52.8

800×600×high

50.5

68.5

51.2

71.5

44.6

50.2

1024×768×high

35.1

44.4

35.5

46.0

35.8

42.4

1280×960×high

21.6

26.0

21.0

25.8

22.4

26.9

1600×1200×high

14.0

16.5

13.9

18.3

 

qⅢ test 1.09

640×480×high

49.9

68.8

57.2

69.6

47.2

1280×1024×high

20.0

24.7

19.3

23.3

24.3

测试程序

qⅡ 3.20

640×480

demo1

105.28

138.2

120.2

161.4

76.8

96.7

crusher

49.7

60.5

60.4

76.3

40.3

49.0

1280×960

demo1

47.8

83.6

47.8

81.9

47.0

79.6

crusher

38.6

58.5

40.6

64.2

35.2

48.7

1600×1200

demo1

29.6

54.3

29.7

54.8

crusher

25.9

45.4

25.9

45.3

测试程序

expendable(lite)

640×480×16bit

40.00

40.00

71.43

71.43

52.63

50

640×480×32bit

40.00

40.00

71.48

71.43

52.63

50

1024×768×16bit

37.00

38.46

52.63

71.43

50.00

47.62

1024×768×32bit

32.26

37.04

37.04

62.50

40.00

47.62

1280×1024×16bit

30.30

38.46

34.48

66.67

47.62

1280×1024×32bit

20.83

37.04

22.73

38.46

34.48

1600×1200×16bit

20.83

32.26

23.81

55.56

1600×1200×32bit

14.08

18.18

15.63

26.32

测试程序

turokⅡ

800×600×16bit

55.5

54.8

58.2

61.5

44.5

1280×1024×16bit

53.8

55.1

54.7

59.4

45.8

1280×1024×32bit

39.2

42.7

36.4

44.3

40.8


表3 专业性能测试结果

 

pⅢ 500

k7 500

k6Ⅲ 475

dm 770u

geforce 256

vx1

dm 770u

geforce 256

dm 770u

geforce 256

专业测试程序

indy 3d 3.0 (with 3dnow!. &. sse)

mcad 150(frame/s)

3.24

12.23

3.12

3.84

12.15

1.88

5.75

animation (frame/s)

11.38

35.98

13.24

13.08

37.46

7.21

21.66

fill rate(mpixels/s)

255.49

348.07

100.83

251.36

282.81

252.14

348.07

polygon rate (polygon/s)

737034.31

4376325.50

63795.50

936258.31

449373.16

1720481.50

专业测试程序

specviewperf 6.1.1

awadvs_03

11.28

64.97

17.94

12.78

64.58

6.054

24.19

drv-06

7.738

20.59

6.309

8.502

22.16

4.333

9.974

dx-05

12.47

26.42

12.18

13.40

31.74

6.285

13.57

light-03

1.368

2.902

1.511

1.573

3.139

0.8547

1.18

procdrs-02

12.49

9.770

7.834

13.16

11.44

5.931

3.499

专业测试程序

specglperf 3.1.2

fill rate (mpixels/s)

296000000

438000000

411000000

296000000

438000000

296000000

438000000

trifill rate (mpixels/s)

2810000

12900000

18700000

3070000

13100000

1430000

3260000


表4 超频性能测试结果

超频测试   q Ⅲ test 1.09(p3 500—geforce256)

核心/显存 频率

120/166

125/175

130/175

130/195

640×480×high

68.8

68.4

67.9

68.8

1280×1024×high

24.7

26.3

26.9

29.4

1600×1200×high

14.7

17.1

17.3

19.4

专业测试程序

specglperf 3.1.2

fill rate (mpixels/s)

296000000

455000000

474000000

474000000