ccidnet????

出版日期:2003-05-12 总期号:1214 本年期号:33

本期导读
要闻综合
中国信息化
网络与通信
软件与服务
产品与应用
渠道与市场
华东专刊
华南专刊
西北专刊
图形利器谁的“刀”更快?
四款NT图形工作站横向评测


  最近几年,基于IA架构的图形工作站获得了长足的发展。由于IT技术的发展迅速,IA架构的图形工作站在性能上得了大幅提高,再加上IA架构的图形工作站具有很好的通用性,因此受到越来越多用户的关注。本专题的主要目的在于帮助用户采购基于IA架构的NT图形工作站机器。通过对图形工作站的介绍及评测,可以使用户了解图形工作站的主流技术及主流产品,增加用户对图形工作站的了解。

  工作站主要用于计算机辅助设计、辅助计算等任务,由于具有一定的行业性和专业性,很多用户对其了解很少,为此我们有必要先回顾一下图形工作站的发展历程。


  NT图形工作站是发展方向


  工作站作为独立的产品种类出现是在20世纪80年代初期,当时的Apollo、Sun等公司推出了专门为工程设计、软件开发等专业应用而开发的工作站产品,这些基于各种RISC处理器以及各种版本的Unix操作系统的计算机系统,为工程技术人员提供了强大的运算处理及图形处理显示能力,可以胜任各种大型专业应用软件,极大促进了计算机在专业领域的应用。传统Unix/RISC工作站能够长期占领市场的原因是在计算速度、图形处理、系统I/O、操作系统等方面表现出的卓越性能。Unix/RISC工作站在当时的工作站市场具有不可动摇的地位。

  20世纪90年代中期,美国Intel公司开发出了性能出色的Pentium Pro高性能CPU及多CPU并行处理系统,其计算性能与之前的CPU相比取得了巨大的提高,同时Microsoft公司发布了以Windows NT为代表的高性能、稳定可靠的32位操作系统平台。同时,基于OpenGL工业标准的专业PC图形技术日趋成熟,以及包括网络、存储在内的各种先进技术在PC平台的成功应用。基于此,系统运行时所表现出的性能已经能够满足部分低端传统Unix/RISC工作站用户的需求,而且此平台在性价比上具有极大的优势,对用户具有很大的吸引力。就这样,IA架构的工作站诞生了,并迅速发展起来。我们把这些基于PC构架、在Windows NT操作系统上用于运行专业应用软件的高性能计算机被称为NT工作站。

  近年基于IA架构处理器的工作站产品成长迅速,特别是在专攻高端服务器/工作站领域的Intel 至强(至强)系列处理器发布之后,个人工作站更开始“侵入”传统的高端专业领域,应用于在高级金融分析、多媒体编辑制作以及三维动画设计等方面。随着计算机技术的发展与应用的提高,以及国内客户观念的逐步转变,NT图形工作站在国内的销量迅速提高,NT图形工作站逐步超越并取代Unix图形工作站将是大势所趋。


  与PC的差别


  很多用户认为NT图形工作站只是一台配置高档的PC,由于NT图形工作站有着特殊的应用方向,因此它和普通的PC有着很大的区别,不能同日而语。

  首先,NT图形工作站具有非常鲜明的市场定位,即机械设计(MDA)、数字内容创作(DCC)、电子工程分析(EDA)、金融分析(FA)和虚拟现实(VISUALIZE)等领域。因此,在计算机产品中,NT图形工作站是最典型的面向应用的计算机产品。其特点是硬件与软件(主要是专业图形图像软件)要具有优良的兼容性。普通PC由于不是针对这些应用而设计,在处理这些专业应用时总会力不从心。

  其次,与普通PC着重考虑成本不同,NT图形工作站在设计时首要考虑的是系统的高性能和高稳定性。而这种高性能和可靠性是靠以下两点来保证的:一是周密设计系统的整体架构。在图形工作站开发时,必须对图形技术、计算机硬件技术以及图形图像处理的专业应用等有深刻的把握。二是针对这些专业应用进行严密的兼容性测试,并进行相应的系统整合,专业的图形工作站往往会提供一些针对专业应用的增值工具。

  决定图形工作站性能和稳定性的最核心部分有4个,它们是:运算系统(包括CPU、主板控制芯片组和内存)、图形系统(包括显示器和图形加速卡)、存储系统(包括硬盘和硬盘控制器)、操作系统。

  运算系统 目前NT图形工作站采用的是单颗Pentium4、一颗或两颗至强中央处理器,使得它处理32位应用软件的能力大大加强,具有很高的数据处理能力。这样的计算能力是其进行大型处理任务的保证。而普通PC普遍采用一颗CPU,在作某些专业应用时处理能力明显不足。

  在工作站中采用2颗CPU时,主板要支持SMP。SMP(Symmetric Multi-Processing)对称多处理,指含有多个处理器的单一系统。系统所有的处理器(工作站通常采用的是双CPU)通过总线对内存、I/O设备等进行共享,并有同等的存取权力。在进行多任务处理时,使用双处理器将使系统性能得到较大提升。 同时工作站采用的主板对稳定性、扩展性、软件兼容性等方面要比PC要求严格得多。

  内存系统中,工作站采用的内存标准比普通PC内存严格得多,在大容量内存中采用Registered技术,内存工作更加稳定。同时工作站内存中采用ECC技术,ECC是 (Error Checking and Correcting)错误检查和纠正,它时刻检查数据传输的完整性。ECC不仅探测了每位内存的错误,而且可以纠正其错误。将ECC技术用于工作站中,大大提高了数据交换的正确率。

  图形系统 图形工作站的核心是图形系统。图形加速卡部分又是图形工作站的点睛之笔,简单来说,PC选用的显卡是针对Direct 3D加速的,而图形工作站的图形卡是针对OpenGL来加速的。OpenGL(Open Graphics Library开放图形库)是目前科学和工程视算领域无可争辩的图形技术标准。最初由SGI公司提出,在Win95、98及Windows NT、Windows 2000中均得到支持。OpenGL注重于快速绘制2D和3D图像用于CAD、仿真、科学应用可视化和照片级真实感的游戏视景中。它是一个开放的三维图形软件包,它独立于窗口系统和操作系统,能十分方便地在各平台间移植,它具有开放性、独立性和兼容性三大特点。

  在执行工业级应用程序时,设计人员绝对无法忍受任何不稳定、缺乏效率的绘图系统,在图像准确度与品质上也是毫不妥协。专业图形加速卡的特点恰恰不在于多边形产生速度或是像素填充率等指标上,而是在调整驱动程序以及提供绘图的精确性方面。

  存储系统 存储系统的能力是衡量机器性能好坏的重要指标,实际上计算机进行的多数处理中,存储系统的处理几乎是最耗时的了。存储能力差,直接表现为机器速度慢,性能也就无从谈起。

 

超微

ddell

方正

海信

处理器

类型

至强

至强

至强

至强

实际配置处理器的频率

2.4ghz

3.06ghz

3.06ghz

3.06ghz

实际配置个数

2

2

2

2

系统最大支持个数

2

2

2

2

内存

类型

ddr266

ddr266

ddr266

ddr266

实际配置容量

1gb

1gb

1gb

1gb

系统最大支持容量

4gb

4gb

4gb

4gb

硬盘

接口类型

ultra 320

ultra 320

ultra 160

ultra 320

单个硬盘容量

36gb

36gb

36gb

36gb

硬盘实际配置个数

2

2

1

1

最多支持个数

 

 

 

 

显卡

 

quadro
fx2000

ati fire
gl x1

nvidia quadro4
980xgl

quadro fx2000

芯片组

主板芯片组

e7505芯片组

e7505芯片组

e7505芯片组

e7505芯片组


  主流NT图形工作站采用先进的Ultra320 SCSI数据传输接口,使用转速高达15000rpm、大容量SCSI磁盘作为外部存储设备,使整机具有快速数据传输能力。系统数据吞吐能力十分强大,不论是进行一般三维建模还是进行大型装配,大量的数据都会在极短的时间内迅速可靠地调出。同时与IDE接口相比,SCSI接口提供了更强的扩充能力。

  操作系统 工作站采用Windows NT Workstation/Windows 2000 Professional/Windows XP Professional。这类操作系统都是开放的32位操作系统,性能稳定,网络支持能力好。在图形能力上,它支持Direct X和OpenGL。支持OpenGL使很多原来基于Unix、大量采用OpenGL编程的大型应用软件,可以很快很方便地移植到NT上来。

  此外,工作站相对PC来说还具有强大的网络通信能力、高可管理性、良好的可扩展性等优点,采用专用机箱并配备智能冷却系统和监控软件。


  产品测试


  这次参加图形工作站的厂商既有国外的著名厂商超微、DELL,也有来自国内的著名厂商海信和方正,可以说基本汇集了国内外主要的图形工作站厂商。为了向行业用户推荐采用最新技术的NT图形工作站并保证横向测试的可行性,这次送测的图形工作站要求基于IA架构,采用新至强处理器,内存容量不低于1GB,硬盘采用SCSI接口硬盘。这次测试统一采用了中文Windows 2000 Professiona+ServicePack3操作系统,在横向评测中,赛迪评测采用了业界公认的测试软件,从性能和应用的角度,对产品的整体性能和各个子系统的性能进行了测试。

  OpenGL测试

  赛迪评测使用最常用的OpenGL测试软件Viewperf7.1、Indy3D 3.0以及基于pro/E2001的测试,评估参测样品的OpenGL加速性能。

  SpecViewPerf 7.1

  SPECviewperf是用于测试OpenGL图形系统性能的基准测试程序,可以很好地反映图形工作站在不同类型的应用中的性能表现。最新发布的SPECviewperf 7.1具有6个子测试项目:DRV-09、DX-08、Light-06、proe-02、ugs-03和3dsmax-02。SPECviewperf的优点在于其本身就是实际运行的应用软件,如果该应用就是用户选择的应用,其测试结果就有很高的参考价值。图1列出了部分测试结果。


  图1

  其中,DRV-09项目对应Intergraph的设计浏览软件DesignReview,测试对象是一个英国石油公司石油平台的场景,带有数量非常繁多的管道、设备以及结构模型。模型的数据容量为50多兆字节,多边形数量是36万个;DX-08项目对应IBM的数据可视化软件Data Explorer,测试的对象是3个螺旋状粒子轨迹,模型规模为30万个顶点(对系统的负荷甚至比DRV-08更大);Light-06项目对应Discreet Logic的高级渲染软件Lightscape Visualization System;proe-02项目对应Pro/Engineer;3dsmax-02项目对应的是3dsMax;ugs-03项目对应Unigraphics。

  Indy 3D

  Sense8公司的Indy3D是一个著名的专业OpenGL测试程序,主要用于测试系统在MCAD(机械CAD)、动画创作、3D仿真等方面的性能和图形质量。在性能测试项目中,有2项MCAD测试,分别是MCAD40和MCAD150。它们采用的模型都是一个剖开机壳的四缸发动机模型,但这个模型的精细程度不同,MCAD40的模型有4万个多边形,MCAD150中有15万个多边形; 在动画测试中,场景是一个人走在一条荒凉的街道上; 而仿真测试中则是一条小帆船在海湾中航行。测试结果见图2。


  图2

  基于pro/E的测试

  该项测试的软件平台使用Pro/E 2001版,测试软件由Spec提供,两者共占据超过500MB硬盘空间。图3、图4给出了最后的测试结果和测试所用时间。


  图3


  图4

  应用测试

  这项测试利用 Photoshop V7.01编辑定义动作来进行测试,测试中选用phtoshop 7.01对190MB大小的JPEG图像文件进行了模糊、渲染、锐化、图形模式转换等操作,以测量花费的时间作为评测基准点,数值对应的单位为秒,数值越小则表示性能越高,测试结果取三次测试时间的平均值,见图5。


  图5

  磁盘性能测试

  赛迪评测采用WinBench99测试磁盘子系统的性能。测试的内容包括磁盘的起始传输速率、存取时间、CPU占用率等,测试结果见图6。


  图6

  从磁盘系能来看,参测的图形工作站都支持双通道Ultra SCSI 320通道,在硬盘的选择上都采用了SCSI接口的硬盘,不过有的硬盘支持Ultra320SCSI接口,有的硬盘支持Ultra160SCSI接口,因此,磁盘的传输速率有些差别。值得强调的是即便是采用同样接口的硬盘由于磁盘密度等技术指标的不同,传输速率也会有些差别。

  内存性能测试

  该项测试主要考察工作站的内存带宽,测试软件选用了sandra 2002中的Memoory Bandwith Benchmark 测试项。测试结果见图7。


  图7

  从测试成绩可以看出,由于这次参测的图形工作站都支持双通道处理器,内存都采用了ECC DDR 266,因此内存的性能差距不大。

  处理器性能测试


  图8

  为了考察处理器的运算能力,赛迪评测选用了sandra 2002的处理器测试子项。这次参测的图形工作站都采用Intel为搭配新至强而推出的E7505芯片组,在处理器方面,都采用Intel最新的至强处理器,不过,由于从成本及市场定位等角度的不同考虑,厂商送测的工作站并没有采用统一频率的处理器,有的厂商采用的是至强 3.06GHz处理器,有的采用的至强 2.8GHz 或至强 2.4GHz,由于处理器工作频率上的差异,因此在该项的测试结果上会略有一些不同。值得注意的是IBM工作站由于采用了单至强2.8GHz处理器,而其它工作站都为双至强处理器,因此数据处理能力上弱了一些,测试的分值较低。测试结果见图8。

公司名称产品名称、型号

方正

海信

dell

超微dps

disk inspection test

 

 

 

 

disk access time

5.550

4.430

5.4

5.470

disk transfer rate:beginning

65000

75900

138000

68300

disk transfer rate:end

55700

74200

136000

61800

disk cpu utilization

3.400

1.350

1.610

1.270

indy 3d

macd 40

224.02

304.21

300.77

248.58

macd 150

84.29

126.72

109.07

97.16

animation

147.95

131.72

138.73

118.76

simulation

389.27

411.33

351.56

320.06

viewperf 7.1

3ds max-02

10.26

24.3

10.57

13.78

drv-09

57.47

135.4

61.26

82.02

dx-08

75.46

126.9

79.28

86.33

light-06

18.69

29.21

16.32

16.52

proe-02

14.74

38.46

16.87

17.08

ugs-03

22.42

41.45

26.55

34.53

photoshop7.01

gaussian blur

43.98

30.89

16.57

35.41

unsharpen mask

16.75

14.52

11.47

13.71

lighting effects

51.71

26.76

17.08

35.34

rgb-to-cmyk conversion(72mb)

4.9

5.09

4.87

6.22

rgb-to-cmyk conversion(190.2mb)

29.18

18.73

15.18

23.06

proe 2000i

cpu composite

1.84

1.64

1

1.14

i/o composite

1.98

1.96

1

11.46

graphics wireframe composite

2.59

3.47

0.8

2.97

graphics shade composite

2.41

2.91

1

2.43

file time

2.41

2.65

1

2.07

total time

2571秒

2543秒

2652秒

3461秒

overall composite

2.21

2.39

2.29

1.86

sandra 2002

cpu

11769

11384

11550

9106

3360/7752

3359/7720

3339/7791

2603/6011

ram

3291

3119

3350

3065

3293

3120

3352

3064