ccidnet????

出版日期:2001-01-08 总期号:988 本年期号:03

本期导读
要闻综合
电脑工作室
渠道与市场
产品与应用
软件与服务
InfoCD
探求·交流·发展
中国计算机报社PC服务器技术研讨会
李柠

  2000年的服务器领域可谓一波未平,一波又起。首先是年初总线速度从100MHz到133 MHz的提升,然后是RCC公司ServerWorks系列芯片组的异军突起,接下来的IA-64也把2000年寒冷的冬天炒得热气腾腾。但不论是产品架构的变化,还是应用技术的更新,最终还将在用户的需求中一分高低。从各种调查分析都可以看出,2000年,PC服务器的架构、可靠性和机柜技术是用户关注的几大焦点。

  作为传播产品技术、引领舆论导向的专业报纸,我们正在努力成为产品技术交流的平台,成为厂家与用户交流的媒介,那么,我们也有充分的理由承担起让技术专家与技术专家、技术专家与用户进行面对面交流的任务。出于这个目的,我们邀请了国内外服务器厂家的技术专家和技术工程师,在12月14日组织了这次《中国计算机报社服务器专题技术研讨会》。在这个以技术为主体的会议上,有精彩的主题演讲,有深入的技术探讨。生动祥和的会议气氛让我们丝毫看不到刻意的保留和竞争的痕迹,会后给所有人留下的只有时间限制的遗憾和下次再会的期望。

  参加我们研讨会的服务器厂家有(排名不分先后):HP、SGI、浪潮、联想、方正、杜文、技嘉、宝德科技等,在会后还有实达等厂家对此次会议提出了书面研讨。在感谢这些服务器厂家和技术专家们对我们的大力支持之外,我们很兴奋的是能够将这次会议的精彩内容,通过报纸与广大读者共同分享,从而达到我们的真正目的。


  以冗余为手段,达到容错的目的


  所谓冗余和容错,就是采用相应的技术和方法保证服务器运行,或在其出现错误时能够避免系统宕机,维持系统的正常运转。两者之间的关系是:以冗余为手段,达到容错的目的。服务器的冗余和容错的专题讨论主要对服务器单机的冗余和容错方式、各自的特点和集群系统进行了探讨。

  单机有哪些冗余与容错技术?

  单机冗余技术主要有:RAID(磁盘阵列)、Power Redundancy(电源冗余)、Adapter Fault Tolerance (网卡容错)、Dual Channel & Controller(双通道和多控制器技术,如双通道SCSI、PCI等 )、Symmetric Multiple Processor(对称多处理器)、Fans Redundancy(风扇冗余)。


  SGI公司 许耀昌:“服务器的架构要注重模块化设计……”

  在这些冗余技术中,对称多处理器SMP是比较新兴的技术,它可以实现在一台服务器上使用多颗处理器,共享内存和总线结构,操作系统可将任务对称地分布在每个处理器上,从而极大地提高数据的处理能力,增加数据的传输带宽,同时也具备了CPU的冗余功能,即一颗CPU出错时,还有冗余的CPU可以进行数据的运算任务。

  在容错方面,主要的技术有:Error Checking and Correction(ECC,纠错技术)、Auto Server Restart(服务器自动重启技术)、ReFlash ROM(可擦写ROM)、Baseboard Management Controller (BMC,基于主板的管理控制器)。

  在服务器中有很多技术可以实现冗余和容错,但服务器并不是每个部件都有经常出错的可能,因此,将最易出错的子系统进行冗余就可以排除大部分的服务器宕机可能。比如说将内存、磁盘、网卡和电源这几项做冗余和容错,就可以达到99.9%的系统可靠性,而要是想达到99.99%或99.999%的性能,就必须对每个环节做冗余容错,当然这也相应加大了用户的投资力度。

  怎样实现集群?

  采用集群系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力。简单说来,集群是指至少将两个系统连接到一起,使两个服务器能够像一台机器那样工作。常用的几种集群技术有双机备份、应用程序错误接管集群、容错机、并行运行和分布式处理技术、可连续升级的集群技术。其中,可连续升级的集群技术是前几种技术的一个组合。在这种集群系统中,通常有一个负责管理整个集群系统的中央节点,它负责将用户的请求分配给集群系统中的某个节点,然后中央节点直接通过Internet网络向用户提供服务。在集群系统中,每一个节点都互为备份,包括中央节点,它在完成向集群节点分配任务的同时,也向用户提供服务,一旦中央节点宕机,系统将自动推举一个节点为中央节点,来接管它的全部应用。


  方正公司 郭耀:“服务器架构设计很重要……”

  相对于高端企业级服务器而言,低端小组级服务器的冗余重要吗?

  在与用户的接触中,我们有时能听到用户说,在采用低端的小组级服务器时,好像没有太多必要去花费大力气建立冗余机制。对此,技术专家们有这样的解释:服务器的高端、低端,是按照其硬件配置、数据处理能力、所承担的网络负载来说的;而对于运行在服务器上的数据业务和数据信息而言,没有高、低端之说。服务器上的业务和数据都是重要的、值得保护的。所以,低端小组级服务器的冗余同样重要!但是,在选择冗余方式时,我们可以考虑在小组级服务器上采用多路处理器、ECC内存、实现多网卡链路冗余和使用IDE RAID做磁盘冗余等办法对低端服务器做冗余。


  技嘉公司 刘龙:“IDE RAID也可以实现热插拔……”

  服务器的热拔插(Hot plug)技术

  热拔插可以使管理员在线地对服务器进行维护,及时更换、维修服务器上出错的部件,从而减少因停机造成的损失。在服务器上常见的可热拔插的部件有:硬盘、电源、风扇以及PCI设备(网卡),在将来甚至可能实现CPU这种核心部件的热拔插。当然,要想进行热拔插的操作,要冗余技术配合使用才行,即首先要保证对维护的部件有事先的保护,才可拆卸服务器上的部件。如有冗余双电源则可以进行某个电源模块的热拔插,因为还有一个电源可以提供服务器的能源保障;磁盘系统做了RAID,磁盘上的数据有了备份,才可对硬盘进行热拔插,否则拔掉出错的硬盘后,无法恢复其中的数据,就失去了在线维护的意义。


  用更好架构实现更高性能


  服务器的技术架构一直是各服务器厂商考虑得比较多,也是服务器用户们很关心的问题,对于2000年在服务器架构中的一些变化,各技术专家们也谈了自己的感想。


  HP公司 吴韶媛:“从凌乱到整洁是未来机柜的发展趋势……”

  PⅢ CPU由SECC2封装方式转变为FCPGA封装方式,对服务器设计主要有哪些影响?

  ● 由于FCPGA CPU节省空间,且利于狭小机箱内部的散热,使设计1U 机架服务器相对较为容易。

  ● FCPGA CPU与主板的接触面积较大,而SLOT1 CPU只有一片PCB板支撑,所以FCPGA 封装方式要相对可靠,使服务器的抗震动能力相对增强。

  ● FCPGA CPU占用主板面积较大,在双CPU情况下,特别是在高频CPU使用大散热片的情况下,使得服务器主板元器件排布较为困难。

  IA-64的出现,对现阶段的服务器产品将会有怎样的冲击?

  IA-64技术带给业界的是高性能和跨平台系统,对关键应用后端服务器特别是中低端UNIX服务器的影响会比较大。由于其技术的通用性和相关服务器部件厂商对IA-64技术支持的广泛性,可以大大降低各服务器厂商在高端服务器的研发投入,从而缩短新产品的研发周期。在近几年来说,IA-64服务器是对现有IA服务器产品的一个很好的补充,可以带领整个IA服务器产品群向更高技术领域拓展。

  IDE RAID和SCSI RAID两种技术发展分别有哪些优势和缺陷?


  杜文(Donovan)公司 邹志军:“在保证性能的前提下,机箱越薄,竞争力会越强……”


  注:1 曲线代表SCSI RAID的测试结果;2 曲线代表IDE RAID的测试结果。

  使用system测试集确认,IDE RAID磁盘子系统做RAID0和RAID1时性能略高于零通道SCSI RAID卡。

  图1 IDE RAID与0通道SCSI RAID卡性能比较

  IDE RAID中的硬盘有Master和Slave之分,同一RAID中的硬盘性能不平衡,会影响服务器部分性能;另外,IDE芯片不支持热插拔功能,不能识别硬盘的在线更换,需要单独的驱动,且一般都需要配合单独的热插拔磁盘盒,从而导致成本的增加。此外,还由于IDE技术的原因,IDE RAID在工作时多少会占用CPU的资源(但现在CPU已足够快,不会有影响)。但是,当IDE RAID主要用于硬盘个数在4个以下,资金比较紧张的应用场合。比如,如果仅用到2块硬盘,只需要RAID0或RAID1,那么IDE RAID成本会非常低;IDE RAID卡上


  联想公司 邢茂伟:“IA-64服务器是对现有IA服务器产品的一个很好的补充……”

  还可以集成i960芯片,可以支持RAID5,最多达6块硬盘。由于IDE硬盘技术发展迅猛,接口速度达到ATA100,磁道密度已高于SCSI盘,所以IDE RAID性能已经相当不错了。IDE RAID市场在今年异常火爆,技术提供厂商不断增加,使得IDE RAID功能逐渐成为低端服务器的标准功能。IDE RAID与SCSI RAID性能比较见图1。

  但是,由于IDE RAID技术上的一定缺陷,并且目前对操作系统的支持情况还不像SCSI RAID那么丰富,如果需要大容量RAID,还是要选用SCSI RAID;并且SCSI RAID技术已达到Ultra 160,如果不是因为资金的问题,在高性能应用下还是应选用SCSI RAID。

  技嘉公司的技术专家提出,现在可以在用IDE硬盘做RAID0和RAID1的基础上,实现热插拔技术。并且实现该技术所需要的成本不会超过3美元,但要做到RAID3和RAID5的话,难度会比较大。


  从凌乱到整洁


  机柜式服务器是在市场的需求中诞生的,2000年机柜式服务器市场的火爆程度,也充分表明了机柜式服务器更强劲的发展趋势。到会的HP技术专家为我们详细讲解了HP公司机柜及机柜式服务器从凌乱到整洁的解决方案。


  图2 HP机柜式服务器散热实例

  构筑机柜有哪些技术要点?

  在机柜的设计方面,要考虑到的问题有:系统承重、系统散热、电力供应与散热、专业配件、制作工艺、美学搭配和专业集成、容易安装、升级能力等因素。

  机柜式服务器要在节约空间的前提下,既具有美学的观点,又能简化布线和管理,并通过其合理的配电以及独特的散热装置,提高服务器的运行效率。

  机柜产品在散热方面要考虑的问题有:通风气流的设计以及风扇的冗余和热交换。


  浪潮公司 金鹏:“低端小组级服务器的冗余也很重要……”

  机柜式服务器如何解决散热问题?

  服务器的散热主要在硬盘、内存、网卡、CPU等方面,在PC级服务器中主要还是通过设置散热片、风扇和风道来达到为这些部件散热的目的,在这些部件中,硬盘的散热是服务器设计中的重要部分。HP机柜式服务器散热实例见图2。