ccidnet????

出版日期:2004-04-12 总期号:1304 本年期号:25

本期导读
要闻综合
中国信息化
网络与通信
软件与服务
产品与应用
渠道与市场
华东专刊
华南专刊
西北专刊
东北专刊
王者归来



  刚刚挣回11项奥斯卡小金人的《指环王3:王者归来》可谓占尽娱乐圈的大好春光,不过最近在IT领域也有一个“王者”大放异彩,这就是刀片热回潮。

  众所周知,刀片服务器从2000年底诞生以来,因其种种技术优势曾经被众多厂商和专业媒体寄以厚望,期望其成为建立服务器市场新秩序的王者,而它也的确在2001到2002年在全球掀起过一阵热浪,可惜未维持多久,只占据了很小的市场份额。但从去年底开始,多家厂商却不约而同的重新重视刀片,据不完全统计,预计到第二季度,国内市场上将有16家厂商推出刀片产品。

  那么,这次刀片回潮是如何产生的,它的主要特征如何?市场上为何有这么多种类的刀片产品?刀片技术是否真是完美无缺?为此,我们组织了此次刀片技术专题。

  专题文章:

  ●王者归来

  ●乱也cPCI 成也cPCI—cPCI标准全面解读

  ●刀片的四个罩门—有待解决的技术问题

  专题策划:谢文砚

  专题撰稿:胡飞亦 谢文砚


  1 2000年:第一次热潮


  所谓刀片服务器,就是把整个计算机系统的基本功能都集成在一块电路板上的服务器产品。每个刀片包括处理器、内存、网络控制器,还可以包括硬盘,并且每台服务器通过背板可以同时连接多个刀片,每个刀片通过服务器背板共享输入输出设备、光驱、软驱和服务器内的其他设备资源,整个刀片则可以安插在一个称为Chassis(底座)的机箱内部。

  曾经有人把企业的IT人员比作庖丁,而刀片服务器则是庖丁手中的“解牛刀”。与传统塔式、机架式和机柜式服务器相比,轻薄许多的刀片服务器也可以算得上是“无厚”了,但是在刀片刚诞生的时候,实际的应用情况却并不如设想中的那么“游刃有余”,原因何在?让我们来一起回顾一下刀片的起源。

  应电信需求而生

  刀片服务器之所以得以诞生,最重要的因素应该是与电信业务的变迁有关。20世纪90年代,全球Internet迅猛发展,电信业务在与之融合的同时自身也在不断发展演进,国内称之为电信业务的智能化。电信运营商在业务的发展中需要大量符合电信标准的专用服务器,市场规模非常可观。这一市场早期被一些电信厂商生产的专用服务器所占据,利润丰厚。随着全球范围内的互联网以及企业内部网络的快速发展,企业和网络信息提供商开始面临集中存储及处理无限增长的数据问题,集中计算成了网络发展的趋势。于是“节约空间、便于集中管理、易于扩展和提供不间断的服务”,成为对服务器提出的新要求。作为网络重要组成部分的服务器来说,性能已不仅仅是评价服务器的唯一指标了,用户更关心的是符合自己实际需要的产品。随着网络向更深层面发展,越来越多的用户(尤其是众多IDC)对服务器的物理尺寸和快速部署有了更高的要求,于是采用CompactPCI标准(简称cPCI)生产的刀片服务器应运而生。

  所谓CompactPCI,是一种高性能总线标准(详见后文),由美国Ziatech公司在1994年推出。Ziatech公司2000年被Intel收购,成为Intel Communications Platform Division (CPD)的核心部分,一直在从事电信领域的cPCI机柜和插板业务。而cPCI服务器就是刀片服务器的原型,而发展标准化的、功能更完备的、更高密度的刀片式服务器,也主要源于上述的电信业务需求。

  前两代族谱

  令人感兴趣的是,世界上的第一台刀片服务器并非由著名的服务器厂商推出,而是由一些小公司在2000年推向市场的。这其中包括美国的RLX、我国台湾省的Nexcom等,现在RLX和Nexcom都已经成为重要的刀片服务器OEM制造商。

  2001年12月4日,HP在服务器一线大厂中率先发布了Powerbar系列刀片式服务器产品,并宣布其“刀片服务器开放标准”。当时参加HP刀片服务器联盟的厂商有Accton、Agilent、AMD、F5 Networks、Intel、Oracle、RealNetworks、ServerWorks、Transmeta、TurboLinux等数十家,该联盟包括了IT业重要的处理器、芯片组厂商,还有一些软件厂商。HP的举动引起了众多一线服务器厂商的强烈反应,在与HP的合并案未见分晓之前,Compaq在2002年2月也紧跟着发布了自己的ProLiant BL10e刀片服务器。HP与Compaq合并后又连续推出了Proliant BL20p和Proliant BL40p。

  IBM在刀片的动作上显得稍晚,一面与RLX签约合作,一面自己研发产品。2002年IBM推出BladeCenter HS20刀片服务器,随后与Intel达成同盟,两家共同制定了一种刀片服务器生产标准,并获得包括Nokia、Cisco、Nortel等大厂商的支持。值得一提的是,IBM的BladeCenter可以安插Nortel的2~7层交换机。

  Sun则在2003年春开始发售采用SPARC平台的刀片服务器,以及去年年底增加的采用Opteron芯片的Sun Fire B100x,看来Sun在刀片市场上也决不会放手。值得一提的是,Sun的Fire BL600刀片平台在3U的机箱中最多支持16个基于 UltraSPARC处理器或Intel的x86处理器的刀片,这也是惟一能够提供跨越Linux、Unix和Windows平台的刀片平台。

  Dell在2002年4月推出了配置双CPU的PowerEdge 6600和PowerEdge 6550刀片,以及安插它们的Chassis—PowerEdge 1655MC。由于Dell的特长并不在硬件研发,所以Dell也没有过多宣传硬件上的创新技术,而是宣称其Open Manage Remote安装工具可以让用户建立并捕获服务器操作系统中的信息,并通过网络传输给其他的刀片,以方便地配置刀片。

  国外的刀片厂商还有美国的F5 Networks,日本的富士通、NEC和Visual科技等。

  在国内,主要的厂商除上面提到的新汉(Nexcom)之外,网虎(Coventive)公司曾在2001年初在内地推出其网虎Blade32660刀片服务器。2002年初,国内的联想、浪潮和曙光也都相继推出自有品牌的刀片产品,分别是联想万全309r、浪潮英信超群109和曙光TC1600。

  为何铩羽而归

  第一次刀片热潮之所以悄然冷却,除了全球IT进入寒冬的大背景,还有就是第一代刀片和第二代刀片采用的cPCI版本不一致,再加上厂商有意无意地制定各自的生产标准,让用户采购时心存疑虑,从而影响了刀片的发展。

  而除了标准差异之外,影响第一代刀片发展的另一个主要原因就是性能较差。例如当时常见的刀片配置是:1颗PⅢ 1GHz处理器或者P4甚至是Transmeta 5600处理器(其性能只相当同频率PⅢ的30%),配备ServerWorks LC-E芯片组、Intel 815芯片组或是Via Apollo Pro 266芯片组,最大支持带有ECC功能的3GB内存,硬盘则大多采用2.5英寸的笔记本硬盘。而且当时的刀片从外观和功能上看,大多和采用cPCI标准制造的用于工控系统的全长卡没有太大区别。

  因此标准的不统一和性能上的缺陷导致了第一代刀片成为许多用户眼中的鸡肋,导致了第一次刀片热潮的冷却。


  典型刀片系统示意图


  RLX ServerBlade 324(第一代刀片)


  HP Proliant BL20p G2(第二代刀片)


  可安插Nortel 2~7层交换机的BladeCenter


  2 2004年:强力回潮


  从2003年12月Sun发布Sun Fire B100x刀片开始,NEC、IBM、HP、曙光、方正等十余家厂商陆续在国内市场上推出最新的刀片产品,这可以看作是第二次刀片热潮的开始。

  务实的热潮

  这次热潮和上次的不同之处在于,上次几乎所有的厂商都大力宣传刀片所具有的高密度部署特性和因此而带来的低成本收益,却回避了性能缺陷、多重标准、管理和散热问题;而现在各大厂商则直面这些问题,在部分解决了系统散热的前提下,基本实现了刀片服务器与普通服务器的性能持平,虽然在服务器管理和统一标准的问题上还存在一些分歧,但我们可以看到厂商的态度已经务实了许多。

  例如对于刀片标准的问题,IBM就承诺在未来几年内允许并欢迎业界厂商和用户,将整个基础设施整合到BladeCenter机箱中,也就是说,任意刀片选件都可以安装到同一个机箱中,而不论它是基于Intel平台运行Linux的刀片,或者是基于PA-RISC平台运行HP-UX的刀片,还是基于PowerPC平台运行AIX的刀片。

  而且,目前大多数系统厂商也承认刀片系统的处理能力、系统的能源利用率、系统电热量以及系统散热性能存在交叉制约的关系,尤其在处理器运算能力日趋强大、服务器内部空间利用率越来越高的今天,对于电源利用率和系统散热性能的要求日趋迫切。在保证刀片系统处理能力的前提下,系统电热量一般无法大幅降低,但是系统的能源利用率和散热性能将得到提高。因而越来越多的厂商将如何提高系统能源利用率视为关键,尤其是如何提高CPU和内存的运行效率。

  而此次刀片热潮最大的亮点在于IBM提出了简化IT基础架构的理念,力图通过刀片技术的广泛使用来引发新的互联网平台更新。刀片服务器就和《指环王》中流浪的人类王子阿拉贡一样,一出生就得到众多厂商和媒体的青睐,注定是当“国王”的料子;刀片升温和冷却的速度同样令人侧目,而阿拉贡的起伏际遇同样如此,虽是王族却不得不自我放逐;刀片回潮则和阿拉贡逐渐获得人心一样令人鼓舞,惟一不能确定的是,刀片能否与阿拉贡一样,成就一代霸业。

  简单即是美

  对于此次刀片热潮所推崇的简化理念,这里用四张示意图来说明。

  图1是典型的企业内部网络拓扑图,所有的应用和核心的软件都被放置在一系列中前端服务器中;这个本地网络与Internet之间的数据交换,则通过路由器(或三层交换机)来实现;整个服务器群的数据则是通过光纤通道的存储交换机存放到SAN系统中;再加上安全设备和辅助设备,如防火墙和SSL加密设备、缓存设备等,尤其是整个系统采用双冗余的网络架构,这个结构可谓强壮。但这样的一个网络结构是有问题的,随着服务器的增多,有限的机房空间无法容纳如此多的设备,因此,首先需要用刀片服务器来取代传统服务器,于是8台机架式服务器就变成了一台插上8块刀片的刀片服务器。

  从图2可以看出,服务器整合在一个Chassis中以后,从刀片的Chassis到2层交换机和光纤通道的存储交换机之间有32根冗余的连接线缆,而线缆所引起的故障占到了系统故障的25%,所以我们需要把光纤通道的存储交换机和2层交换机用可以安插到Chassis上的交换模块来代替,这样的话,只需要4根线缆就可以完成冗余连接的任务。

  再来看看图3,现在还剩下四~七层交换机、缓存设备和SSL设备,实际上,目前已经可以用Nortel的二~七层交换机模块来替代四~七层交换机;而SSL设备和缓存设备则可以通过一些软件厂商提供的中间件来实现,即把原有的硬件设备功能软件化,放到刀片服务器上来运行,于是我们可以看见完成简化后的网络结构(见图4)。

  目前的刀片平台可以提供从1路到4路,从Intel平台、Power平台、Opteron平台到SPARC平台,从Windows、Linux到Solaris的各种应用,而且这些刀片在未来是可以安插在同一个Chassis上的。

  当然,对于高端用户来说,还需要对大型主机进行简化。例如在金融和电信行业中,可能会需要多个CPU的应用,一样可以在路由器和防火墙后面接上大型主机和高端的多处理器Unix服务器,再加上1路到4路的刀片服务器和存储设备就构成了一个全新的基础网络架构。

  简化管理降低TCO

  规模化部署的刀片服务器在硬件成本上相对机架式和塔式服务器具有明显的优势。如图5所示,我们可以清晰地看出刀片的优势。

  除了购买成本,刀片在管理成本方面的优势也比较明显。据统计,线缆故障是造成系统宕机的主要原因,系统管理员1/4的时间都用在线缆管理上。而刀片服务器只需一次布线,重新配置时,通过配置工具即可完成。网络连接方面,同是8路服务器,刀片服务器不需要下行链路连线,而机架服务器需要16~32条下行链路连线,这些连线费用就有数千元。

  综合考虑全部运营因素的影响,服务器数量在100~1000台之间的企业在采用刀片服务器之后,运营成本大约是采用机架式服务器方式的1/6(详见图6),成本降低的比率在一定范围内随企业拥有的服务器数量的增加而提高。


  IBM BladeCenter HS40(第三代刀片)


  上述基本网络结构存在于当前绝大多数企业中,复杂而不便于管理和扩展。

  图1 当前典型网络拓扑图


  刀片取代机架式服务器后,节约了机房空间,但网络结构没有本质改进。

  图2 刀片取代机架后的情况


  将部分交换机模块化,然后放到刀片服务器中,可以极大地降低机房的线缆管理复杂程度。

  图3 二层交换机和光纤交换机整合后的情况


  完全采用刀片简化后的基本网络结构简单而便于管理和扩展 。

  图4 未来的网络拓扑图


  刀片回潮背后的技术内幕


  从2003年12月Sun发布Sun Fire B100x刀片开始,NEC、IBM、HP、曙光、方正等十余家厂商陆续在国内市场上推出最新的刀片产品,这可以看作是第二次刀片热潮的开始。


  务实的热潮


  这次热潮和上次的不同之处在于,上次几乎所有的厂商都大力宣传刀片所具有的高密度部署特性和因此而带来的低成本收益,却回避了性能缺陷、多重标准、管理和散热问题;而现在各大厂商则直面这些问题,在部分解决了系统散热的前提下,基本实现了刀片服务器与普通服务器的性能持平,虽然在服务器管理和统一标准的问题上还存在一些分歧,但我们可以看到厂商的态度已经务实了许多。

  例如对于刀片标准的问题,IBM就承诺在未来几年内允许并欢迎业界厂商和用户,将整个基础设施整合到BladeCenter机箱中,也就是说,任意刀片选件都可以安装到同一个机箱中,而不论它是基于Intel平台运行Linux的刀片,或者是基于PA-RISC平台运行HP-UX的刀片,还是基于PowerPC平台运行AIX的刀片。

  而且,目前大多数系统厂商也承认刀片系统的处理能力、系统的能源利用率、系统电热量以及系统散热性能存在交叉制约的关系,尤其在处理器运算能力日趋强大、服务器内部空间利用率越来越高的今天,对于电源利用率和系统散热性能的要求日趋迫切。在保证刀片系统处理能力的前提下,系统电热量一般无法大幅降低,但是系统的能源利用率和散热性能将得到提高。因而越来越多的厂商将如何提高系统能源利用率视为关键,尤其是如何提高CPU和内存的运行效率。

  而此次刀片热潮最大的亮点在于IBM提出了简化IT基础架构的理念,力图通过刀片技术的广泛使用来引发新的互联网平台更新。刀片服务器就和《指环王》中流浪的人类王子阿拉贡一样,一出生就得到众多厂商和媒体的青睐,注定是当“国王”的料子;刀片升温和冷却的速度同样令人侧目,而阿拉贡的起伏际遇同样如此,虽是王族却不得不自我放逐;刀片回潮则和阿拉贡逐渐获得人心一样令人鼓舞,惟一不能确定的是,刀片能否与阿拉贡一样,成就一代霸业。


  简单即是美


  对于此次刀片热潮所推崇的简化理念,这里用四张示意图来说明。

  图1是典型的企业内部网络拓扑图,所有的应用和核心的软件都被放置在一系列中前端服务器中;这个本地网络与Internet之间的数据交换,则通过路由器(或三层交换机)来实现;整个服务器群的数据则是通过光纤通道的存储交换机存放到SAN系统中;再加上安全设备和辅助设备,如防火墙和SSL加密设备、缓存设备等,尤其是整个系统采用双冗余的网络架构,这个结构可谓强壮。但这样的一个网络结构是有问题的,随着服务器的增多,有限的机房空间无法容纳如此多的设备,因此,首先需要用刀片服务器来取代传统服务器,于是8台机架式服务器就变成了一台插上8块刀片的刀片服务器。

  从图2可以看出,服务器整合在一个Chassis中以后,从刀片的Chassis到2层交换机和光纤通道的存储交换机之间有32根冗余的连接线缆,而线缆所引起的故障占到了系统故障的25%,所以我们需要把光纤通道的存储交换机和2层交换机用可以安插到Chassis上的交换模块来代替,这样的话,只需要4根线缆就可以完成冗余连接的任务。

  再来看看图3,现在还剩下四~七层交换机、缓存设备和SSL设备,实际上,目前已经可以用Nortel的二~七层交换机模块来替代四~七层交换机;而SSL设备和缓存设备则可以通过一些软件厂商提供的中间件来实现,即把原有的硬件设备功能软件化,放到刀片服务器上来运行,于是我们可以看见完成简化后的网络结构(见图4)。

  目前的刀片平台可以提供从1路到4路,从Intel平台、Power平台、Opteron平台到SPARC平台,从Windows、Linux到Solaris的各种应用,而且这些刀片在未来是可以安插在同一个Chassis上的。

  当然,对于高端用户来说,还需要对大型主机进行简化。例如在金融和电信行业中,可能会需要多个CPU的应用,一样可以在路由器和防火墙后面接上大型主机和高端的多处理器Unix服务器,再加上1路到4路的刀片服务器和存储设备就构成了一个全新的基础网络架构。


  简化管理降低TCO


  规模化部署的刀片服务器在硬件成本上相对机架式和塔式服务器具有明显的优势。如图5所示,我们可以清晰地看出刀片的优势。

  除了购买成本,刀片在管理成本方面的优势也比较明显。据统计,线缆故障是造成系统宕机的主要原因,系统管理员1/4的时间都用在线缆管理上。而刀片服务器只需一次布线,重新配置时,通过配置工具即可完成。网络连接方面,同是8路服务器,刀片服务器不需要下行链路连线,而机架服务器需要16~32条下行链路连线,这些连线费用就有数千元。

  综合考虑全部运营因素的影响,服务器数量在100~1000台之间的企业在采用刀片服务器之后,运营成本大约是采用机架式服务器方式的1/6(详见图6),成本降低的比率在一定范围内随企业拥有的服务器数量的增加而提高。


  图5 刀片系统与机架式系统的性价比参照


  图6 刀片规模化应用的成本优势


  记者观察


  实际上,刀片技术的两次热潮代表着不同的技术取向,前者是为了高端和行业用户而设计的中高端产品,高昂的价格决定了其用户只能是“小众”,而一旦这些“小众”用户的需求萎缩,整个市场就会停滞不前,这也正是第一次刀片热潮悄然冷却的最大原因。而后者则是在众多周边技术,如系统散热、增强供电、有效利用空间、背板交换等技术取得一定进展后,众多厂商采取更加务实的态度推广刀片后而引发的,所针对的用户也更加广泛,可谓走的是“大众”路线。

  同时,刀片技术所代表的简化理念也符合网格技术所代表的发展趋势,可以预见的是,目前是简化中前端服务器和网络设备,随后是简化后端服务器和基础电信设备,然后就是刀片服务器、刀片存储和刀片PC的大融合。不过这一切美好的推论都是建立在刀片技术被用户广泛接受的假设上,而我们目前所能预见的未来,仍然存在着不确定因素。


  背景资料

  刀片主要技术特征


  高可靠性

  在整个刀片服务器系统中,几乎所有的器件都可以实现冗余,某个器件的损坏不会影响系统的正常运行;热插拔技术的广泛应用使得器件的更换可以在系统运行的情况下顺利进行。这一切确保了刀片服务器系统可以达到电信、金融等高端用户所要求的99.999%的高可用要求。

  支持热拔插

  由于采用了cPCI标准制造,所以在刀片的背板中普遍使用长中短插针结构,其中Power和Ground针脚最长,可以保证刀片安全地带电插入拔出。此外,板选信号Enable针脚最短,系统借由此信号可以得知刀片是在插入过程或是拔出过程。cPCI标准还制定了热插拔的硬件过程和软件管理接口,保证了刀片热插拔过程的有效性。

  支持后走线

  刀片的信号线不用从刀片的前面板引出,可以通过背板将信号线用转接板从后端引出。当更换刀片时,不需要更换信号线,实现了减少更换服务器时的工作量以及因更换信号线而引起的出错概率。

  电气性能较好

  cPCI标准规定,刀片背板插针和接头全部镀金,并严格定义了信号线的最长长度、PCB板的阻抗和电容、电阻等指标,因此刀片的电气特性比较好。此外,刀片系统下端具有3段静电导出条,提高了系统的电气安全性。


  冗余的刀片系统


  刀片插针示意图


  刀片电气性能示意图

  刀片插板尺寸及接口定义

  如右图所示,cPCI系统的插板(刀片)尺寸规格定义一目了然。

  cPCI 2.0的背板接口定义了5组插脚J1、J2、J3、J4、J5。

  在cPCI 2.0标准中对J1、J2的插脚进行了定义,包括电源、管理、基本通信等。J1用于32位PCI通信,J2是可选的,可以进行64位传输,适用于背板I/O通信。cPCI 2.0只定义了J1、J2的插脚,J3、J4、J5的插脚是开放的,可以用于背板I/O、桥接第2条总线(VME、SCSI等)或者用于用户自定义的数据通信。

  在3U的机柜标准中只支持J1和J2,6U的机柜中才能支持J3到J5的扩展标准。 PICMG对于J3、J4、J5的几种特定使用方式也有一些标准化的建议,但原则上是开放的。


  插板尺寸和背板接口的定义

  管理标准有望统一

  2003年12月17日,系统管理标准化组织Distributed Management Task Force(DMTF)成立了制订服务器管理接口标准的工作小组“DMTF Server Management Working Group”。该工作组已有IBM、HP、Dell、Intel等企业加盟,而AMD、微软、Oracle、OSA以及Sun等厂商也将参加。该工作组计划通过发展DMTF的CIM(Common Information Model)规格,提供可在数据中心的不同种类的IT环境中使用、独立于平台及可做为业内标准的服务器硬件管理架构,计划在2004年7月1日之前提出第一个规范。该工作组将开发命令行接口(CLI),无论是在服务器操作系统不起作用的状态、不能操作的状态还是处于睡眠模式的状态下均可在本地或通过远程进行管理。另外通过发展CIM,还将支持刀片或虚拟服务器系统等最新的服务器系统拓扑。此外,还将提供可映像到CIM、能够以脚本方式运行的、轻便的和以人为中心的CLI。