
| 出版日期:2004-08-02 总期号:1335 本年期号:56 |
|
用刀片实现随需应变
——构建企业级刀片中心的四大核心要素 〔IBM eServer x系列服务器中国区销售总经理 吴磊〕 国内的刀片服务器市场经过近两年的发展,已经进入企业级应用领域。BladeCenter刀片中心是IBM公司和Intel公司这两年在全球合作的一个非常重要的用于简化IT基础架构的新产品。两家公司一起投资开发和进行市场推广,为刀片标准的最终确定而努力——归根结底,我们希望能够更好地服务于客户。 基于IDC的最新统计报告,IBM eServer x系列服务器在国内市场的销售额已经连续三个季度都位居冠军。其中,IBM eServer BladeCenter刀片服务器更是获得了惊人的增长速度,目前从市场份额来看已居统治地位。更重要的是,随着刀片中心的推广和实施,我们确实看到这一产品本身是可以真正帮助客户,在享受高科技的同时更好地透过IT来管理业务流程,更好地降低他们在IT硬件上的投资和运营成本。 举一个证券行业客户的例子,他们以前的服务器是采用普通的1U机架式服务器,由IDC中心进行托管。今年年初时,客户开始转向IBM的BladeCenter刀片服务器,一共买了2个刀片机柜共28片刀片服务器的产品。当差不多运行三个月的时候,我们请客户谈谈使用刀片服务器有什么经验和感受?客户告诉我们说:刀片中心确实带来了一些新变化——虽然机器是托管在IDC,不能像以前放在自己的数据中心那样方便管理,但是利用刀片我们轻松实现了负载均衡,刀片间的应用可以切换;另外,安装了IBM的一些远程管理、远程实施的软件,所以当某个刀片出现故障时,也许我们的工程师还没有赶到IDC中心,但是系统可以自动地把备用的刀片启动起来保证业务继续运转;此外,BladeCenter还可以连接到后端的SAN存储设备上,从而搭建成整套的IT架构。 当企业决定选择刀片服务器产品后,可能会面对市场上种类繁多、特性各异的产品而困惑。IBM认为,企业选择刀片服务器并不是追逐“时髦”,仅仅是简单地从1U机架到刀片服务器的外形升级,而应把刀片中心看作企业IT投资的关键平台。 下面将具体分析企业在选择刀片服务器时应该考虑哪些方面的因素,从而衡量选择的刀片服务器产品是否能够达到IT架构核心平台的稳定性标准和整合能力要求。同时,我将以IBM的BladeCenter刀片服务器为例,介绍IBM在设计上怎样满足这四个核心要素的要求。 保证可靠性的双冗余设计 当一个新产品出现在市场上的时候,很多用户都不会贸然去做“第一个吃螃蟹”的人。用户需要看到产品在市场上成熟、稳定,才可能进行采购。在国内有很多的客户选择购买IBM eServer x系列的4路产品x255搭建自己的IT系统,这是因为x255是x系列非常成熟的4路产品,其稳定性给了用户强大的保障。对于BladeCenter刀片服务器而言也是一样,如果没有稳定可靠作为“第一保证”,用户没有理由轻易地进行移植。因此,在BladeCenter刀片服务器的设计之初,提供刀片服务器的安全稳定性能被列为“重中之重”。 在IT领域有个专业名词叫做“单点故障”(Single-point Failure),这好比计算机的电源线插在电源插板上,由于是一根电源线,如果断了,系统立刻断电。服务器设计中也有类似的情形,我们不能容忍服务器可以掉电或者在电源、板卡接口上出现故障,因为服务器是用作核心应用的——个人用户可以重启PC,但是企业用户则希望这样的举动越少越好。“冗余”这个字眼从日常生活里的“多余”在这里则变成了非常重要的稳定性保证——没有双冗余设计,意味着在整个系统埋伏着许多潜在的“定时炸弹”,这些隐藏的“单点故障”嫌疑将使得企业的IT系统构建在不够坚实的地基之上。 在IBM eServer BladeCenter刀片服务器中,许多部件都是双冗余的结构。比如每一片刀片服务器与刀片中心机柜的背板相连接都是上下两个板卡接口,应用了双冗余设计,当中如果一条出现问题时,就不会导致系统的停顿和崩溃。刀片中心机柜的中间背板本身也是全冗余设计,其上没有芯片,没有电源,只有一些最基本的线路板元器件——这样的设计考虑也大大降低了背板发生故障的几率。(见图1) 降温散热上的整体设计 随着服务器集成密度的提高,整个刀片中心的散热要求也提高了。高计算力需要多CPU,而CPU本身以及相关设备都需要刀片机柜具备强大的散热降温能力。IBM是采用类似“中央空调式”的整体散热技术,来帮助整个刀片中心进行降温。IBM刀片中心的散热系统设计,是用两个冗余的风扇对放置在刀片中心的14片刀片进行散热,就像大酒店的中央空调能够对各个房间同时进行散热。而且刀片中心的散热系统采用双冗余设计,如同配备了两套酒店的“中央空调”。 相比之下,一些厂商在进行刀片服务器设计改良时,会做一些非常简单的改变——只是简单地把一个服务器压扁,仍然为每个服务器采用类似“壁挂式空调”来帮助每个刀片单独散热,如同为房间中的每个人配备一个“电风扇”。但这样的设计可能会带来两个问题:一、我们需要一个非常敬业勤劳的电工每天去检修每个“壁挂式空调”、“电扇”是否正常,如果出现问题需要对每个散热设备进行更换;二、仅仅保证了刀片服务器自身,而忽视了机柜空间内的空气流通和整体散热。 IBM刀片中心采用整体散热设计和双冗余的高速风扇配置,则另辟蹊径、化繁为简,保证了机柜散热上的可靠、高效。不仅如此,IBM设计的这套双冗余的“中央空调”风扇还具有“变频”功能,在平时标准使用的时候,每分钟150立方英尺的散热风量。当它出现温度预警、部件故障时,或者一个风扇彻底坏掉,另外一个风扇会开足马力进行工作,每分钟出风量可以达到325立方英尺的散热空气流动量。如果有人在这个时候站在运行中的IBM刀片中心背面,会发现风量非常大,这个道理和站在酒店中央空调的主出风口一样。因此,双冗余的设计保证了不用担心单个风扇故障引起的服务器性能问题。 在散热系统中还设计了回流的主力器,空气的流动比较顺畅。冷空气从刀片中心前方进入,对热的两个部件CPU进行散热,然后对其次的内存、芯片、硬盘、直至这两个电源的部分,然后由这两个风扇把变热的空气从刀片中抽出来。 硬件厂商设备的整合能力 在整个刀片中心的系统架构上面,IBM跟许多世界顶级的硬件厂商强强联手,提供给用户整体的IT系统解决方案。IBM与全球最大的CPU的生产厂商Intel,全球最大的光纤存储设备生产厂商Brocade,全球最大的网络产品厂商Cisco,以及全球知名的2到7层交换机生产厂家Nortel,最大的高性能计算交换机生产厂商Myricom等合作,将它们的技术全部融入到刀片中心当中。IBM也因此成为业内惟一一家能在精密7U空间中集成这些界最知名厂商技术的服务器厂商。 如图2所示,我们可以看一下刀片技术带来的整合能力,如果要建设一个中型企业计算数据中心,需要很多设备来帮助支撑中小企业的计算跟网络跟存储的一个平台,包括10类产品:10个2路CPU的服务器,基于RISC的两路CPU的服务器一台,某个品牌的4路服务器一台,7层以太网交换机一个,Fibre Channel光纤交换机一个,加上一大堆光缆,2层以太网交换机一个,KVM切换机一堆,网线若干,KVM电缆一堆,电源线若干。当IBM将这些全球知名厂商的技术集成到BladeCenter当中之后,一个7U高的机箱就可以集成所有的设备,大大的简化了用户在数据中心的成本:空间成本,管理成本和使用成本都大大降低了。 先进的软件方案整合能力 除了硬件整合能力外,是否有成熟先进的软件方案整合能力,也是用户在选购刀片服务器时非常关注的一点。IBM在拥有基于自己的软件产品的解决方案同时,与很多著名的软件方案提供商都有在刀片服务器上的合作,如VMware、 CITRIX、Novell、SAP等。 对于企业关键应用,IBM刀片服务器可以实现基于VMware在刀片间不间断任务转移。当企业关键应用业务不能停机又需要扩展比如要升级CPU处理能力时,以前是一定要停机的。使用基于VMware的这一方案,迁移工作 则可以不停机地完成。此外,当BladeCenter上面开了很多虚拟的VMware Server,需要对刀片服务器的内存、CPU或者硬件设计进行扩展或调整的时候,它上面的应用可以直接切换到另外一台拥有VMware V/Motion的刀片上面,所有的数据包括内存上的数据都会不间断地迁移过去并予以保留,待原有刀片的维护工作完成后再平滑地迁移回来。 (E7)
图1 刀片中心背板的双冗余设计
图2 刀片中心硬件整合能力示意图 |
|||||||||||||||||||||||||