ccidnet????

出版日期:2005-01-24 总期号:646 本年期号:04

本期导读
新闻评论
眼  界
封面故事
调  查
案  例
管 理
行  业
采购与实施
产  业
商用计算 应用为先

江南

  如果说科学计算代表了高性能计算大树上一个分支的话,那商用计算则是另外一个更重要的分支,它比科学计算所占有的市场份额要大得多。在这个领域,传统的国际厂商依然占据着“霸主”地位,国产厂商只能是绝地反击。

  决战巅峰

  

  2004年的雅典奥运会,中国健儿奋力拼搏,创造了新的金牌纪录。同样在去年,国产服务器在商用计算领域创造了两项世界纪录。而这两项纪录,都戴在了一家厂商的头上,那就是浪潮。

  让我们把时间拉回到去年。2004年5月,浪潮宣布,其4路安腾产品—浪潮超能SP3000以及在其光纤存储产品NS8800硬件平台上部署的IBM DB2数据库系统,商业智能计算测试(TPC-H)测试值为5618QphH,一举打破了由IBM保持了8个月之久的世界纪录,从而一跃成为商业智能计算的“世界冠军”。

  2004年12月,浪潮又和BEA合作,在国际权威的SPEC服务器应用性能测试中,以1638.97TOPS(Total Operation Per Second,每秒事务处理数量)的优异成绩,刷新了世界纪录。这也是国内服务器厂商第一次参与SPEC服务器应用性能测试。

  此外,2004年10月,浪潮高性能服务器天梭TS20000-DB,还以优异的测试成绩,率先通过了Oracle 10g RAC权威认证。此前,联想也组织通过了Oracle早期版本的测试。

  一系列的事实说明,高性能计算机的商用能力越来越为国产服务器厂商所重视。用联想高性能服务器事业部总经理祝明发的话来说,如果简单地追求科学计算带来的峰值,而不追求商用计算,那中国高性能计算就站不住脚;中国高性能产业突破不了应用,就永远走不出研究所、小公司的局面,中国的高性能计算也就发展不成产业。

  这也难免,因为相对于科学计算来说,高性能商用计算的市场远大得多。按照需求的不同,高性能服务器市场大致可以分为两块—高性能科学计算(HPC)和高性能商用计算(HPS)。后者占据整个市场份额的95%。

  尽管IA机群让高性能的门槛越来越低,但必须承认的是,同样是高性能服务器,科学计算和商用计算的应用对服务器的要求并不相同:科学计算要求高容量、高速度和高精度;商用计算则更强调对复杂异构环境的适应性、运行的可靠性及操作、管理的易用性。

  在商用计算领域,特别是在电信、银行、证券等领域,对计算的可靠性要求特别高。长期以来,这些领域被IBM、HP等国际厂商变成了“自留地”。这种情况下,国产服务器厂商通过权威的测试认证等方式,一方面可以提高品牌知名度,另一方面也可以打消这些传统行业对国产高性能商用计算机的顾虑。

  

  商用领域觅机会

  

  事实上,传统意义上的科学计算和商用计算之间的界限越来越模糊。比如,像数据挖掘这样的商业应用,完全可以运行在一个高性能计算集群体系架构中。

  回首2004年,中国商用服务器市场继续保持快速的增长态势,行业信息化建设步伐的加快,推动了商用服务器市场需求的持续增长。相对于传统的HPC市场,商用服务器市场的容量要大得多。

  然而,从目前看来,我国商用领域的高端服务器市场还主要被基于传统封闭技术的RISC/UNIX服务器所占据。但是,从技术发展和市场趋势看来,以IA、Linux、Cluster等为代表的开放技术,将逐渐蚕食并取代传统封闭技术所占据的商用市场。IDC的数据显示,2003年基于IA架构的服务器在销量上已远远超过RISC服务器,而在销售额上也与RISC服务器持平,IA服务器正日益成为RISC架构服务器的强劲对手。

  目前,越来越多的商用用户正在转向基于标准和开放的架构平台,就连IBM、HP、SUN、SGI等过去采用传统封闭技术的公司,在其中、高端服务器领域也纷纷转向IA架构。而这也正是国产服务器厂商进入中高端商用领域的机会。

  联想很早就认识到,并一直关注商用服务器领域正在出现的这一变化。基于IA、Linux、Cluster等标准技术和开放架构,联想陆续推出了两个系列的商用机群服务器产品:2003年4月,联想推出了针对中端商用市场的深腾2600商用机群服务器,并取得了不俗的市场业绩;2004年3月,联想又推出了针对高端商用市场的深腾6800超级服务器,并在数据库服务、事务处理、网络信息服务等领域表现出色。

  浪潮则一直将高性能计算的突破口集中在高端商用领域。据浪潮北京公司技术总监胡雷均介绍,浪潮高性能计算的基本方向是基于“弹性部署”理念下的多元化策略。这种多元化首先体现在产品路线上。

  浪潮除了面向传统科研和工程计算用户的浪潮天梭TS10000机群,更有针对高端商用的天梭TS20000。现在,天梭TS20000正在逐渐得到用户的认可,像山东地税对原有的基于小型机上的税务系统进行升级时,就采用了天梭TS20000-DB系统。“对于用户而言,浪潮的多元化策略更具价值。因为用户实际最关心的不是产品性能,而是在HPC上的应用。”胡雷均强调。

  商用计算主要集中表现在信息服务领域。在这个领域,曙光的超级服务器已经覆盖了包括中小规模、超大规模的企业及应用领域,而且无论是同构平台还是异构平台,都可以实现。实现同构平台的典型案例是“世纪曙光工程”,这个大型的教育行业信息化工程,是由同构的曙光TC1700实现的。浙江出版总局的计算机系统,是实现异构平台的典型案例。这是一个由几十个节点组成的机群,实现了对不同机型、不同操作系统的计算系统的管理。

  

  软件推动应用





         联想深腾2600  

应用是推动高性能计算发展的原动力。在高性能商用计算市场,用户的业务系统越来越复杂。比如说,仅仅银行业内,银行综合业务系统、银行证券交易系统、信用卡业务系统、综合业务计算机网络系统,都有对高性能系统的需求。在这种情况下,用户已经不再仅仅关注计算能力,开始更加关心强大的计算能力是否能与其个性化需求相结合,真正满足其业务发展的需求。

应用的推广,离不开软件的发展,特别是自主国产软件的研发。庆幸的是,国家有关部门早就把它提到了工作日程。

据国家“863”高性能计算机及其核心软件专项总体组组长钱德沛教授介绍,国家“863项目”已成立了高性能计算评测中心,开发测试程序,结合应用寻找合理的测试应用方法。同时,国家已经启动共6亿元人民币的软件专项资金,用于数据库、操作系统及相关应用软件的研发。其中2 亿元做数据库,4亿元做操作系统、办公套件、嵌入式软件和应用软件等。这对我国高性能计算来说,将迎来一个山花烂漫的春天。

两则案例

技术及应用的发展,使得高性能计算机的应用领域不断拓展,日渐渗透到商用计算领域,用于事务处理、信息服务以及数据库服务等方面,如税务、邮政、社会保险、电子政务、银行、证券、电子商务、门户网站、游戏网站、网络中心、数据中心、流媒体中心、电信交换中心、教育城域网以及企业信息中心等。

下面,就介绍两则高性能商用计算的成功案例。

一、服务税务大集中

近年来,全国税务系统在进行大集中。从以前的情况看,税务部门大集中实施过程中,硬件平台的搭建基本上都是采用小型机方案。小型机属于专用设计架构,具有性能稳定的优势,但其投资高、后期维护成本高等因素限制了它的大范围快速推广。

山东省地方税务局在进行大集中时,就构想了机群解决方案。整个系统由多个处理节点、集群互连和共享存储设备组成,服务器节点采用smp(对称多处理器)技术,相互协作如同一个系统。计算节点采用高性能pc服务器,存储节点采用光纤通道磁盘阵列(可扩展到san),数据库采用oracle 9i企业版数据库,并选择oracle rac构筑一个集群系统。

为验证方案的可行性,山东地税前期专门对该方案进行了数据量压力、并发用户量、系统处理能力等方面的测试。测试选择了浪潮天梭ts20000高性能数据库服务器。测试结果表明,两节点浪潮天梭数据库集群的并发用户达到1200个,tpc-c的峰值达到24万;4节点集群的tpc-c指标达到54万,证明该方案可以满足一定规模的市级集中处理需要。

结合山东省在市级集中处理工程建设方面的经验,2个节点系统管理的纳税户数一般在8~10万户左右,4节点管理的户数一般在10~15万户,整套系统运行主要指标内存使用小于25%,cpu使用小于17%。按照此方案构建的市级集中处理平台,和小型机方案相比,初期硬件投资降低了1/2多,综合考虑后期的管理和维护成本,整体投资为小型机方案的1/3左右。

最终,山东地税选择了浪潮天梭ts20000-db作为大集中的首选,并尽快进行了实施(见图1)。山东地税在市级数据集中处理以后,根据市级集中的需要,对原来版本的征管软件也作了相应的调整和完善。据山东省地方税务局信息中心徐夫田介绍,基于集群方案的实施,使征管数据由区县局为单位的集中处理,改为市级集中处理,网络拓扑结构没有改变,但在应用模式上变得更加扁平化。

目前,山东地税新系统取消了各县市区的征管服务器,将全市所有征管数据集中到市局统一存储、处理、管理,收回了县市区局原有的数据库修改、管理权限,杜绝了征管数据的随意修改、删除,规范了基层执法行为。

同时,新系统还建立了“报表自动生成及发布系统”,后台系统每晚12时开始,自动统计汇总出当天税收数据,生成近千张各类报表,并发布到内部网站上。市局领导和各业务科室可以及时查询全市收入总体进度,以及每一个基层单位发生的每一笔业务,监控每个单位的征管质量指标,为正确决策提供了支持。

二、物流更顺畅

中储发展股份有限公司(简称“中储股份”)是在市场经济中应运而生的全国性大型物流企业。天津中储公司作为中储股份最主要的地区分公司之一,承担了天津港口的中转、储运的工作,并且业务量十分繁忙,非常需要专业化的信息化平台,以借助信息共享、业务信息流来提高效率。

一方面,作为公司信息化重中之中的财务业务信息化平台和管理软件,包括财务统计、核算、报帐、资金管理系统等,对于计算机硬件的可靠性、可扩展性的要求本来就非常苛刻。另一方面,天津中储公司希望对公司的各个财务报点进行财务统计分析汇总,而且还要同时联网位于北京的中储股份总公司,以保证24小时在线输出公司的财务状况。

从天津中储的应用来看,主要的应用有:oracle8i数据库,资金管理系统, oa办公自动化软件。天津中储希望能够利用已有的ibm和hp服务器,从而保护先前的投资。

经过比较,天津中储选择联想深腾2600商用机群整合现有设备。如图2所示,天津中储原有一台hp net server2000服务器和一台ibm eserver2000服务器,和联想两台r350服务器通过高可用软件,分别形成2个高可靠的ha系统。其中r350均作为主服务器,而hp net server2000和ibm eserver2000作为备份服务器。

具体应用的实施上,mis节点上运行tomcat和resin服务,通过nfs服务访问磁盘阵列;office节点作为tomcat和resin服务的备份节点;oracle节点运行oracle服务和nfs文件服务,直连磁盘阵列;database节点作为oracle服务和nfs文件服务的备份节点,直连磁盘阵列。

项目完成后,天津中储认为联想深腾2600从公司现有的资源出发,结合业务连续性对系统高可靠性的要求,提供了性价比非常高的集群架构服务器系统。并且,联想深腾2600集以太网、监控网、kvm网和存储网于一身,具有集中管理、实时监控、短信告警以及无线管理的优势,能够降低他们的管理时间和费用,减少了tco成本。



  图1  威海地税网络拓扑图



  图2 天津中储网络拓扑图

名词解释

tpc-h 

商业智能计算测试(tpc-h),是tcp的重要测试标准之一,主要是用来模拟真实商业的应用环境。与科学计算测试不同,商业智能计算测试(tpc-h)是对现实中商用计算需求的全面模拟。它包括模拟真实商业交易数据库的动态查询,以及作为决策支持与数据库应用系统的参考。

这种商业测试可以全方位评测系统的整体商业计算综合能力,对厂商的要求更高,同时也更具有普遍的商业实用意义,目前在银行信贷分析和信用卡分析、电信运营分析、税收分析、烟草行业决策分析中都有广泛的应用。

以银行银用卡分析为例,当银行对信用卡持卡人情况进行数据分析时,在此系统上进行数据的查询所需要的时间,是当前其它系统平均查询时间的一半。这就会对提高业务运作效率,降低运营成本具有双向倍增效应。

spec

spec(the standard performance evaluation corporation),是一个全球性的、权威的第三方应用性能测试组织,它旨在确立、修改以及认定一系列服务器应用性能评估的标准。spec服务器应用性能测试是一个全面衡量web应用中java企业应用服务器性能的基准测试。在这个基准测试中,系统模拟一个现代化企业的电子化业务工作,如客户订购查询、产品生产制造管理、供应商和服务提供商管理等,给系统以巨大的负载,以全面测试运行典型java业务应用的服务器性能水平。

目前,该标准得到了诸如bea、hp、oracle、sun、ibm、unisys等国际软硬件厂商的认可和关注。由于它体现了软、硬件平台的性能和成本指标,被金融、电信、证券等关键行业用户作为选择it系统一项权威的选型指标。