ccidnet????

出版日期:2005-02-21 总期号:648 本年期号:06

本期导读
新闻评论
眼  界
封面故事
调  查
案  例
管 理
行  业
采购与实施
产  业
ITSM化解四个难题

■ 联盈数码技术有限公司 孙震

  国家某部委网络中心面临的运维挑战

  网络中心是负责维护该部委的网络和系统环境的部门,需要为众多关系到国计民生的关键政务应用系统提供安全、稳定、可靠的运行环境。其维护管理工作涵盖了网络设备、服务器、线路、数据库、存储、安全等种类繁多、数量庞大、结构复杂的IT软硬件基础设施。这些基础设施来自于多年来大大小小的项目,资源信息分散、记录不完整,给运行维护工作带来了不便。

  除了高可用性和高性能服务要求的挑战外,对人员和流程的管理也是一个主要难题。目前网络中心的维护人员和管理人员人数较少,多数人员都是身兼数职,如何在有限的资源配置情况下提高工作效率,完成工作目标是需要考虑的实际问题。

  另外,网络中心面向的客户多数是机关内部的业务单位,传统的IT管理模式使他们在请求服务过程中习惯于“找熟人,找领导”解决问题,不能很好地遵循设定的IT服务流程,因此IT管理流程比较混乱无序。

  面对国家某部委网络中心的运维管理挑战,采用IT服务管理(ITSM)方法,不仅可以清晰地了解到这些结构复杂的IT软硬件基础设施的数量、相互关联关系,还可以在如何管理这些IT软硬件基础设施方面,提供标准的、高效的服务流程,从而提高网络中心的服务质量,使IT服务有效支持机关政务的开展,提高客户满意度。具体来说,重点解决了以下四个问题:

  

  提升IT监控能力

  

  对IT服务环境的监控,是IT服务管理的基础。为了保障服务的持续可用,系统维护人员必须及时获得IT服务环境的变化信息,以便在系统性能下降或故障发生时能够做出快速反应。

  在网络中心原有的监控系统中,系统环境虽然已经被置于监控之下,但大量监控事件的报送常常使系统维护人员无所适从,每天疲于应付大量的无用信息,监控效率很低。而且重大事件如关键设备出现系统故障,却没有快速通告的渠道,往往在客户发现问题后,才能够对故障进行处理,给服务质量的保证带来了很大的困难。

  根据对这些情况的分析,首先对原有监控系统进行了重新定制,在分析IT服务系统中各环节的重要性后,对监控事件定制了过滤策略和关联规则,取消了原有的“所有系统消息全部报送系统操作员”的策略,将系统事件消息进行充分过滤和有效关联,识别故障源头信息,在系统前台仅显示需要及时处理的少数重要消息。

  同时对这些消息分组,将它们提供给不同的系统维护人员和管理人员。对于重大故障事件,还可以利用多功能报警机(iMessager)以短信、E-mail、Windows Messager等多种方式在第一时间通知相关人员。

  深化监控系统为进一步的IT服务管理改进打下了良好的基础,在不断的知识积累和方法改进中,达到从被动响应到主动式管理的升华。

  

  重视突发事件管理

  

  对于网络中心来说,最需要的两个管理流程是突发事件(Incident Management)管理和配置管理(Configuration Management),但实现这两个流程并非易事,主要问题在于:

  ◆ 网络中心面对的客户多是机关内部用户,长期的工作习惯使他们在服务请求过程中习惯“找熟人、找领导”处理问题。

  ◆ 虽然在角色划分上定义了一线/二线服务工程师,由于人员、管理体制等各方面的限制,沿用了以前的管理模式,角色职责主要还是集中在服务提供的技术处理上,缺乏过程管理的角色,如事件经理、配置经理。

  ◆ 人员变动频繁,缺乏培训,使服务人员在流程的操作、记录过程中经常出现失误。

  针对这些问题,在提供流程设计的同时,提供一系列的辅助管理方法,来减少甚至消除这些问题对服务带来的负面影响。

  其中,实施难点主要还是在突发事件管理流程上,采用了以下方法来实现:

  首先建立服务台,向客户提供统一的服务接口,公示网络中心的服务目录和客户服务呼叫流程,对于重点客户进行服务呼叫的推广培训,

  其次,建立突发事件流程,流程主要面向故障处理、服务请求和信息咨询,流程设计中不仅考虑到服务事件的升级,还为多人协同工作时设计了相应的协作方法和过程。在实现主要服务流程外,还结合监控系统的消息通知,实现了服务流程的自动传递。

  对于一些受行政或业务影响不能进入相应服务流程的事件,只能由特殊人员进行处理。由接收人到服务台注册,同时为客户进行业务处理,事件经理对该事件的处理进行实时监控(直属领导),既保证了业务的快速有效处理,又保证了服务满足特定的质量要求(如涉密、紧急等)。

  

  统一资源管理

  

  配置管理的目标是为IT服务管理提供精确的系统基础结构信息。

  网络中心选用了业界使用较为成熟的IT服务管理工具HP OpenView ServiceDesk,建立了完整的配置管理数据库(CMDB),记录对象包括网络中心负责管辖的软硬件基础设施和机房环境设施(UPS、机柜)等,重点突出设备信息之间,以及与管理信息之间的关联性,这些管理信息包括组织信息、人员信息,以及设备位置信息等。

  通过建立集中的CMDB和加强配置项间的关联,在需要查询资源信息时,不用再像以前那样,需要查找分散的文件资料,如技术手册,系统设计文档等,只需通过统一的资源管理页面,就可对需要的信息进行关联查询。

  有了好的工具,还需要有一种好的制度来保证数据的准确性。为此,我们建立了配置管理流程,分配了配置管理职责,以流程和制度的方式保证了在操作过程中的授权、审计、跟踪、记录,以保持资产信息记录与实际环境的一致性。

  

  量化IT服务质量

  

  IT服务管理的持续改进和不断完善,必须建立在对历史数据进行全面综合的统计和分析之上。网络中心在经过多年运维管理和知识积累后,记录了大量宝贵的系统数据和管理数据,通过手工的方式进行统计分析费时费力,而且在动态增长的数据环境中,很难得到及时的分析结果,大量的数据也使今后的统计分析工作显得力不从心。

  而通过IT服务管理实现了数据的自动化统计和量化分析。其具体实现过程是:首先通过各种自动化监控工具把搜集到的监控信息,如对网络、主机、应用系统等的监控信息,汇总到集中监控平台上;然后在IT服务智能报表系统iReporter的基础上,结合该部委业务特点,订制出合适的报表模式;最后,定期对搜集到的数据进行统计分析。

  通过对系统信息的统计和分析,能够及时了解到指定时间段内IT服务系统环境的运行状况,存在问题及潜在问题,辅助用户对于服务环境的改造工作进行决策;另外,通过对服务管理信息的统计和分析,能够了解当前自身的服务能力,发现近阶段的服务质量趋势,同时对于个人服务数据(次数、处理质量等)的详细统计,能够提让部门领导准确了解到个人服务能力信息,进而可以通过培训、人员调配等方式,加强服务提供能力。