
| 出版日期:2004-03-22 总期号:1298 本年期号:19 |
|
容灾工程要系统分析
相晓明
北京华商达数据系统科技 有限公司总工程师 相晓明 容灾工程的系统分析主要包括业务系统的风险分析(Risk Analysis)、容灾系统对业务系统的影响分析(Business Impact Analysis)、容灾系统的投入和产出分析(Cost-Benefit Analysis)。 业务系统的风险分析 建立容灾工程的最终目的是,当灾难对业务数据造成破坏后,确保业务数据具有可恢复性,因此,建立容灾工程首先要分析本地区影响业务数据安全性的灾难有哪些种类。灾难可以分为自然灾难、社会灾难和人为灾难。 自然灾难包括火灾、水灾、地震等突发自然灾害造成的业务系统的灾难。不同地区自然灾害的发生有一定的统计概率,而且自然灾害的影响范围是有一定区域的,因此对自然灾害的风险分析相对比较容易。在实施容灾工程时,特别要注意容灾备份中心的选择,一般应建立在自然灾害较少的地方。在美国,一些州通过立法,规定了容灾备份中心可以选择的地区。 社会灾难包括区域性电力系统故障,以及爆炸或战争引起的定点破坏等灾难。国内外都存在社会不安定因素,因此人们要有足够的忧患意识。在灾难发生时,一些没有采取任何容灾措施的企业由于核心业务数据遭到破坏而最终破产,而一些采用了容灾措施的企业得以生存。建立了备用业务系统的企业业务能够在灾难后很快恢复。 人为灾难包括IT系统管理人员的误操作、来自网络的恶意攻击、计算机病毒造成的数据灾难。近几年,人为灾难更为突出,特别是计算机病毒造成的数据损失更是触目惊心。最近,迅速泛滥的“冲击波”(Worm Blaster)病毒,致使全球上百万台计算机中毒,部分网络服务器瘫痪,并给全球商业界造成了几十亿美元的直接损失。研究结果表明,下一代电脑病毒传播的速度将更快。一种名为Flash的病毒将在15秒钟之内感染所有的PC网络,而另一种名为Warhol的病毒将在15分钟之内传遍全球。采用后发制人策略的防计算机病毒系统难以完全保证数据的安全,因此有必要建立数据的备份机制。 对原系统的影响 数据复制操作的发起来自业务系统,不论是来自系统的计算层、网络层,还是存储层,都肯定会影响到业务系统的性能。对于那些要求高性能的业务系统或者已经是高负荷运行的业务系统,就必须分析建立容灾系统对业务系统性能的影响。不同容灾技术对业务系统的影响不同。比如,一个采用同步数据复制技术的容灾解决方案,如果容灾备份中心与业务中心的距离超过100公里,就需要考虑数据传输的时间延迟对业务系统IO性能造成的影响,距离越远,业务系统IO性能下降速度就越快。 容灾备份系统运行平稳后,需要对备份数据(数据库)的可用性进行检查。一些容灾解决方案采用的是主/备工作方式,正常情况下,备份中心的数据是不能够打开使用的,只有在业务系统工作中断或者切断容灾进程的情况下,才能够对备份数据(数据库)的可用性进行检查,因此,势必对业务系统的正常运行产生影响。 容灾系统包括传输数据网络,由于网络传输拥堵或者中断等原因,数据复制同样会造成业务系统性能的下降,甚至业务运行的中断。当等待传输的数据溢出数据复制发起端的缓冲区时,就有可能造成数据的丢失或者数据传输次序的混乱,从而破坏备份数据库的一致性,使得数据库不可恢复。 投入和产出分析(CBA) 众所周知,TCO和ROI是衡量容灾系统投入和回报的主要指标。CBA强调的则是投入与产出的分析,这是从业务系统发展的角度考虑容灾系统投资的合理性。 首先,要考虑准备建设的容灾系统与正在运行的业务系统的延续性,保护前期投资,而为了建立新容灾系统对原有业务系统进行大规模改造的情况应该尽量避免。其次,要考虑业务系统扩展对容灾系统的影响,特别是存储容量增加的影响和通信线路负荷的影响。由于单业务容灾系统使用概率很低,CBA分析的结果倾向于选择专业的数据容灾中心服务方式。
业务系统风险分析 下期预告 容灾系统的设计指标 设计容灾系统不能只看RTO和RPO两个指标,对于不同的业务系统和用户特殊的要求,其它一些指标也有可能成为选择容灾方案的主要因素。比如,某些地区为了防范一些特定自然灾害的风险,要求容灾备份中心与业务中心保持足够的距离,在这种情况下,容灾备份中心与业务中心的距离要求就成为容灾系统的重要指标。 |
|||||||||||||||||||||||||||