
| 出版日期:2004-12-20 总期号:1374 本年期号:95 |
|
近线存储:提升容量和速度
Network Appliance中国区技术部经理 岑广海 近线存储是分级存储(Tired Storage)概念的一部分。传统的二级存储结构在企业数据的持续增长及业务服务质量不断提高的环境下越来越不堪重负,分级存储概念适时提出,在原有的在线存储及离线存储之间引入第三层—近线存储。近线存储的初始实现模型是采用自动带库来达到数据的近线,但随着ATA盘单盘容量的价格连续几年急剧下降,自动带库模型的近线存储便被ATA盘的方式所替代。 ATA盘的近线存储和自动带库相比有以下的差别: 1.数据访问的有效性。ATA近线存储采用随机读写方式,而自动带库采用的是顺序读写的方式,自动带库每次读写都需要执行基本的几个步骤:倒带到头,进代定位,读取数据。因此,自动带库需要花费更长的时间才能读取数据。同时,自动带库没有办法修改数据,对数据的任何修改都会带来后续数据的连续修改。 2.数据访问的并发性。自动带库的数据访问受限于带机的个数,而且同批数据的访问也无法并发于多台带机,但ATA近线存储可以把数据条带分布在多个磁盘上并行访问,从而提高访问的速度。 3.数据访问的随时性。如果磁带离开了自动带库,数据就无法被随时访问,必须由人工加载后才能访问。 4.管理的复杂性。磁带的保管需要科学的方法及人工的干预。对磁带的分类需要一个好的方法,比如采用条码加字母数字的编号等;磁带需要定期被访问,以防数据因介质的老化而丢失。 5.数据的可靠性。采用磁盘的方式,数据可以采用多种检错、纠错的措施来保证数据存储的可靠性。比如,像NetApp的磁盘采用了先进的BCS介质级校验措施,同时还配备了独特的RAID DP磁盘级保护措施来防范同一RAID组任意两块盘任意时间发生故障。 ATA近线存储的发展朝着两个方向进行。第一,单盘容量在继续增加,单盘转速在不断提高。这是为了进一步降低单位容量的存储价格,并进一步提高近线存储数据访问的有效性。 第二,近线存储逐步脱离并行ATA(PATA),而改为采用串行ATA(SATA),并简化存储控制器到存储单元的布线复杂度,进一步提高了单位空间的容量。而且采用SATA也可以进一步提高链路的速度。 利用ATA磁盘形成的近线存储可以完善原有的存储服务,并衍生出许多种新的存储应用。其中主要有以下五种: 1.备份和恢复。目前流行的“磁盘-磁盘-磁带”的备份模式,可以有效提高备份的速度和效率。同时,由于在中间的近线存储上保存有数据的备份,在需要进行恢复时,可以避免单驱动器的性能限制,提高恢复的速度,减少对业务影响的时间。 2.参考文档库。对于大量的需要参考访问的文档资料,由于容量大、访问频度低,可以考虑用近线存储来作为存储的介质。这样既没有自动带库的不灵活性,又没有在线存储的昂贵投资。 3.信息归档理想的存储结构是把惰性数据转移到近线存储,既保证用户的随时访问,同时又经济实惠。比如像30天前的E-Mail,基本就很少被访问了,因此归档到近线存储是最好的选择。 4.提高业务延续性。采用近线存储除了备份恢复外,还可以实现非对称容灾系统。对于一些非关键性业务系统,可以采用近线存储来作为容灾存储系统,在灾难发生时,业务暂时切换到近线存储上,保证基本的业务运作。这样的实现方式是根据具体数据和业务的重要性来构造的,容灾系统和主存储系统是非对称的,从而达到经济科学地构建我们的容灾系统的目的。 5.法规遵从。自安然事件后,企业越来越关注对法规的遵从问题。传统的法规遵从采用的只读光盘的机制存在许多缺陷,而新型的近线存储技术为法规遵从带来了新的实现技术和新的应用拓展。 在SATA的应用当中,有几个需要考虑的问题。首先,由于SATA磁盘的“转速较慢、容量较大”的特点,在发生磁盘故障时,将比FC盘花费多好几倍的时间来进行数据的重构。传统的RAID技术,哪怕是RAID 0+1,也只能允许同一RAID组内发生一块磁盘故障,因此,近线存储在可靠性上需要更为先进的技术来保证。NetApp公司的近线存储系统NearStore R200在缺省的配置下就使用了先进的RAID DP技术,可以保证同一RAID组里任意两块磁盘任意时间发生故障,而数据完好无损,从而大大提高了近线存储系统的可靠性。 其次,在分级存储体系里,采用SATA磁盘的近线存储作为众多主存储的数据集中地,需要一个合适的架构来满足不同种类的结构化数据和非结构化数据可能采用的不同的存储模式,如文件或数据块等,并且需要能够提供和主存储一致的数据安全访问权限,保护数据的安全访问。 第三,在数据保护的实现范畴,存在两种类型的增量备份:文件增量和数据块增量。两种增量的区别在于增量的参考点不同,因而两种增量的备份所消耗的存储空间是不一样的。通常,传统的磁带备份采用的都是文件增量的备份方式,但SATA近线存储的推出,则不仅可以实现文件增量的备份,还可以实现数据块增量的备份。在目前流行的“磁盘-磁盘-磁带”的三级存储模型里,从第一级的在线存储到第二级近线存储,可以采用这两种不同的增量模型。采用文件增量的实现方法可以先用备份软件把主存储的文件增量备份到近线存储里。和直接备份到磁带相比,这种模型可以有效提高备份和恢复的速度,但对近线存储的空间消费较大,同时,并不能消除必须使用同一备份软件才能够恢复和访问备份数据的局限性。如果采用数据块增量备份,则可以把主存储的数据块增量直接复制到近线存储上,这样形成的备份影像可以直接被访问,并且所花费的空间最少。这样的备份实现模式,NetApp公司有支持从FAS主存储上到NearStore的SnapVault软件,和支持从其他第三方存储产品到NearStore的OSSV软件。 第四,法规遵从已经从最初的一次写入只读光盘,发展到后来的使用近线存储作为法规遵从的介质。目前,NetApp公司更进一步拓展了法规遵从的应用范围,实现了永久性和时效性法规遵从两种模式。永久性法规遵从保证了数据的一次写入,永久性多次读出(WORM);而时效性法规遵从则是数据的锁定保护是有时效性的,比如某些证据只需要保留三个月就可以删除。法规遵从和近线存储有着巨大的关联性,主要原因是永久性锁定数据在昂贵的主存储上将会非常的不经济、不科学,而把数据锁定在只读光盘里,在某些应用里也不如在近线存储上灵活。在法规遵从的实施当中,还存在着法规遵从的一致性问题。当数据从主存储向近线存储转移的这段时间里,有许多机会把数据进行篡改,还有对于非结构化的数据,可能会被忽略掉等,从而导致实际保存起来的数据是不全面、不一致的,甚至是不真实的。因此需要有技术手段保证从数据的创建开始就严格执行法规遵从,并一直延续到数据从昂贵的主存储迁移到经济的近线存储上。NetApp公司已经率先在其主存储FAS和近线存储产品之间提供了这样的解决方案LockVault。(E5) |
|||||||||||||||||||||||