SEPATON公司Deltastor删除重复数据包括五个步骤。
在数据收集阶段,Deltastor通过比较新备份数据和先前的备份,使用内容已知数据库辨别前后两次备份之间可能的重复和相似数据。如果数据是已存在数据的修改版本,该数据就进入下一阶段(数据识别、数据比较)的处理流程,以确定数据发生的具体变化。如果进入的数据和已存在数据完全相同,那么就对数据副本进行校验。
在数据识别和比较阶段,软件以字节为单位分析数据收集阶段标志出的相似数据对象,用Delta差分算法确定备份组中的哪些数据是惟一的,哪些数据是重复的。
数据识别和比较的结果被传递给数据重组过程。在该过程中,数据被重新组装,放入临时的保留磁带中。新数据被保存,前一阶段被标出的重复数据被已存数据的指针替代。对备份软件而言,保留磁带和真正的磁带完全相同,只是存储在新磁带中的数据要远少于真正的磁带上存储的数据。从备份软件看来,数据是连续的并且也没有删除副本。SEPATON的软件可以根据嵌入在文件系统中的指针读取重复数据的惟一一份副本。
在实际删除所有的重复数据前,软件执行一次可选的检查,以保证数据完整。在本阶段,软件通过将保留磁带和原始数据进行比较,验证其结构和数据内容。
在空间回收阶段,Deltastor从文件系统中删除冗余的数据,释放先前被占用的磁盘空间以备他用。保留磁带和原始的、没有经过副本删除的磁带交换位置,然后软件智能地释放重复的区块,并将它们放回空闲空间池。
SEPATON公司的Deltastor将实施重复数据删除的位置放在主要数据传输路径之外,可以有效避免对设备性能的影响。(郭涛)