ccidnet????

出版日期:2003-03-10 总期号:1196 本年期号:15

本期导读
要闻综合
中国信息化
网络与通信
软件与服务
产品与应用
渠道与市场
东北专刊
华东专刊
华南专刊
西北专刊
西南专刊
管理生物海量数据

朱新亚

  存储管理对于很多行业都是一件非常重要的事情,尤其是生物技术企业面临的挑战更为苛刻。

  通常这些企业的研究和诊断设备会产生海量的数据,而且,这些数据甚至需要保管35年以上。

  据专家估计,在生物制药行业范围内,企业必须应对每6到12个月就会翻倍的原始数据,而这些数据很多从不改变。大部分生物技术研究和开发试验生成的实验结果,一旦产生就被简单地保存在某处的文件之中。而在医药临床测试中收集的包括X光片、病史和患者对药物的反应等数据,被一次收集之后可能再不会发生变化。所有这些数据通常需要被保存10年以上,以用作FDA发布新药提交计划书的一部分。这样长时间保存数据的需求是对存储管理的一项挑战。

  对于生物技术企业的数据到底有百分之几不会发生改变,目前还没有专门的研究结果,通常这种数据被称作“固定内容”。但总的来讲,大约75%的新的数字数据是所谓“固定内容”。对于这些固定内容的长期保存,磁带和光存储介质存在很多问题,因为数据存储介质的格式在不断变化,而每当格式发生变化时就会碰到数据移动的大问题。相对来说,在硬盘上存储数据会容易一些,因为移动只是一个小问题。

  一些存储设备供应商近来开始开发能解决这些问题的产品。

  去年12月,IBM的存储系统部门提出了IBM Total Storage。这一系统被专门设计用于共享、管理和保存像核磁共振图像、心电图和其他数字图像等这样的临床患者信息。该产品包括存储硬件、Tivoli 存储管理软件,以及管理由网络附加存储和存储域网络设备向磁带库移动的数据的分层管理软件。而一些第三方文件管理软件供应商已经建立起与EMC的Centera存储系统的联系,简化了数据回溯的途径。

  对于很多公司,由于存在存储管理的问题,他们不得不重新考虑自己的计算和存储基础设备。例如,Celera Genomics和Applied Biosystems公司在去年将他们存储系统进行了迁移,替换为EMC的Centera系统和IBM的eServer。对于他们来说,在这次改变中,网络获得的处理能力增长很小,总处理能力由每秒钟1.7万亿浮点运算增至2万亿,但是3个EMC存储系统取代了原来20个存储设备。这一变化被看作是跟上数据存储要求并控制管理成本的一个进化过程的延续。公司的目的是提供更高的数据吞吐率可靠性。向新的存储技术转化帮助他们实现了这个目标。向新的技术转化同时带来的另一个好处是,新系统提供的大容量减少了需要管理的独立存储设备的数量。

  作为企业需求进化趋势的一个结果,为了应对长期存储和规章柔性的组合,生物技术企业开始寻找更为聪明的存储系统和存储网络。例如海量管理和存储虚拟等高级功能,可被应用到存储系统的基本结构之中。对于存储网络的客户而言,首先他们评价存储应用的需求,然后才会考虑选用哪个网络。

  达拉斯的一家向咨询医生提供诊断影像测试的Quantum诊断影像公司是一个典型的例子。该公司最近选用了由Merge eFilm开发的一个数字影像工作流程应用软件PACSbuilder。Merge eFilm将它的应用软件与EMC的Centera存储系统捆绑在一起。影像应用软件很好地配合了EMC Centera的管理固定内容数据并长期存储的能力。这个捆绑组合减少了很多像搞清楚文件的特定存储位置这样一些平常的管理任务。

  当系统存储一幅图像时,Centera给它一个独立的标识,应用软件只需通过这个标识就可以追溯到这幅图像。这意味着没有必要再弄清楚一幅图像到底被存储在哪个驱动器、目录或磁盘存储模块下。这个新系统的好处是,它可以使放射专家和医生通过一个Web浏览器就可以更简便地获取医学图像。系统在保证工作效率的时候也保证了能够提供更好的患者护理,因为EMC和eFilm的这个组合使快速将图像传给医生成为可能。

  存储系统和产生并访问数据的应用程序之间的无缝连接是关键。对于生物技术企业来说,他们现在所处理的数据与10年前的数据有着本质的区别。由于生物技术中使用大量的实验技术,企业需要来自应用程序供应商的帮助,来对这种全新的数据类型做出更多智能化的研究。