ccidnet????

出版日期:1998-10-19 总期号:339 本年期号:42

本期导读
信息综述
产品技术
行业应用
网络通信
市场研究
数据仓库 厚积薄发

史东

  现在有许多解决方案提供商在提供数据仓库产品,同时大量商业用户认识到信息社会中决策支持的重要性,但是数据仓库实施的最终结果却未必令人满意,这究竟是为什么呢?


  数据仓库是当今企业进行决策支持的重要手段,良好的数据仓库可以为企业的知识萃取提供有力武器。许多数据仓库领域的技术专家认为,数据仓库的优劣取决于两个方面的努力:设计者最初的设计思路和后期的企业信息储备。某些关键战略的不同选择将区分开两类数据仓库,其中一类是所有人都乐于使用的,因为它可以提供非常大量的有用信息以支持企业决策;另一类则无法完成使命,因此丧失了应该拥有的价值。

  究其原因,前一类数据仓库的设计思路以及应用层次与后一类有着本质区别,依靠良好的初期计划和完善的信息储备,前一类数据仓库获得了成功。因此,良好数据仓库的建设应该从小处着眼,厚积薄发。这包括两部分内涵:其一,从小范围或小数据容量应用开始;其二,为未来的大范围应用进行准备。


  良好的初期计划


  如果一个数据仓库在初期策划时,其成本投入被打了折扣,同时又被指望提供非常大范围的决策支持和知识、信息共享,它肯定无法完成使命。但是,如果数据仓库的设计者有相当的经验,同时他以严谨的态度完成数据确认的工作,并确定一个有限的初期目标,这个数据仓库将会逐渐得到用户的承认并将逐步充实、壮大起来。下面的观点正在被越来越多的数据仓库设计者所确认:从小的部分开始数据仓库的建设,才能使最终用户真正感受到数据仓库的好处。

  由小的地方开始并不意味着数据仓库将被建设的比较小或者总是去满足比较小的决策分析支持需求,这只是说,开始时数据仓库由大处着眼设计,由小处着眼建设和服务,小的成功将促进数据仓库的成长,进而是数据仓库能够为大的决策支持服务。

  数据仓库设计者应该在设计之初就考虑到这一由小到大的规模变化,为适应这一变化,设计者必须保证他所选择的数据仓库结构——包括系统软件结构、系统硬件结构、数据抽取规程和数据库格式等等——都能够支持未来在数据仓库扩大之后的繁重的数据调用以及决策支持任务。


  完善的信息储备


  信息储备是一个长期的过程,除了数据仓库提供商在工程最初所进行的初期储备工作外,用户本身必须坚持不懈地继续这一工作——这样才可能保证获得最初成功的数据仓库可以不断地壮大起来,为大量的信息提供和决策支持服务。这可能需要一个比较漫长的等待时间和这段时间内的努力工作。

  现在一些新的技术思路正在引起人们的注意,这些新思路可能缩短信息储备的过程,其中比较普遍被接受的是将企业数据从企业资源计划(erp)内迁移到数据仓库或较小的数据集市内的方案,在这个方案中元数据(metadata)和元数据容器(metadata repository)是两个被普遍讨论的话题,因为它们可能为这一迁移工程提供良好的思路。如果迁移成功,企业数据仓库的信息储备工作难度将大大降低。目前有人提倡一种数据储备手段,就是以创建信息模板(information model)的方式建立全球性数据仓库的元数据模板(metadata model),以这个模板为数据转换引擎,将可以用比较小的代价和比较快的时间建立起非常有效率的数据仓库。虽然该储备手段仍然未能获得一致赞同,但是元数据和repository引擎在业界的技术形象已经确立,越来越多的人开始认识到这二者的重要性。因此,大量基于元数据技术思路的应用软件正在被开发出来,它们将对不同商业领域的用户提供有效的数据整合工具,以实现有效率的知识萃取功能。对于用户来说,新数据储备方案的实施应该是一个不断实验和改进的过程,其最终目的是迅速和完善积累数据资源。


  关照用户


  笔者曾经与一些国内用户聊起数据仓库的建设问题,发现仍然有不少用户对数据仓库的建设实施抱有“一次实施,终生受益”的想法,他们希望通过一次购买行为完成企业的数据仓库建设。但是数据仓库的实施和应用不是购买行为那么简单,虽然目前有不少厂商在提供打包的数据仓库软件,但那些产品始终只是不完整的数据处理产品,离真正的数据仓库还有一段距离。因此,用户对于购买和建设之间的关系一定要有一个清楚的认识。

  此外,对于企业用户来说,选择数据仓库软件之前,一定要辨别软件提供商是否能够提供完善的解决方案,该方案必须有一个良好的初期计划并能够支持完善的数据储备。同时数据仓库提供商对最终用户进行培训的注重程度也是一个重要选择条件,数据仓库工程实施之后的培训和技术支持投入非常巨大,用户的投资必须包括这一部分价值,否则用户购买的将不是完整的商品。至于用户自己,应该对“厚积薄发”这一过程有一个明了的认识,以便与软件提供商进行完美的配合——请相信:任何软件工程的实施成功,都是用户和软件提供商双方协同努力的结果。