
| 出版日期:2002-03-04 总期号:1097 本年期号:14 |
|
数据仓库是买不来的
访NCR数据仓库事业部研究开发部副总裁兼总经理周俊凌 曹术华 NCR在数据仓库领域处于领先地位。全球50家最大的银行中有一半以上采用了NCR Teradata数据仓库解决方案。记者特地请周总谈谈有关数据仓库的技术及如何建立一个成功的数据仓库等有关问题。 建立是一个过程 业界公认的数据仓库之父W.H.Inmon将数据仓库定义为“数据仓库是面向主题的、集成的、随时间而变的的数据集合,用以支持管理中的决策制定过程”。 虽然数据仓库对企业来说很重要,但任何企业不可能买到一个数据仓库。周俊凌强调说,数据仓库是没有现成的。它不是花钱就可购买到的成品,而是企业的一个日积月累的建立过程。建设数据仓库是一个不断完善、不断学习的长远的过程。数据仓库技术只是帮助企业建立数据仓库的一个工具。 建设的数据仓库首先必须对企业有用。成功的数据仓库是以循序渐进的方式来满足企业的需求的。周俊凌认为,建设一个数据仓库一般需要经历以下五个阶段:
一是报告发生了什么。最初的数据仓库主要用于企业内部某一部门的报表。数据仓库把企业内不同来源的信息集成到一个单一的仓库中,就可以为企业跨部门的决策提供参考。 二是分析这件事为什么发生。需要更多的数据进行各种角度的分析,而且这种随机分析是在交互环境中反复提出并不断优化问题的操作。 三是预测将要发生什么。提供数据采集工具,以便利用历史数据创建预测模型。企业了解将要发生的动向意味着更为积极地实施企业战略。 四是应用知识去操作某事发生。比如,在货物配送过程中,统筹安排货运车辆和运输路线,就需要进行复杂的决策。 五是实时事件驱动。在此阶段,越来越多的决策由事件触发,自动发生。基于事件驱动的营销可以为企业带来许多新的商机。 规模不是全部 当人们谈到数据仓库时,就会谈到规模问题。周俊凌认为,数据仓库的规模并不是唯一最主要的因素。 比如一个工厂有4万人同时输入数据或同时处理这些数据,这都不是最重要的,这些都是OLTP系统所做的事。数据仓库技术在于将各种数据从事务处理环境中提取出来,进行重新组织,并分析和解决问题。Teradata数据仓库专注于大量数据分析应用和综合决策,并不是为OLTP系统建立的数据库。事实上,NCR Teradata技术可以用来建立从小的数据仓库到TB级的数据仓库。 数据才是基础 数据仓库侧重于存储和管理面向决策主题的数据,它将大量用于事务处理的数据进行清理、抽取和转换,并按决策主题的需要进行重新组织,并加以综合分析利用,从中找出对企业发展有用的信息,为企业提供决策支持。 要实现数据仓库的决策功能,首先要清洗数据。来自不同部门、不同数据源的信息必须保证准确,而且要随时更新。也就是说,为了使数据仓库的决策功能能够服务于企业的业务需求,就必须连续不断地获取数据,并将其补充到数据仓库中去。 谨防数据集市陷阱 由于企业的组织结构和各部门的预算政策等原因,许多企业建立了一些分散的数据集市,以解决企业的单个业务问题。各个数据集市之间相互独立,不能给决策者一个单一的信息视图。企业在维护及同步更新多个数据重复的系统上将花费大量精力。 针对这个问题,NCR最近推出了数据集市整合 (Data Mart Consolidation) 方案,目标在于协助企业将各部门的数据集市)合并为单一的整合性系统,使企业不但拥有更完整的业务现况知识,更能节省数百万美元的成本。 |
|||||||||||||||||||||