
| 出版日期:2005-06-10 总期号:220 本年期号:11 |
|
应用新风向
“五一长假”在国内被视为年度的第一个关键点,企业往往在此开启新计划和策略的执行,市场自然而然表露出信息化应用的新热点:005年5月,软件产业最为活跃的因子来自于商业智能(Business Intelligence,BI)领域—IBM发布商业智能软件产品包DB2 DWE以及一系列面向行业的BI解决方案;以“数据之道,智胜千里”为主题的2005年Teradata数据仓库峰会暨 NCR Teradata第五届用户大会移师北京;2005中国国际商业智能大会召开;BO和神州数码在京共同拉开了Crystal Reports巡展的大幕……BI,真正走上了快车道。 市场需求驱动下,数据仓库技术日益表现出实时、动态的特点;企业信息管理自然一如既往地朝着智能化方向发展,数据仓库及BI必将随之渗透到各行业的信息化建设中。 数据仓库四字经 齐国涛 计算机技术发展了几十年,仍然没有摘掉“高新科技”的帽子,尤其是在一些专业性很强的领域。这就让信息技术和应用之间产生了难以跨越的鸿沟,数据仓库(Data Warehouse)是一个活生生的例子。追根溯源,数据仓库的产生已经有二十多年的时间了,但是直到现在许多人对其还是敬而远之。 信息系统应用环境的日渐成熟,BI开始在信息化建设中浮出水面。作为BI应用底层的有力支撑,数据仓库自然地受到了更多的关注。 数据仓库是一个面向主题的、集成的、主要用于决策支持的数据集合。利用这种技术可以动态将异构系统中的数据抽取并集成,在运用清洗、转换等处理手段之后加载到数据仓库中。通过一定周期性的数据刷新,数据仓库可以为用户提供统一的目的性更强的数据视图,为进一步的数据分析提供可能。这正是BI应用的开端。 有容乃大 企业信息化的进步,带来的是数据的不断增加。无论企业的业务操作系统还是用于改善企业内部流程的财务、人事以及后勤管理信息系统,都会产生大量的数据。NCR Teradata首席技术官宝立明表示,如今数据产生的速度甚至超过了摩尔定律,在过去两年内产生的数据比之前4万年所产生的数据还要多,而且这种增长趋势还在继续。 数据的增长是永恒的规律,到2004年为止,经过准确测算的最大数据仓库的容量已经超过了30TB。海量的数据除了给存储制造了巨大的挑战,更为人们如何利用这些数据提出了考验。 数据不等于信息,数据的产生不是随着人为意志的变化而改变的。没有经过处理的数据犹如一潭死水,并没有太大价值。只有经过有效的手段对数据进行重新识别和开发,才能产生信息,而且只有针对准确的数据采用正确的提取和处理方法,才能得到有效的信息。这正是数据仓库相对于传统数据库的优势。 在ERP、CRM、HRM、OA等传统的应用系统的建设过程中都会建造相对应的数据库。这些数据库的功效更多地集中在业务数据的存取方面,也就是数据的现在式状态。而数据仓库的建立,不仅仅可以实现大容量数据的加载和存储,更有利于解决传统数据库通常不能提供的分析能力,发掘历史数据中隐含的大量有价值的信息。也就是说,数据仓库更在意的是数据的过去式,并通过对过去式数据的分析为企业的将来决策提供支持。 数据仓库应用的开发通常是围绕主题展开的,根据企业主题的分析目标,集成相关的数据信息,集成的数据量越庞大,越全面,主题结论就会越客观,越准确。 动则思变 所谓“仓库”,在人们的印象中,除了具有“大”的特点外,还有一个重要特点就是“牢”。牢,通常意指静止的状态。早期的数据仓库和它的名字一样,只是数据的仓库,企业会定期进行数据的加载和存放,只有当企业需要进行长期决策时才会去数据仓库提取数据进行分析。造成这种局面的原因,一方面是因为数据仓库技术上的不成熟导致数据的加载或者提取与分析的工作异常繁琐;另一方面是因为用户企业对于及时性信息的获取的需求不那么强烈。 但是,现在激烈的市场竞争,要求企业对于市场的变化进行实时性的响应。这对数据仓库的存和取的周期提出了更高的要求,建设动态数据仓库顺理成章成为BI领域一种新的趋势。谈到数据仓库的发展,长期在国内从事于技术服务的Teradata中国区副总经理王闯舟介绍,数据仓库这几年的变化主要体现在性能方面,也就是应对企业实时需求的能力。 传统的数据仓库的数据采集主要集中在企业内部,具有很强的操作周期性,目的也是为了帮助管理层制定长期的决策。而现在,数据仓库必须实时采集企业内部、市场用户需求信息甚至竞争对手的信息,争分夺秒制定能够领先市场的决策。 基于数据仓库的信息分析逐渐转向基于事件的分析,不再需要专业人士的定期参与。据悉,由于数据模式趋向由事件驱动和软件代理程序处理,目前新建设的数据仓库系统都具有极佳的性能,回复时间已经可以以毫秒计量。 广以致远 数据仓库发展的另外一个趋势,就是它的服务对象在不断扩展。就在一年多以前,提起商业智能的概念,人们无一例外地会想到它是为企业管理者服务的。通过集成分散在企业内部应用系统的数据,为企业领导展现统一的浅显易读的信息视图,帮助他们完成企业战略的制定。现在,数据仓库访问数据的用户数量高速增长,这种增长主要源于商业智能应用中对机构和组织的虚拟化。 商业智能支持的决策者的范围由“象牙塔”中的企业管理高层逐渐扩展到业务执行层。每个业务部门的每个业务执行者都可以在数据仓库中得到自己需要的信息,辅助业务细节决策,从而从最底层快速响应市场的变化。“将在外,君命有所不受”,业务人员往往走在市场的最前线,他们的反应速度直接决定着企业的应变能力。在商业智能的支持下,他们会更加敏捷。通过获取最新鲜的数据,立即从数据仓库中透视商业事件,发掘数据中所有的商业关系。新一代数据仓库通过极强的可扩展性,支持数以百万的用户访问多达PB的数据。即使这种情况下,基本做到永不停机,消除了各种预期及突发的停机时间。 St Paul Travelers保险公司技术服务部副总裁Sullivan McConnell介绍,该公司主营业务包括财产险和人身意外伤害险,数据仓库的建设提供了成熟的定价机制,实现了客户细分,降低了企业的经营风险。通过对公司不同业务的数据整合,可以发现客户新的需求,及时制定价格策略,从而获得更多的市场收入,这个过程大大降低企业的运营成本。 但是,根据他的介绍,该公司仅仅在数据仓库和其它商业智能应用的建设、维护和管理的预算就达到了1400万美元。仅此投入,国内企业可能就已经差了很远,应用也就更需要加快步伐。 |
|||||||||||||||||||||||