
| 出版日期:1998-11-09 总期号:342 本年期号:45 |
|
数据仓库辅助决策
张起卫
行业竞争日益激烈,企业市场决策的正确与否直接关系到企业的生存命脉。数据仓库技术的产生为企业市场决策提供了新方法,数据库厂商摇旗呐喊,用户也兴致盎然。联机分析处理(olap)确实在市场竞争中为企业提供了科学决策的依据,但用户也应冷静地视本身的需求情况而定,不要盲目跟潮。 数据仓库是什么 以往的数据库是一种基础系统,严格说应该叫数据库管理信息系统。数据仓库只是它上面的一种应用系统,还有其它应用,如民航订票系统、银行atm系统以及证券、期货交易系统等业务系统就属于oltp(on-line transaction processing)联机事物处理系统。联机事物处理系统和联机分析处理系统olap(on-line analytical processing)无论是从使用方法和作用上来说都是相反的,前者是要尽快地把数据存进数据库里,后者是从数据库中提取数据,经过加工转换成规律信息供管理人员做分析用,而对速度要求不是很高。以前和现在的大部分数据库应用属于oltp,而数据仓库应用属于olap联机分析处理系统,它的基础是数据库。 简而言之,所谓数据仓库就是一个大的数据库,其中存储了从企业所有业务数据库中获取的综合数据。其中关键的是“综合”二字,因为现在信息技术将取代数据处理而成为企业计算的重点。在今后的10年中,作为经济和技术管理者必须重视信息的策略性价值,所面对的问题不是简单地处理数据而是如何使用数据。 数据仓库的特点是:数据量很大,对性能要求很高,能满足企业中各个层次人员的要求。数据仓库既可以是一个简单的查询,也可以是复杂的分析、预测,除了有管理功能外,还提供各种工具,帮助人们实现数据的提取、加工。也就是把业务数据转变成有用的决策信息,不仅仅是汇总。举例来说,某商家本月销售额为100万元,那么这100万元的商品分类是什么,购买的顾客层次如何,属于哪些行业、哪些地区等等。这些属性信息很重要,可以指导商家的销售发展策略。 数据仓库的概念在国外也是比较新的,在国内更是如此。国内的数据仓库应用规模较小,一般是对企业中某一个或一类部门的,数据量也在100gb以下,实际上,它应该称为“数据市场(data market)”,而不是数据仓库(data house)。数据仓库应该是对整个企业的,数据量在tb(1000gb)级别。所以,国内的数据仓库应用还处于刚起步或初步发展阶段。原因是人们对数据仓库的认识还不足,从技术上也是在逐步成熟阶段。 呼唤数据仓库 近十年来,数据仓库的概念逐渐兴起,它利用大量高质量的数据源构建的体系对公司提供决策支持。自那时开始,数据仓库的地位变得越发重要和日益普及。近年来,决策者们越来越意识到他们的那些宝贵的数据资源对其经营策略是何等的重要。而且他们发现对数据的随时访问以及正确理解其含义将为其业务及决策带来巨大的好处。正确理解这些数据的关键在于将其转化为信息,这些信息将有助于公司的管理层对其业务有更深刻的了解并制定出更有效的商业决策。它将为公司带来新的机会,诸如开拓新的市场,提高公司的运作效率和效益,提高公司对市场变化的反应速度,加快库存的周转率以及增强管理层在进行决策时的信心。 越来越多的研究表明,采用数据仓库所带来的好处是实质性的和可度量的。idc于1997年曾进行了一项研究,在调查了62家各种规模的、采用了数据仓库的公司之后,得出的结果表明他们的平均roi超过400%,而一些采用了较小型的部门级数据仓库的公司的平均roi甚至超过了600%。这些实实在在的数字引起了全球的幸福500强(fortune 500)公司管理层的注目。 新技术的发展动力一是战争,和平时代就是市场竞争。企业要想生存、要想在竞争中发展,必须发展新技术。如果是不用费力就能立足,谁还去花钱搞新技术?所以在无竞争的市场经济里,不需要数据库,更不需要数据仓库。但在市场经济中,不发展就意味着灭亡,企业该做什么很清楚。现在在国内往往是小一些的银行、偏一些的保险公司对数据仓库的投资很热衷,越是这些自负盈亏的企业,越是要上数据库、数据仓库、网上银行等等。企业的市场经济成分越大,就越是会在数据仓库上有大的发展。 厂商亮相 oracle公司技术顾问赵挥: oracle公司一直在致力于数据仓库应用的发展,从oracle 7、oracle 8到oracle 8i,在很多方面都对数据仓库做了优化,有很多数据仓库的选项供用户使用,来帮助用户建数据模型,对查询做优化,采用特殊的技术做索引等。在国外应用基于oracle数据库的数据仓库例子很多,oracle公司也针对数据仓库应用成立了一些咨询顾问部门,为用户的需求服务。在国内有必要上数据仓库的企业本来就不多,其中真正用上或用好数据仓库的就更少了。但随着国家整体信息化建设的发展,应用数据仓库是个大趋势。因为如果不这样,国内企业就无法和国际大公司竞争。 oracle承认,它的市场开拓工作做得不是很好,也就是它的产品技术水平要比其知名度高。也许是因为oracle认为它的销售是面向高端用户的,不必大肆宣传吧。 informix公司技术咨询部经理郑晓军: informix认为它能够提供一个全面的数据仓库解决方案,以满足不同公司的各种需要。为了实现这个全面的解决方案,在数据仓库体系中需要许多组件和功能。但它又认为目前还没有哪家厂商能够提供完整的、满足这些组件的集成化产品。这意味经常需要对购买的产品进行定制和系统集成。由于每个用户的应用系统都是不同的,这也是为什么informix选择了将其数据库产品与其它主要的数据仓库厂商的产品相结合的市场战略。 informix enterprise consulting services(ecs)组织拥有一批专门从事数据仓库研究的技术人员,这些训练有素的专家能够提供宝贵的指导和服务,以帮助用户设计并实施一个定制的数据仓库环境。还有前端解决方案也很重要,因为用户是不会用数据库语言去编程再查询的,需要厂家提供一种工具去处理数据,最后得到自己想要的结果。informix公司在很多方面都有相应的产品,比如“informix决策前端解决方案套件”。 ibm市场部: 早在90年代初期,ibm就投入大量资源开始了数据仓库的研究,并启动了star-burst(星球爆炸)大型科研项目,该项目主要就是为了攻克数据仓库领域的一些技术难题,例如优化星型连接(star-join),实现多维分析。基于对数据仓库结构的深刻理解和多年经验,ibm设计了自己的数据仓库结构,作为一个开发式结构,它方便了用户的产品选择、实施和今后的扩展。为了帮助用户快速实施,ibm提供可靠的咨询服务,这些服务也可从广泛的第三方获得,因此,在此架构下,ibm提供给用户的是一个完整的、灵活的、开放的解决方案。 百达灵电脑科技公司技术系统经理吴琛: 用户对数据仓库的理解程度不一样,很多人的想法和真正的数据仓库概念有差异。对企业来讲,往往是业务管理层的人员提出数据仓库的需求。百达灵认为:用户是数据仓库应用的主体,具体需求应由用户提出,但用户可能不清楚数据仓库的全部概念,需要社会各方来宣传。百达灵的市场策略是扎实地做好每一个用户,而不是遍地开花。 数据仓库今后的竞争会越来越激烈,用户对数据仓库的需求也更高。数据库厂商也逐渐由数据库产品的提供商变为应用解决方案的提供商。中国的信息化程度并不高,数据库的市场还有潜力,但随着全球数据库的发展,数据仓库应用也会很快发展起来的,但还有很长的路要走。 市场需求
从根本上讲,数据仓库是根据市场需求提出的,比如时常变化给企业带来的竞争压力。企业需要经常了解市场、了解用户、了解企业自身情况,所谓知己知彼,百战不殆。正确的决策是企业提高竞争力的重要方面,所以数据仓库产生的市场推动力是企业对科学决策需求的增加和渴望。 现在国内数据仓库的应用还处于初级阶段,但不一定是坏事,也就是说,数据仓库应用的到来迟一些,与国与民会更有利些。因为国外数据仓库应用发展很快是由于它们的oltp系统应用很广,市场也已接近饱和,无论从应用需求还是用户来说,都到了改变的时刻。而中国的oltp应用还远远不够,数据仓库应用最大的行业是金融和保险,和国外无法相比,使用时间也短。所以只有oltp大发展后,才有数据仓库飞跃的可能。现在还应该多做一些数据库的建设、普及工作,为今后数据仓库的发展作准备。 科学决策要求决策者必须了解多方情况,比如企业要决定下一年的市场销售策略,是降价还是保持不变,对外部需要知道同行的价格水平,对内部要了解生产成本、人员的情况,要参考过去多年的数据等。只有对这些因素进行综合考虑后才能作出比较科学的、合理的决策,实际上是对大量信息的归纳总结,从中提取有规律性的信息来指导企业行为。数据仓库为了适应这种需求而产生,也就是决策要建立在大量的广泛的历史数据及外部数据上,并考虑到各种影响因素,这样的决策才是科学可靠的。所以数据仓库包含的数据量极大,比如从纵向可能包含企业过去十几年的各类数据,从横向来说可能有世界各地同行的多方面信息及各类用户信息,数据仓库把它们统一有机地放在特定的数据库里。 服务于决策 当用户的数据积累到一定数量时,这些数据的某些潜在联系、分类、推导结果和待发现价值隐藏在其中,我们可以使用数据发掘工具帮助发现这些有价值的数据。数据仓库可以帮助企业选取以前未知的、有效地、可行的业务知识,例如客户购买行为、隐藏的关系和新的趋势,数据来源可以是大型数据库、企业内部或internet上的文本数据源,企业可以应用这些信息进行更好、更准确的决策,获得竞争优势。 数据仓库盛行的另一个原因是实际应用的需要,以往的数据库系统并没有真正给企业带来效益,也不能对企业运作产生大的影响,所面向的只是企业的具体操作人员。而企业的中高层领导没有相应的系统,因此象联机分析处理系统和决策支持系统就很受企业决策者欢迎。 有个数据仓库辅助决策的例子,国外某零售企业通过数据仓库分析发现,它的啤酒和尿布的销售量呈线性关系。当时不知道是什么原因,但还是把二者的货柜搬到一起,并适当提价,结果二者销量都大增。后来通过细致调查才明白,当地的有婴儿的家庭都是父亲出来买尿布,而这些父亲都顺便买些啤酒喝。 当然,建立数据仓库也有风险。因为可能数据量不足、预测不准或挖掘不到有用的规律等等,不是数据仓库建好就能见效,包治百病。要想用好数据仓库,需要有相应的专家参与,切合实际地为企业设计一套数据模型,还要不断地有新的内容加入进行完善,数据仓库才能真正为科学决策发挥其作用。 一个企业对数据的依赖性是不同的,一般人和期货经纪人对数据的看法不同,对数据分析的结果的感觉自然不一样。厂商不仅只是卖数据仓库软件给用户,还应针对行业做好咨询、服务工作,双方合作,建立相应的体系模型和数据库产品上的应用分析系统,这部分服务应收费。总之,数据仓库的效益不在于计算机快慢、数据多少,而在于衍生出的分析结果对用户有没有作用。 用户看数据仓库 深圳招商银行市场部经理王善越: 对于银行来说,数据仓库应用主要是客户服务系统,再有贷款的分析和预测系统,这些都是银行的主要利润来源,当然也是银行最关心的问题。在国外,如果有信用卡,这个人的消费项目都记录在银行的数据库中,他会定期收到他喜欢的商品目录,这就是所谓“定向服务”。招商银行之所以发展很快,就是由于使用“一卡通”,集消费、储蓄、通讯缴费、证券保证金等各种功能于一卡,这样就可以把客户的各种金融财政信息加以分析,了解客户消费趋势,引导客户消费。还可以让客户了解自己的财政收支情况,帮助客户理财,作到“足不出户、理财购物”。银行对信贷的分析预测更加急迫,招商银行投资200多万美元建设数据仓库系统。由于数据库集中在中心银行,相对建库要容易些,对数据处理结果的可靠性也高。选型原则当然是性能价格比为先,再看数据仓库软件能否满足今后的要求,可维护性、稳定性、可靠性是否高。遇到的困难是人才不足,招商银行花了大量时间和财力培养。再有就是招商银行的领导非常重视,对数据仓库的建设起了决定性的作用。而且,数据仓库就是为领导层服务的,有很好的投资回报率。 中国国际航空公司计划处工程师陈秉义: 我们计划处的职责是为公司领导决策提供有效的信息和帮助,从生产上说是负责航班计划和航线网络的规划。在生产任务完成后,我们要负责收集所有的生产信息进行统计汇总和分析,形成分析报表并向民航局汇报。由于工作性质的特殊,自然产生了对数据仓库的需求。 中国国际航空公司在1996年开始着手做数据仓库的建设工作,在现有数据的基础上,想要随意生成各种统计报表,航班周转量、客货数量、分布情况等。现在新的联机分析系统为我们实现自己的目标提供了可能性。我们对分析要求速度要快、查询方法要灵活、对以后新产品的兼容性要好。对于大量的航班原始数据,它的深层含义和意义以前是无法了解的,现在应用olap系统,利用我们行业特定的规范和公式,就可以得到分析所需的结果。另外以前无法或很难做与过去和同行的对比现在也可以做了。 应用数据仓库系统对企业各部门所有的数据进行准确分析,相应的决策也就准确,带来的经济效益也十分可观。希望将来的分析数据模型更直接些,比如直接建议某航线的机型如何,航班频率多少等。另外我们觉得现在的数据仓库产品中数学分析模型方面差一些,希望能加强厂商和用户间专家的合作,共同把数学分析模型建好,使数据仓库更好地为用户服务。 麦当劳加拿大公司战略与设计划经理oswald edwards说:“我们从在可视化数据仓库的投资中获得了巨额回报,它将使我们访问到一些信息,帮助我们实质性地增加了饭店的销量,减少了运转费用。” |
|||||||||||||||