ccidnet????

出版日期:1997-10-27 总期号:681 本年期号:41

本期导读
综合要闻
网络通信
市场商情
国际文摘
技术专题
软件应用
迈向通用企业信息管理



  今天的数据库技术正在向两个方向加速起飞:一个是数据仓储和决策支持,另一个是对象关系型和支持外部新数据类型。每一个发展方向都向企业和他们的用户提出了新的问题和考验,与此同时,每一个发展方向也一定会向那些有足够力量努力前进的人们支付巨大的回报。

  许多有经验的技术人员和用户自然会提出这样的问题:一个数据库产品能否在两个技术发展方向上兼收并蓄?如果厂商和用户的精力过于集中在某一个发展方向上,他们会不会完全失去另一个方向?当一些有名望的数据库企业在两种方向的协同发展努力遇到障碍时,刚刚面世的ibm通用数据库(ibmudb)却让我们看到这两个发展方向完全可以汇聚在一个基本的目标上:在更宽、更深的用户数据段上不断扩展企业信息。



  企业信息管理,数据库技术的新热点

  数据库工业正在迅速移向对象关系型、通用服务器和扩展关系型系统,在这方面的一个典型产品就是刚刚面世的ibmdb2通用数据库。对于那些重视企业过程自动化、再规划和操作应用的用户而言,今天的数据库技术已经可以支持很多这样的工作顺利完成。在新型关系型数据库产品的基础上,包括蜚声远播的sap和peoplesoft在内的一些大型应用软件厂商通过帮助用户重新规划业务而发展壮大起来。很多有远见的企业和技术专家已经敏锐地发现了下一波信息技术应用大潮,这就是企业信息规划、部署和应用,已经进入ibm智囊团的janetperna对此评价道:“企业信息是一个很热、很热的成长中领域,预计在本世纪末将会发展成为300亿美元的业务。”

  在这位ibm核心智囊看来,300亿美元的企业信息市场中,硬件、软件和服务将三分天下,而在大约100亿美元的软件市场部分中,数据库软件将当仁不让地占据半壁江山──这还仅仅是被来自用户的企业信息应用大潮推动起来的那一部分,更大的市场潜力如同水面下的冰山般尚难以预测。

  olap、数据分析和数据提取与清除等仓库工具无疑会赢得数据库用户的垂青,但用户更大的精力将集中于可伸缩性数据库,换言之,数据库产品的伸缩性是实现企业信息应用产业化的关键内容。今天,企业中的白领阶层正在越来越多地把自己每天的所作所为与企业信息资源联系起来,他们与企业数据库信息系统或数据库服务器的关系越来越密切,一些企业管理者对企业信息的依赖性甚至已经到了离开与数据库相联的桌面pc或笔记本电脑就无所适从的地步。分析家预测,现在每天大约有400万知识型工作者通过internet和企业内部网访问数据,这一数字将在2000年增加到1000万。正是在这种背景下,在ibmdb2通用数据库的研究过程中,很大一部分开发资源被集中在可伸缩性技术上,希望通过一个产品跨越对称多处理器(smp)、簇和大规模并行处理系统(mpp),支持星型模式、复杂连接、索引和对优化器的改进,进而处理复杂查询和在线分析处理(olap),使用户能够非常迅速地浏览规模宏大的数据库。

  企业信息是数据库技术和软件市场的重要推动力量,但还不是唯一的推动力量,另一个重要的推力是内容管理和检索,特别是对非传统数据的管理和检索。今天80%的数据不是传统数字形态,这就是对象关系型和多媒体扩展器能力发挥作用的地方。对这个问题的一个解决方案是“数字图书馆”,它提供了存储、搜索和检索多媒体内容的能力,用户可以实现浏览图象和文档、使用存储压缩算法、用db2编制目录和检索多媒体数据等操作。与此同时,数字图书馆还具有丰富的展示能力,包含了web功能。数字图书馆的市场目标是新闻媒体、高等院校和政府。例如,ibm利用数字图书馆与好莱坞电影制片厂合作,实现了影片图书馆的数字化,比以往影片资料的管理不仅更加安全,而且便于快速搜索和查询;这种做法同样适用于音乐界,通过数字化人们可以更容易地找到那些年代久远、濒临失效的磁带,也可以随心所欲地进行回放和广播。



  数据挖掘与internet

  数据挖掘是今天很多人都在讨论的一个热点,事实上,除了挖掘数据之外,挖掘数字图书馆和非传统数据同样有着广阔的市场前景。现在假设你是一个客户支持代表,整天都在处理客户申诉,并把客户所说的话打成文本文件,某天你的一位主管突然要了解用户在抱怨什么,哪些用户抱怨哪一种产品,这时,你当然希望能够有一种工具可以把全部已经记录下来的申诉联系在一起,挖掘所有的文本文件,抽出关系,提出新发现。事实上,这样一种假设每天都在世界各地无休无止地发生着,从中我们可以看到数据挖掘工具的发展前景,传统数据以外的其他媒体类型的信息同样需要有效的挖掘工具,满足这种需求正是通用数据库的优势。

  “推”技术是随着internet普及衍生出来的一个时髦话题,这一技术使用户可以得到所选择的web站点向他们“广播”的信息。在这项最新的internet技术的帮助下,数据挖掘技术将会发挥更积极的作用,使信息搜寻和检索过程更加个性化、智能化。对于“推”与数据挖掘之间的关系,janetperna形象地描述为:“如果我可以‘挖掘’到有关你和你感兴趣的信息,那么我就可以把这些信息‘推’给你,这样你就可能找到相关的和感兴趣的东西。”

  现在,每一个企业都对留住现有用户并争取新用户的重要性有着深刻、一致的共识,从而使企业获得新用户的代价越来越昂贵。因此,企业经营者迫切需要找到新的途径来降低成本、维系现有用户、挖掘现有用户的采购潜力,同时以低成本的方式来争取新的用户。这就是今天的企业信息的部署范围正在以超乎想象的速度向整个web蔓延的原因,在企业信息与web的结合过程中蕴藏着巨大的市场能量,吸引着众多it企业———硬件厂商、软件厂商、系统集成商———都朝这一市场空间蜂拥而至。

  随着更多的在线交易的发生,我们的生活方式、工作方式和通讯方式都在发生着根本性的变化,这种变化就像当年电话带来的变化一样巨大。支撑电子商务的关键性基础是内容管理和传递,因此,电子商务为通用服务器和企业信息市场的发展提供了更成熟的机会,通用数据库技术的发展进程将在很大程度上影响电子商务的应用与普及,电子商务时代的数据库需要支持任何形式的数据,不管是企业数据、文档、图象、视频、声音,还是其它我们今天尚不能准确描述的新数据形态。

  db2是ibm电子商务平台net.commerce的支撑数据仓库,这个平台有一个客户是美国著名的在线营销企业llbean、llbean利用web向自己的客户展示每一件商品,客户利用llbean的在线目录购物,为了支持这个目录,数据库必须具有非常强大的可伸缩性。包括在线购物在内的电子商务具有非常巨大的潜力,但同时也要求整个系统必须非常可靠,如果在客户正兴致昂然地查阅在线目录时,突然出现web站点脱网,这个恼怒的客户很可能会转向另一家在线营销企业,为了避免这种情况发生,一个能够支持复杂数据类型的可伸缩平台至关重要。

  关系型数据库非常适合于目录信息,用户总是有数据要存储到文件中去,据估计目前世界上约75%的数据还处在高速文件系统中,由专门的服务器运行和传递这些数据。随着电子商务的出现,用户需要一种途径为这些信息编制目录、保护信息和向访问这些信息的人们收费,关系型数据库非常适合于处理这类事情。



  利用通用数据库实现高效率企业信息管理

  用户可以使用通用数据库处理混合数据类型和集成到基准服务器中的新基本组件,与此同时,通用数据库还具有可扩展性、web通用访问性和赋予用户选择从olap到oltp工作载荷自由度的能力,这些能力已经远远超出了常规意义上的对象关系能力──这也就是为什么ibm一直强调db2通用数据库不止是对象关系型数据库的原因。对象关系型是通用数据库的一个关键部分,可靠性、可用性和可伸缩性也是同样重要的基础。企业级用户的最终目标是建立企业信息解决能力和数据仓库,在实现这个最终目标的过程中,他们无疑需要一个数据库软件产品,同时他们不想为数据库是否适合他们的工作伤脑筋。对于数据库开发商而言,支持不止一种代码并不容易,通用数据库的最大优点之一是使每个人都能够努力解决同一个问题,每个人都把注意力集中在从smp到mpp的同样事情上。

  由于国内外计算机应用水平的差距,一些国内用户对建立企业信息解决能力的利益还缺乏直观认识。下面是由janetperna提供的一个真实故事,也许会给我们带来一些启发:

  在美国的某个大型跨国企业中,每个月都有难以计数的各种报告需要制作和传递,其中的一种报告每月要发出400份之多,就在工作人员对这种难以忍受的文牍主义深感厌倦之际,一个新来的从事企业信息重整的it专家提出了这样的建议:“好吧,这个月我们照样把东西发出去,但从下个月起,我们不再寄送这些报告了。”于是,在下个月到来之际,他们没有向外寄出报告,然后再下一个月,再下一个月仍然不寄。这时,it专家提出了新的问题:“没有人打电话要这份报告吗?”检查的结果是一共接到了三个电话,400个人中只有三个人打了电话!他们挨个询问这三个人怎么处理这种报告:第一个人是一个秘书,她在报告上打了三个孔,然后把报告放进活页夹中,放到架子上;第二个人说:“是的,我看报告,但我从来都没有真正看明白这个报告。我不知道它要告诉我什么,但我每个月都看”;最后,他们终于到了第三个人那里,这个人真的很在意这个报告!

  了解了企业员工对企业信息资源的需求是这样的令人诧异,这家企业下决心放弃早已轻车熟路的报告制度,着手建立基于ibmdb2数据库的企业信息服务器和数据挖掘系统。时至今日,他们已经成功地通过cobol提取部件把原先存放在ims中的数据迁移到mvs的db2上,在新的数据仓中,他们建立了3500万个用户记录。现在,这家企业在世界各地的每一名员工都可以通过智能决策服务器自动化查询和处理自己所需要的各种报告。假设某一个海外经理想用ibm的usage data report,然后屏幕上出现提问:你想查询谁?"在得到确切回答后,智能决策服务器就可以自动发出这个查询,查询被送到了mvs上的db2上,在那里这个查询以批处理模式加以执行。当查询结果返回时,会往这位经理的note界面上发送一封电子邮件进行提醒,或者送回一个电子表格。整个过程不仅高效流畅,面且充满了情趣。这里所说的智能决策服务器包括一系列企业分析法,从复杂查询、统计分析、在线分析处理一直到数据挖掘。

  在今后一段时间内,对象关系型数据库会显得 越来越重要,用户的兴趣也会越来越浓厚,internet的流行无疑将加快这一过程。现在,一些有远见的企业级用户才刚刚开始使用对象关系型数据库,这自然会让那些缺乏技术底蕴、喜欢赶时髦的数据库厂商为之晕眩,但在包括ibm在内的数据库技术领袖级企业看来,对象关系型并不是主流,通用数据库才是现在的主流。

  今天的通用数据库技术已经发展到了这样一个阶段:用户已经可以清楚地计算他们的投资回报。按照"技术采用周期"理论,现在正是市场推广上升的关键时期,企业的决策者们也许不在意企业信息解决方案的技术模型怎样在远程通信或其它行业中工作,甚至不在意技术模型本身,但他们格外关心同行的一举一动,他们非常想知到自己的竞争者们在怎样通过企业信息管理提高效益。在geoffrey moore关于软件营销的大作《跨越断层》(harpercollins,1995)中,moore把这一过程叫做"保龄球瓶效应"。这个概念是这样的:你需要瞄准球道上的1号瓶,如果你击中了这个球瓶,它就会击中帝边的另一个球瓶,而那个球瓶又会击中下一个瓶子,如此继续下去,你就会获得"龙卷风"效应,所有的瓶子都会应声倒下。在这种"龙卷风"效应中,新技术随之扩散开来。