
| 出版日期:2000-01-10 总期号:891 本年期号:03 |
|
数据库之智能决策
南懿庭、左春 决策支持系统(dss:decision support system)可以看成是一切支持决策产生和优化的方法、工具的统称。决策支持系统的目标是充分利用现有的数据资源作出更好的决策,在信息技术的帮助下,把握、分析和发现新机会,从数据中获取洞察力,及时有效地获得更具战略意义的决策。 在当今信息爆炸增长的社会,有效地利用数据资源作出更好的决策已是生存和发展的前提条件。近年来计算机和通讯技术的迅速发展为此提供了可能。 历史明鉴 决策支持系统自70年代提出以来已经得到了很大发展。它是在管理信息系统(mis)基础上发展起来的。 80年代初,国内外曾在决策支持系统的研究过程中提出了数据库、模型库和方法库三库的概念和方法,描述了一个决策支持系统的理想框架。当时,有许多专家学者对决策支持系统的理论、系统结构及建立的方法等作了论述和研究。企业界和应用部门也曾按照这些概念进行决策支持系统开发的尝试,但结果与人们的期望相去甚远。许多所谓的决策支持系统实际上是一个查询系统或报表系统,并不能给决策人员提供辅助决策的信息,而且大多数系统都只停留在演示阶段,并不实用,灵活性及可用性也不够。有人评价决策支持系统的发展历史基本上是失败的历史,这也许有些过激,但却十分中肯而坦率地指出在决策支持系统的发展中,理论研究多于系统建设,概念方法的探讨多于实际工具的研制。决策支持系统的开发常常处于方案设计和系统规划阶段,缺乏可操作、可实施的技术、方法和工具。 今天,我们认真地分析一下这些问题,发现有以下几个方面的原因: 1)缺乏丰富的数据资源 科学的决策必须以大量可靠的数据为基础,否则,决策就没有根据,就会成为主观的猜想。数据库数量少、库中的数据量小,没有充足的数据源支持决策支持系统。而且,决策支持系统是面向分析的,传统的关系数据库并不能充分满足决策支持系统的需要。正是由于决策支持系统数据库没有得到很好地实现,使分析模型和算法的设计没有坚实的数据基础,从而阻碍了决策支持系统模型库和方法库的发展。 2)网络技术的落后 数据库之间没有使用网络连接,因此,即使有了数据库,它们也只是信息上的孤岛,不能充分共享,很难获得相关的外部数据。 3)缺乏分析工具 有了数据就如同有了矿藏,而要从大量数据中获得决策所需的数据就如同挖掘矿藏一样,必须要有工具,否则我们只能望“矿”兴叹。 4)缺乏灵活性 早期的决策支持系统非常的“功能化”。此后又产生了诸如电子表格之类的软件产品,它们在一定层次上能满足广泛领域的要求。另一种发展是eis工具的出现。eis设计的系统一般只是为了适应某个执行机关或是部门的决策支持需求,而且还要受“功能化”的限制。 新发展的动力 技术的推动力永远来自于需求。在世界经济论坛会上,法国信息专家罗斯奈向与会的各国首脑和工商界领导人呼吁,要像节制午餐一样进行“信息节食”。开发先进的信息管理技术和研究有效的知识管理策略,已成为信息技术界的一大热点。 来自商业的驱动力包括:1)增加收入,降低成本,提高竞争力;2)管理当前复杂的商务环境并建立模型的要求;3)降低it成本并充分利用现有企业资源。 数据库技术的发展、硬件性能的提高、数据采集、网络的发展成为智能决策支持系统发展的新动力。 ●数据库技术的发展 数据库技术的进步推动着数据库应用领域的扩展和应用层次的提高;反过来,新的应用需求又促进了数据库技术的进一步发展。数据仓库、联机分析处理(olap)和数据挖掘就是随着数据库应用的深化,解决如何有效地将数据库中的大量数据变成有用信息。随着过去几年中数据仓库方面大量的市场活动,有关研究工作也活跃了起来。包括: ●数据仓库技术 数据仓库是利用计算机和数据库技术的最新进展。它能把整个企业的数据,无论其地理位置、格式和通信要求统统集成在一起,并能把当前使用的业务信息分离出来,保证关键任务的oltp应用的安全性和完整性,同时可以访问各种各样的数据库。它把各种数据库(源数据库)集成为一个统一的数据仓库(目标数据库),并且把各种数据转换成面向主题(subject-oriented)的格式,能从异构的数据源中定期抽取、转换和集成所需要的数据,便于最终用户访问并能从历史的角度进行分析,最后做出战略决策。 ●并行数据库技术 数据仓库中的数据量大,而且随着时间的延长,新的数据还会不断进入。数据仓库中的数据库通常是gb甚至tb级的,可谓是超大规模数据库(vldb)。而并行数据库技术是存储和管理vldb,并提供对vldb复杂查询处理的有效技术。 ●联机分析处理技术 联机分析处理将决策支持系统带入更高的层次。该分析处理技术从企业的数据集合中收集信息,并运用了数学运算和数据处理技术。一般地,它以vldb或数据仓库为基础对数据进行多维化和预综合分析,构建面向分析的多维数据模型,再使用多维分析方法从多个不同角度对多维数据进行分析、比较,找出它们之间的内在联系。联机分析处理使分析活动从方法驱动转向了数据驱动,分析方法和数据结构实现了分离。 ●数据挖掘技术 数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在其中的信息的一种新技术。目的是帮助决策者寻找数据间潜在的关联,发现被忽略的要素,而这些信息对预测趋势和决策行为也许是十分有用的。 数据挖掘技术涉及数据库、ai(人工智能)、机器学习和统计分析等多种技术。数据挖掘技术使决策支持系统跨入了一个新阶段。 ●硬件性能的提高 数据仓库的应用不同于传统数据库的联机事务处理应用。传统数据库的应用是操作型的,而数据仓库的应用是分析型的。数据仓库中的查询由于其复杂性,会经常使用多表的联接、累计、分类、排序等操作,这些大都要对整个表进行搜索。每次查询返回的数据量一般很大,所以需要高性能的并行处理能力,以便较快地获得分析结果,这通常需要较长时间。而且数据仓库中数据量的增长速度很快,因此系统的可扩展能力非常重要。功能日渐强大的桌面系统为图形化展示数据提供了基础。 ●数据采集 近年来商业条码的推广、企业和政府事务的管理以及数据采集工具的发展,提供了大规模的数据。企业在日常商务活动中收集了包括订货单、存货单、应付账、交易条款、客户情况等在内的大量数据资料。同时,企业也常常从外部资源中获得统计数据和邮件列表之类的数据。这些超大型数据库是一个巨大资源,正是隐藏在其中的有用信息孕育了联机分析处理和数据采掘技术和工具。 ●网络的发展 随着信息技术的高速发展,数据库应用的规模、范围和深度不断扩大,已经从点(单台机器)、线(局域网)发展到面(网络)、internet全球信息系统。基于国际互联网络的商业的一个关键优势,就是它能够收集大量关于客户浏览以及购买决策的数据信息。通过跟踪客户的购买行为以及从数据分析中得到的情报,公司可以提高决策以及确认目标市场的质量。数据挖掘有助于发现数据中隐含的模式,而数据虚拟化又使得公司能够更深、更直接地理解数据中的模式和趋势。internet商业网址必须有能力获取客户信息以及轻松地将这些信息转化为知识。 |
|||||||||||||||||